Initial vault setup
This commit is contained in:
@@ -0,0 +1,37 @@
|
||||
---
|
||||
title: Changements Modèles Open Weights
|
||||
created: 2026-06-06
|
||||
updated: 2026-06-06
|
||||
type: query
|
||||
tags: [IA, timeline, open-source]
|
||||
confidence: high
|
||||
contested: false
|
||||
sources: [synthesized]
|
||||
---
|
||||
# 📅 Changements Importants dans les Modèles Open Weights
|
||||
|
||||
Veille sur les évolutions majeures des modèles publiés en open-weights.
|
||||
|
||||
## Types de Changements Importants
|
||||
- 🔄 **Architecture** : passage d'un Transformer classique à un MoE, par exemple.
|
||||
- 📏 **Taille** : nouvelle échelle de paramètres.
|
||||
- 📚 **Contexte** : augmentation de la fenêtre de tokens (ex: 8k $\rightarrow$ 128k).
|
||||
- 🎯 **Spécialisation** : modèle fine-tuné pour le code, le multilingue, la médecine, etc.
|
||||
- ⚖️ **Licence** : changement de licence (cas de Llama Community License).
|
||||
|
||||
## Modèles Phares à Surveiller
|
||||
- **[[llama-3-1]]** (Meta) : évolution vers Llama 4 attendue.
|
||||
- **[[mistral]]** (Mistral AI) : nouveaux modèles "Large" et "NeMo".
|
||||
- **[[phi-3-5]]** (Microsoft) : série "Mini" et "MoE".
|
||||
- **Qwen (Alibaba)** : excellente série pour le code.
|
||||
- **DeepSeek** : modèles de raisonnement (R1) très performants.
|
||||
|
||||
## Impacts à Mesurer
|
||||
- **Performance** : gains sur les benchmarks (MMLU, HumanEval, GSM8K).
|
||||
- **Coût** : taille du modèle $\times$ tokens/seconde.
|
||||
- **Compatibilité** : Ollama, llama.cpp, exllamav2, vLLM.
|
||||
- **Quantification** : facilité à quantifier sans perte majeure.
|
||||
|
||||
## Liens
|
||||
- [[llama-3-1]], [[mistral]], [[phi-3-5]]
|
||||
- [[quantification-llm]]
|
||||
Reference in New Issue
Block a user