wiki: 2026-06-12_1926

2026-06-12 19:26:55 +02:00
parent 250bc8bef6
commit e7b0b6c1be
30 changed files with 1710 additions and 3 deletions
@@ -0,0 +1,54 @@
+---
+title: Mistral Large 3
+created: 2026-06-11
+updated: 2026-06-11
+type: entity
+tags: [model, architecture, open-source]
+sources: [web research]
+confidence: high
+contested: false
+---
+# 🌀 Mistral Large 3
+
+Modèle phare de Mistral AI, successeur de [[mistral]] (Mistral Large 2). Premier MoE de Mistral depuis la série Mixtral. 41B actifs / 675B totaux, licencié Apache 2.0.
+
+## Spécifications
+
+| Version | Paramètres Actifs | Paramètres Totaux | Contexte | Usage |
+| :--- | :---: | :---: | :---: | :--- |
+| **Mistral Large 3** | 41B | 675B | 256K | Généraliste, codage, entreprise |
+| **Ministral 3 14B** | 14B | 14B | 128K | Edge, local |
+| **Ministral 3 8B** | 8B | 8B | 128K | Edge léger |
+| **Ministral 3 3B** | 3B | 3B | 128K | Mobile, IoT |
+
+## Architecture
+
+- **MoE granulaire** : Architecture sparse Mixture-of-Experts avec 41B paramètres actifs sur 675B totaux.
+- **Multimodal** : Compréhension texte et image natives.
+- **Multilingue** : Performances de pointe en conversations non-anglaises, meilleur de sa catégorie pour le multilinguisme hors anglais/chinois.
+- **Contexte** : 256K tokens.
+- **Entraînement** : Entraîné sur 3 000 GPU NVIDIA H200, de zéro.
+- **Post-training** : Alignment renforcé avec versions base et instruct disponibles. Version reasoning à venir.
+- **Formats** : NVFP4 (llm-compressor), BF16. Optimisé pour Blackwell NVL72 et single node 8×A100 / 8×H100 via vLLM.
+
+## Performances
+
+- Meilleur modèle open-weights permissif (Apache 2.0) à sa sortie.
+- Excellents résultats en codage, raisonnement et compréhension image.
+- Compétitif avec les meilleurs modèles propriétaires sur prompts généraux.
+- Supporté par vLLM, Red Hat, Hugging Face.
+
+## Licence & Disponibilité
+
+- Licence **Apache 2.0** — permissive, usage commercial et fine-tuning libres.
+- Sortie : 2 décembre 2025.
+- Disponible sur : Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, IBM WatsonX, Fireworks, Unsloth AI.
+- Prix API : $0,5/M tokens entrée, $1,5/M tokens sortie.
+
+## Pages Liées
+
+- [[mistral]] — prédécesseur, famille Mistral
+- [[gguf]] — quantification
+- [[exl2]] — quantification alternative
+- [[llama-3-1]] — concurrent Meta
+- [[gemma-4]] — concurrent Google