wiki: 2026-06-12_1926

This commit is contained in:
2026-06-12 19:26:55 +02:00
parent 250bc8bef6
commit e7b0b6c1be
30 changed files with 1710 additions and 3 deletions
+54
View File
@@ -0,0 +1,54 @@
---
title: Mistral Large 3
created: 2026-06-11
updated: 2026-06-11
type: entity
tags: [model, architecture, open-source]
sources: [web research]
confidence: high
contested: false
---
# 🌀 Mistral Large 3
Modèle phare de Mistral AI, successeur de [[mistral]] (Mistral Large 2). Premier MoE de Mistral depuis la série Mixtral. 41B actifs / 675B totaux, licencié Apache 2.0.
## Spécifications
| Version | Paramètres Actifs | Paramètres Totaux | Contexte | Usage |
| :--- | :---: | :---: | :---: | :--- |
| **Mistral Large 3** | 41B | 675B | 256K | Généraliste, codage, entreprise |
| **Ministral 3 14B** | 14B | 14B | 128K | Edge, local |
| **Ministral 3 8B** | 8B | 8B | 128K | Edge léger |
| **Ministral 3 3B** | 3B | 3B | 128K | Mobile, IoT |
## Architecture
- **MoE granulaire** : Architecture sparse Mixture-of-Experts avec 41B paramètres actifs sur 675B totaux.
- **Multimodal** : Compréhension texte et image natives.
- **Multilingue** : Performances de pointe en conversations non-anglaises, meilleur de sa catégorie pour le multilinguisme hors anglais/chinois.
- **Contexte** : 256K tokens.
- **Entraînement** : Entraîné sur 3 000 GPU NVIDIA H200, de zéro.
- **Post-training** : Alignment renforcé avec versions base et instruct disponibles. Version reasoning à venir.
- **Formats** : NVFP4 (llm-compressor), BF16. Optimisé pour Blackwell NVL72 et single node 8×A100 / 8×H100 via vLLM.
## Performances
- Meilleur modèle open-weights permissif (Apache 2.0) à sa sortie.
- Excellents résultats en codage, raisonnement et compréhension image.
- Compétitif avec les meilleurs modèles propriétaires sur prompts généraux.
- Supporté par vLLM, Red Hat, Hugging Face.
## Licence & Disponibilité
- Licence **Apache 2.0** — permissive, usage commercial et fine-tuning libres.
- Sortie : 2 décembre 2025.
- Disponible sur : Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, IBM WatsonX, Fireworks, Unsloth AI.
- Prix API : $0,5/M tokens entrée, $1,5/M tokens sortie.
## Pages Liées
- [[mistral]] — prédécesseur, famille Mistral
- [[gguf]] — quantification
- [[exl2]] — quantification alternative
- [[llama-3-1]] — concurrent Meta
- [[gemma-4]] — concurrent Google