Modèle phare de Mistral AI, successeur de mistral (Mistral Large 2). Premier MoE de Mistral depuis la série Mixtral. 41B actifs / 675B totaux, licencié Apache 2.0.
Spécifications
Version
Paramètres Actifs
Paramètres Totaux
Contexte
Usage
Mistral Large 3
41B
675B
256K
Généraliste, codage, entreprise
Ministral 3 14B
14B
14B
128K
Edge, local
Ministral 3 8B
8B
8B
128K
Edge léger
Ministral 3 3B
3B
3B
128K
Mobile, IoT
Architecture
MoE granulaire : Architecture sparse Mixture-of-Experts avec 41B paramètres actifs sur 675B totaux.
Multimodal : Compréhension texte et image natives.
Multilingue : Performances de pointe en conversations non-anglaises, meilleur de sa catégorie pour le multilinguisme hors anglais/chinois.
Contexte : 256K tokens.
Entraînement : Entraîné sur 3 000 GPU NVIDIA H200, de zéro.
Post-training : Alignment renforcé avec versions base et instruct disponibles. Version reasoning à venir.
Formats : NVFP4 (llm-compressor), BF16. Optimisé pour Blackwell NVL72 et single node 8×A100 / 8×H100 via vLLM.
Performances
Meilleur modèle open-weights permissif (Apache 2.0) à sa sortie.
Excellents résultats en codage, raisonnement et compréhension image.
Compétitif avec les meilleurs modèles propriétaires sur prompts généraux.
Supporté par vLLM, Red Hat, Hugging Face.
Licence & Disponibilité
Licence Apache 2.0 — permissive, usage commercial et fine-tuning libres.
Sortie : 2 décembre 2025.
Disponible sur : Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, IBM WatsonX, Fireworks, Unsloth AI.
Prix API : $0,5/M tokens entrée, $1,5/M tokens sortie.