🌀 Mistral Large 3

Modèle phare de Mistral AI, successeur de mistral (Mistral Large 2). Premier MoE de Mistral depuis la série Mixtral. 41B actifs / 675B totaux, licencié Apache 2.0.

Spécifications

Version	Paramètres Actifs	Paramètres Totaux	Contexte	Usage
Mistral Large 3	41B	675B	256K	Généraliste, codage, entreprise
Ministral 3 14B	14B	14B	128K	Edge, local
Ministral 3 8B	8B	8B	128K	Edge léger
Ministral 3 3B	3B	3B	128K	Mobile, IoT

Architecture

MoE granulaire : Architecture sparse Mixture-of-Experts avec 41B paramètres actifs sur 675B totaux.
Multimodal : Compréhension texte et image natives.
Multilingue : Performances de pointe en conversations non-anglaises, meilleur de sa catégorie pour le multilinguisme hors anglais/chinois.
Contexte : 256K tokens.
Entraînement : Entraîné sur 3 000 GPU NVIDIA H200, de zéro.
Post-training : Alignment renforcé avec versions base et instruct disponibles. Version reasoning à venir.
Formats : NVFP4 (llm-compressor), BF16. Optimisé pour Blackwell NVL72 et single node 8×A100 / 8×H100 via vLLM.

Performances

Meilleur modèle open-weights permissif (Apache 2.0) à sa sortie.
Excellents résultats en codage, raisonnement et compréhension image.
Compétitif avec les meilleurs modèles propriétaires sur prompts généraux.
Supporté par vLLM, Red Hat, Hugging Face.

Licence & Disponibilité

Licence Apache 2.0 — permissive, usage commercial et fine-tuning libres.
Sortie : 2 décembre 2025.
Disponible sur : Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, IBM WatsonX, Fireworks, Unsloth AI.
Prix API : $0,5/M tokens entrée, $1,5/M tokens sortie.

Pages Liées

mistral — prédécesseur, famille Mistral
gguf — quantification
exl2 — quantification alternative
llama-3-1 — concurrent Meta
gemma-4 — concurrent Google

2.2 KiB Raw Blame History Unescape Escape

🌀 Mistral Large 3

Spécifications

Architecture

Performances

Licence & Disponibilité

Pages Liées

2.2 KiB

Raw Blame History