Files
wiki/entities/mistral-large-3.md
T
2026-06-12 19:26:55 +02:00

55 lines
2.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: Mistral Large 3
created: 2026-06-11
updated: 2026-06-11
type: entity
tags: [model, architecture, open-source]
sources: [web research]
confidence: high
contested: false
---
# 🌀 Mistral Large 3
Modèle phare de Mistral AI, successeur de [[mistral]] (Mistral Large 2). Premier MoE de Mistral depuis la série Mixtral. 41B actifs / 675B totaux, licencié Apache 2.0.
## Spécifications
| Version | Paramètres Actifs | Paramètres Totaux | Contexte | Usage |
| :--- | :---: | :---: | :---: | :--- |
| **Mistral Large 3** | 41B | 675B | 256K | Généraliste, codage, entreprise |
| **Ministral 3 14B** | 14B | 14B | 128K | Edge, local |
| **Ministral 3 8B** | 8B | 8B | 128K | Edge léger |
| **Ministral 3 3B** | 3B | 3B | 128K | Mobile, IoT |
## Architecture
- **MoE granulaire** : Architecture sparse Mixture-of-Experts avec 41B paramètres actifs sur 675B totaux.
- **Multimodal** : Compréhension texte et image natives.
- **Multilingue** : Performances de pointe en conversations non-anglaises, meilleur de sa catégorie pour le multilinguisme hors anglais/chinois.
- **Contexte** : 256K tokens.
- **Entraînement** : Entraîné sur 3 000 GPU NVIDIA H200, de zéro.
- **Post-training** : Alignment renforcé avec versions base et instruct disponibles. Version reasoning à venir.
- **Formats** : NVFP4 (llm-compressor), BF16. Optimisé pour Blackwell NVL72 et single node 8×A100 / 8×H100 via vLLM.
## Performances
- Meilleur modèle open-weights permissif (Apache 2.0) à sa sortie.
- Excellents résultats en codage, raisonnement et compréhension image.
- Compétitif avec les meilleurs modèles propriétaires sur prompts généraux.
- Supporté par vLLM, Red Hat, Hugging Face.
## Licence & Disponibilité
- Licence **Apache 2.0** — permissive, usage commercial et fine-tuning libres.
- Sortie : 2 décembre 2025.
- Disponible sur : Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, IBM WatsonX, Fireworks, Unsloth AI.
- Prix API : $0,5/M tokens entrée, $1,5/M tokens sortie.
## Pages Liées
- [[mistral]] — prédécesseur, famille Mistral
- [[gguf]] — quantification
- [[exl2]] — quantification alternative
- [[llama-3-1]] — concurrent Meta
- [[gemma-4]] — concurrent Google