Files
wiki/entities/mistral-large-3.md
T
2026-06-12 19:26:55 +02:00

2.2 KiB
Raw Blame History

title, created, updated, type, tags, sources, confidence, contested
title created updated type tags sources confidence contested
Mistral Large 3 2026-06-11 2026-06-11 entity
model
architecture
open-source
web research
high false

🌀 Mistral Large 3

Modèle phare de Mistral AI, successeur de mistral (Mistral Large 2). Premier MoE de Mistral depuis la série Mixtral. 41B actifs / 675B totaux, licencié Apache 2.0.

Spécifications

Version Paramètres Actifs Paramètres Totaux Contexte Usage
Mistral Large 3 41B 675B 256K Généraliste, codage, entreprise
Ministral 3 14B 14B 14B 128K Edge, local
Ministral 3 8B 8B 8B 128K Edge léger
Ministral 3 3B 3B 3B 128K Mobile, IoT

Architecture

  • MoE granulaire : Architecture sparse Mixture-of-Experts avec 41B paramètres actifs sur 675B totaux.
  • Multimodal : Compréhension texte et image natives.
  • Multilingue : Performances de pointe en conversations non-anglaises, meilleur de sa catégorie pour le multilinguisme hors anglais/chinois.
  • Contexte : 256K tokens.
  • Entraînement : Entraîné sur 3 000 GPU NVIDIA H200, de zéro.
  • Post-training : Alignment renforcé avec versions base et instruct disponibles. Version reasoning à venir.
  • Formats : NVFP4 (llm-compressor), BF16. Optimisé pour Blackwell NVL72 et single node 8×A100 / 8×H100 via vLLM.

Performances

  • Meilleur modèle open-weights permissif (Apache 2.0) à sa sortie.
  • Excellents résultats en codage, raisonnement et compréhension image.
  • Compétitif avec les meilleurs modèles propriétaires sur prompts généraux.
  • Supporté par vLLM, Red Hat, Hugging Face.

Licence & Disponibilité

  • Licence Apache 2.0 — permissive, usage commercial et fine-tuning libres.
  • Sortie : 2 décembre 2025.
  • Disponible sur : Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, IBM WatsonX, Fireworks, Unsloth AI.
  • Prix API : $0,5/M tokens entrée, $1,5/M tokens sortie.

Pages Liées

  • mistral — prédécesseur, famille Mistral
  • gguf — quantification
  • exl2 — quantification alternative
  • llama-3-1 — concurrent Meta
  • gemma-4 — concurrent Google