Modèle multimodal open-weights de pointe développé par MiniMax (Xiyu Technology). Premier modèle open-weights à combiner codage agentique de frontière, contexte 1M tokens, et multimodalité native (texte, image, vidéo) dans une seule architecture. Utilisé massivement via hermes-agent et OpenRouter.
Spécifications
Version
Paramètres
Contexte
Usage
MiniMax M3
Non divulgué (MoE sparse)
1M tokens (512K garanti)
Codage, Agents, Multimodal longue-contexte
Architecture
Type : Sparse Mixture-of-Experts avec MSA (MiniMax Sparse Attention)
MSA : Remplace l'attention full par une sélection de blocs KV → ~1/20e du calcul par token à 1M de contexte vs génération précédente
Accélération : >9× prefilling, >15× décodage par rapport à M2.7
Modalités : Texte, image, vidéo en entrée → texte en sortie
Raisonnement : Mode thinking activable par requête
Inférence : API MiniMax / OpenRouter ; auto-hébergement via vLLM/SGLang (avec support MSA)
Performances
Benchmark
Score
Position
SWE-Bench Pro
59.0%
Surpasse GPT-5.5 et Gemini 3.1 Pro
Terminal-Bench 2.1
66%
Agentique haut niveau
BrowseComp
83.5%
Navigation web
GPQA Diamond
92.9%
Raisonnement scientifique
HLE
37.1%
—
OSWorld-Verified
70.06%
Usage ordinateur
SciCode
45.4%
Codage scientifique
τ²-Bench Telecom
88.9%
Agents conversationnels
Indices Artifical Analysis
Intelligence Index : 54.7 (>96% des modèles)
Coding Index : 43.4 (>89% des modèles)
Agentic Index : 68.6 (>97% des modèles)
Licence & Disponibilité
Licence : Open-weights (modified-MIT avec conditions commerciales — à vérifier avant usage produit)
Prix OpenRouter : 0,30 $/M tokens input, 1,20 /M tokens output (cache hit : 0,06 )
Cache : Taux de hit ~85,9%
Débit : ~29 tok/s (moyen), 33 tok/s (pic)
API : OpenRouter (minimax/minimax-m3), MiniMAX API, Token Plan ($20-$120/mois)
Date de sortie : 1er juin 2026 (poids ouverts 10 jours après)