🎯 MiniMax M3

Modèle multimodal open-weights de pointe développé par MiniMax (Xiyu Technology). Premier modèle open-weights à combiner codage agentique de frontière, contexte 1M tokens, et multimodalité native (texte, image, vidéo) dans une seule architecture. Utilisé massivement via hermes-agent et OpenRouter.

Spécifications

Version	Paramètres	Contexte	Usage
MiniMax M3	Non divulgué (MoE sparse)	1M tokens (512K garanti)	Codage, Agents, Multimodal longue-contexte

Architecture

Type : Sparse Mixture-of-Experts avec MSA (MiniMax Sparse Attention)
MSA : Remplace l'attention full par une sélection de blocs KV → ~1/20e du calcul par token à 1M de contexte vs génération précédente
Accélération : >9× prefilling, >15× décodage par rapport à M2.7
Modalités : Texte, image, vidéo en entrée → texte en sortie
Raisonnement : Mode thinking activable par requête
Inférence : API MiniMax / OpenRouter ; auto-hébergement via vLLM/SGLang (avec support MSA)

Performances

Benchmark	Score	Position
SWE-Bench Pro	59.0%	Surpasse GPT-5.5 et Gemini 3.1 Pro
Terminal-Bench 2.1	66%	Agentique haut niveau
BrowseComp	83.5%	Navigation web
GPQA Diamond	92.9%	Raisonnement scientifique
HLE	37.1%	—
OSWorld-Verified	70.06%	Usage ordinateur
SciCode	45.4%	Codage scientifique
τ²-Bench Telecom	88.9%	Agents conversationnels

Indices Artifical Analysis

Intelligence Index : 54.7 (>96% des modèles)
Coding Index : 43.4 (>89% des modèles)
Agentic Index : 68.6 (>97% des modèles)

Licence & Disponibilité

Licence : Open-weights (modified-MIT avec conditions commerciales — à vérifier avant usage produit)
Prix OpenRouter : 0,30 $/M tokens input, 1,20 /M tokens output (cache hit : 0,06 )
Cache : Taux de hit ~85,9%
Débit : ~29 tok/s (moyen), 33 tok/s (pic)
API : OpenRouter (minimax/minimax-m3), MiniMAX API, Token Plan ($20-$120/mois)
Date de sortie : 1er juin 2026 (poids ouverts 10 jours après)

2.6 KiB Raw Permalink Blame History Unescape Escape