--- title: MiniMax M3 created: 2026-06-11 updated: 2026-06-11 type: entity tags: [model, architecture, coding, agent, multimodal] sources: [web research] confidence: medium contested: false --- # 🎯 MiniMax M3 Modèle multimodal open-weights de pointe développé par **MiniMax** (Xiyu Technology). Premier modèle open-weights à combiner **codage agentique de frontière**, **contexte 1M tokens**, et **multimodalité native** (texte, image, vidéo) dans une seule architecture. Utilisé massivement via [[hermes-agent]] et OpenRouter. ## Spécifications | Version | Paramètres | Contexte | Usage | |:---|:---:|:---:|:---| | MiniMax M3 | Non divulgué (MoE sparse) | 1M tokens (512K garanti) | Codage, Agents, Multimodal longue-contexte | ## Architecture - **Type** : Sparse Mixture-of-Experts avec **MSA** (MiniMax Sparse Attention) - **MSA** : Remplace l'attention full par une sélection de blocs KV → ~1/20e du calcul par token à 1M de contexte vs génération précédente - **Accélération** : >9× prefilling, >15× décodage par rapport à M2.7 - **Modalités** : Texte, image, vidéo en entrée → texte en sortie - **Raisonnement** : Mode thinking activable par requête - **Inférence** : API MiniMax / OpenRouter ; auto-hébergement via vLLM/SGLang (avec support MSA) ## Performances | Benchmark | Score | Position | |:---|:---:|:---| | **SWE-Bench Pro** | 59.0% | Surpasse GPT-5.5 et Gemini 3.1 Pro | | **Terminal-Bench 2.1** | 66% | Agentique haut niveau | | **BrowseComp** | 83.5% | Navigation web | | **GPQA Diamond** | 92.9% | Raisonnement scientifique | | **HLE** | 37.1% | — | | **OSWorld-Verified** | 70.06% | Usage ordinateur | | **SciCode** | 45.4% | Codage scientifique | | **τ²-Bench Telecom** | 88.9% | Agents conversationnels | ### Indices Artifical Analysis - **Intelligence Index** : 54.7 (>96% des modèles) - **Coding Index** : 43.4 (>89% des modèles) - **Agentic Index** : 68.6 (>97% des modèles) ## Licence & Disponibilité - **Licence** : Open-weights (modified-MIT avec conditions commerciales — à vérifier avant usage produit) - **Prix OpenRouter** : 0,30 $/M tokens input, 1,20 $/M tokens output (cache hit : 0,06 $) - **Cache** : Taux de hit ~85,9% - **Débit** : ~29 tok/s (moyen), 33 tok/s (pic) - **API** : OpenRouter (`minimax/minimax-m3`), MiniMAX API, Token Plan ($20-$120/mois) - **Date de sortie** : 1er juin 2026 (poids ouverts 10 jours après) ## Pages Liées - [[minimax]] - [[hermes-agent]] - [[nous-research]] - [[quantification-llm]] - [[transformer-architecture]] - [[changements-modeles-open-weights]] - [[fiches-modeles-llm]] - [[minimax-m2-7]]