wiki/entities/minimax-m3.md

---
title: MiniMax M3
created: 2026-06-11
updated: 2026-06-11
type: entity
tags: [model, architecture, coding, agent, multimodal]
sources: [web research]
confidence: medium
contested: false
---
# 🎯 MiniMax M3

Modèle multimodal open-weights de pointe développé par **MiniMax** (Xiyu Technology). Premier modèle open-weights à combiner **codage agentique de frontière**, **contexte 1M tokens**, et **multimodalité native** (texte, image, vidéo) dans une seule architecture. Utilisé massivement via [[hermes-agent]] et OpenRouter.

## Spécifications

| Version | Paramètres | Contexte | Usage |
|:---|:---:|:---:|:---|
| MiniMax M3 | Non divulgué (MoE sparse) | 1M tokens (512K garanti) | Codage, Agents, Multimodal longue-contexte |

## Architecture

- **Type** : Sparse Mixture-of-Experts avec **MSA** (MiniMax Sparse Attention)
- **MSA** : Remplace l'attention full par une sélection de blocs KV → ~1/20e du calcul par token à 1M de contexte vs génération précédente
- **Accélération** : >9× prefilling, >15× décodage par rapport à M2.7
- **Modalités** : Texte, image, vidéo en entrée → texte en sortie
- **Raisonnement** : Mode thinking activable par requête
- **Inférence** : API MiniMax / OpenRouter ; auto-hébergement via vLLM/SGLang (avec support MSA)

## Performances

| Benchmark | Score | Position |
|:---|:---:|:---|
| **SWE-Bench Pro** | 59.0% | Surpasse GPT-5.5 et Gemini 3.1 Pro |
| **Terminal-Bench 2.1** | 66% | Agentique haut niveau |
| **BrowseComp** | 83.5% | Navigation web |
| **GPQA Diamond** | 92.9% | Raisonnement scientifique |
| **HLE** | 37.1% | — |
| **OSWorld-Verified** | 70.06% | Usage ordinateur |
| **SciCode** | 45.4% | Codage scientifique |
| **τ²-Bench Telecom** | 88.9% | Agents conversationnels |

### Indices Artifical Analysis
- **Intelligence Index** : 54.7 (>96% des modèles)
- **Coding Index** : 43.4 (>89% des modèles)
- **Agentic Index** : 68.6 (>97% des modèles)

## Licence & Disponibilité

- **Licence** : Open-weights (modified-MIT avec conditions commerciales — à vérifier avant usage produit)
- **Prix OpenRouter** : 0,30 $/M tokens input, 1,20 $/M tokens output (cache hit : 0,06 $)
- **Cache** : Taux de hit ~85,9%
- **Débit** : ~29 tok/s (moyen), 33 tok/s (pic)
- **API** : OpenRouter (`minimax/minimax-m3`), MiniMAX API, Token Plan ($20-$120/mois)
- **Date de sortie** : 1er juin 2026 (poids ouverts 10 jours après)

## Pages Liées

- [[minimax]]
- [[hermes-agent]]
- [[nous-research]]
- [[quantification-llm]]
- [[transformer-architecture]]
- [[changements-modeles-open-weights]]
- [[fiches-modeles-llm]]
- [[minimax-m2-7]]