67 lines
2.6 KiB
Markdown
67 lines
2.6 KiB
Markdown
---
|
||
title: MiniMax M3
|
||
created: 2026-06-11
|
||
updated: 2026-06-11
|
||
type: entity
|
||
tags: [model, architecture, coding, agent, multimodal]
|
||
sources: [web research]
|
||
confidence: medium
|
||
contested: false
|
||
---
|
||
# 🎯 MiniMax M3
|
||
|
||
Modèle multimodal open-weights de pointe développé par **MiniMax** (Xiyu Technology). Premier modèle open-weights à combiner **codage agentique de frontière**, **contexte 1M tokens**, et **multimodalité native** (texte, image, vidéo) dans une seule architecture. Utilisé massivement via [[hermes-agent]] et OpenRouter.
|
||
|
||
## Spécifications
|
||
|
||
| Version | Paramètres | Contexte | Usage |
|
||
|:---|:---:|:---:|:---|
|
||
| MiniMax M3 | Non divulgué (MoE sparse) | 1M tokens (512K garanti) | Codage, Agents, Multimodal longue-contexte |
|
||
|
||
## Architecture
|
||
|
||
- **Type** : Sparse Mixture-of-Experts avec **MSA** (MiniMax Sparse Attention)
|
||
- **MSA** : Remplace l'attention full par une sélection de blocs KV → ~1/20e du calcul par token à 1M de contexte vs génération précédente
|
||
- **Accélération** : >9× prefilling, >15× décodage par rapport à M2.7
|
||
- **Modalités** : Texte, image, vidéo en entrée → texte en sortie
|
||
- **Raisonnement** : Mode thinking activable par requête
|
||
- **Inférence** : API MiniMax / OpenRouter ; auto-hébergement via vLLM/SGLang (avec support MSA)
|
||
|
||
## Performances
|
||
|
||
| Benchmark | Score | Position |
|
||
|:---|:---:|:---|
|
||
| **SWE-Bench Pro** | 59.0% | Surpasse GPT-5.5 et Gemini 3.1 Pro |
|
||
| **Terminal-Bench 2.1** | 66% | Agentique haut niveau |
|
||
| **BrowseComp** | 83.5% | Navigation web |
|
||
| **GPQA Diamond** | 92.9% | Raisonnement scientifique |
|
||
| **HLE** | 37.1% | — |
|
||
| **OSWorld-Verified** | 70.06% | Usage ordinateur |
|
||
| **SciCode** | 45.4% | Codage scientifique |
|
||
| **τ²-Bench Telecom** | 88.9% | Agents conversationnels |
|
||
|
||
### Indices Artifical Analysis
|
||
- **Intelligence Index** : 54.7 (>96% des modèles)
|
||
- **Coding Index** : 43.4 (>89% des modèles)
|
||
- **Agentic Index** : 68.6 (>97% des modèles)
|
||
|
||
## Licence & Disponibilité
|
||
|
||
- **Licence** : Open-weights (modified-MIT avec conditions commerciales — à vérifier avant usage produit)
|
||
- **Prix OpenRouter** : 0,30 $/M tokens input, 1,20 $/M tokens output (cache hit : 0,06 $)
|
||
- **Cache** : Taux de hit ~85,9%
|
||
- **Débit** : ~29 tok/s (moyen), 33 tok/s (pic)
|
||
- **API** : OpenRouter (`minimax/minimax-m3`), MiniMAX API, Token Plan ($20-$120/mois)
|
||
- **Date de sortie** : 1er juin 2026 (poids ouverts 10 jours après)
|
||
|
||
## Pages Liées
|
||
|
||
- [[minimax]]
|
||
- [[hermes-agent]]
|
||
- [[nous-research]]
|
||
- [[quantification-llm]]
|
||
- [[transformer-architecture]]
|
||
- [[changements-modeles-open-weights]]
|
||
- [[fiches-modeles-llm]]
|
||
- [[minimax-m2-7]]
|