Files
wiki/entities/minimax-m3.md
T
2026-06-12 19:26:55 +02:00

67 lines
2.6 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: MiniMax M3
created: 2026-06-11
updated: 2026-06-11
type: entity
tags: [model, architecture, coding, agent, multimodal]
sources: [web research]
confidence: medium
contested: false
---
# 🎯 MiniMax M3
Modèle multimodal open-weights de pointe développé par **MiniMax** (Xiyu Technology). Premier modèle open-weights à combiner **codage agentique de frontière**, **contexte 1M tokens**, et **multimodalité native** (texte, image, vidéo) dans une seule architecture. Utilisé massivement via [[hermes-agent]] et OpenRouter.
## Spécifications
| Version | Paramètres | Contexte | Usage |
|:---|:---:|:---:|:---|
| MiniMax M3 | Non divulgué (MoE sparse) | 1M tokens (512K garanti) | Codage, Agents, Multimodal longue-contexte |
## Architecture
- **Type** : Sparse Mixture-of-Experts avec **MSA** (MiniMax Sparse Attention)
- **MSA** : Remplace l'attention full par une sélection de blocs KV → ~1/20e du calcul par token à 1M de contexte vs génération précédente
- **Accélération** : >9× prefilling, >15× décodage par rapport à M2.7
- **Modalités** : Texte, image, vidéo en entrée → texte en sortie
- **Raisonnement** : Mode thinking activable par requête
- **Inférence** : API MiniMax / OpenRouter ; auto-hébergement via vLLM/SGLang (avec support MSA)
## Performances
| Benchmark | Score | Position |
|:---|:---:|:---|
| **SWE-Bench Pro** | 59.0% | Surpasse GPT-5.5 et Gemini 3.1 Pro |
| **Terminal-Bench 2.1** | 66% | Agentique haut niveau |
| **BrowseComp** | 83.5% | Navigation web |
| **GPQA Diamond** | 92.9% | Raisonnement scientifique |
| **HLE** | 37.1% | — |
| **OSWorld-Verified** | 70.06% | Usage ordinateur |
| **SciCode** | 45.4% | Codage scientifique |
| **τ²-Bench Telecom** | 88.9% | Agents conversationnels |
### Indices Artifical Analysis
- **Intelligence Index** : 54.7 (>96% des modèles)
- **Coding Index** : 43.4 (>89% des modèles)
- **Agentic Index** : 68.6 (>97% des modèles)
## Licence & Disponibilité
- **Licence** : Open-weights (modified-MIT avec conditions commerciales — à vérifier avant usage produit)
- **Prix OpenRouter** : 0,30 $/M tokens input, 1,20 $/M tokens output (cache hit : 0,06 $)
- **Cache** : Taux de hit ~85,9%
- **Débit** : ~29 tok/s (moyen), 33 tok/s (pic)
- **API** : OpenRouter (`minimax/minimax-m3`), MiniMAX API, Token Plan ($20-$120/mois)
- **Date de sortie** : 1er juin 2026 (poids ouverts 10 jours après)
## Pages Liées
- [[minimax]]
- [[hermes-agent]]
- [[nous-research]]
- [[quantification-llm]]
- [[transformer-architecture]]
- [[changements-modeles-open-weights]]
- [[fiches-modeles-llm]]
- [[minimax-m2-7]]