48 lines
2.6 KiB
Markdown
48 lines
2.6 KiB
Markdown
---
|
||
title: Kimi K2.5
|
||
created: 2026-06-11
|
||
updated: 2026-06-11
|
||
type: entity
|
||
tags: [model, multimodal, agent, open-source]
|
||
sources: [web research]
|
||
confidence: medium
|
||
contested: false
|
||
---
|
||
# 🎯 Kimi K2.5
|
||
|
||
Modèle multimodal et agentique open-source de **Moonshot AI**, officiellement publié fin janvier 2026. Il combine compréhension texte/image/vidéo, génération de code à partir d'inputs visuels, et orchestration parallèle d'agents via **Agent Swarm**. K2.5 sert de prédécesseur direct à [[kimi-k2-6]].
|
||
|
||
## Spécifications
|
||
| Élément | Valeur |
|
||
|:---|:---|
|
||
| Paramètres totaux | 1T (≈1.04T dans le papier) |
|
||
| Paramètres actifs | 32B |
|
||
| Contexte | 256K tokens |
|
||
| Vision encoder | MoonViT / MoonViT-3D (~400M) |
|
||
| Date de sortie | 2026-01-27 |
|
||
|
||
## Architecture
|
||
- **Type** : [[transformer-architecture]] MoE avec **384 experts**, **8 experts activés par token** et **1 expert partagé**
|
||
- **Structure** : **61 couches**, **64 têtes d'attention**, vocabulaire **160K**, activation **SwiGLU**
|
||
- **Attention** : **MLA** (Multi-head Latent Attention)
|
||
- **Multimodal natif** : pré-entraînement conjoint texte + vision sur environ **15T tokens mixtes**
|
||
- **Agentique** : introduit **Agent Swarm**, un orchestrateur qui décompose les tâches en sous-agents parallèles
|
||
- **Produit** : modes Instant, Thinking, Agent et Agent Swarm ; API compatible OpenAI/Anthropic selon Moonshot
|
||
|
||
## Performances
|
||
- **HLE-Full** : 30.1 ; **HLE avec outils** : 50.2
|
||
- **AIME 2025** : 96.1 ; **HMMT 2025** : 95.4 ; **GPQA-Diamond** : 87.6 ; **MMLU-Pro** : 87.1
|
||
- **MMMU-Pro** : 78.5 ; **MathVista mini** : 90.1 ; **OCRBench** : 92.3 ; **InfoVQA** : 92.6
|
||
- **SWE-Bench Verified** : 76.8 ; **SWE-Bench Multilingual** : 73.0 ; **Terminal Bench 2.0** : 50.8 ; **LiveCodeBench v6** : 85.0
|
||
- **BrowseComp** : 60.6, puis **78.4** avec Agent Swarm ; **WideSearch** : 72.7, puis **79.0** avec Agent Swarm
|
||
- Moonshot met aussi en avant une réduction de latence pouvant atteindre **4.5×** sur des scénarios parallélisables
|
||
|
||
## Licence & Disponibilité
|
||
- **Licence** : **Modified MIT License** pour les poids et le code ; la métadonnée GitHub reste moins explicite que le README
|
||
- **Poids** : publiés sur Hugging Face et GitHub (`moonshotai/Kimi-K2.5` / `MoonshotAI/Kimi-K2.5`)
|
||
- **Accès** : disponible via Kimi Web, app mobile, API Moonshot et Kimi Code ; accès gratuit limité mentionné sur le site officiel
|
||
- **Déploiement** : support communautaire et fournisseurs tiers, avec recommandation d'utiliser l'API officielle pour reproduire les benchmarks
|
||
|
||
## Pages Liées
|
||
[[kimi-k2-6]] [[deepseek-v4]] [[llama-4]] [[qwen-3-7]] [[function-calling]] [[transformer-architecture]]
|