wiki: 2026-06-12_1926
This commit is contained in:
@@ -0,0 +1,47 @@
|
||||
---
|
||||
title: Kimi K2.5
|
||||
created: 2026-06-11
|
||||
updated: 2026-06-11
|
||||
type: entity
|
||||
tags: [model, multimodal, agent, open-source]
|
||||
sources: [web research]
|
||||
confidence: medium
|
||||
contested: false
|
||||
---
|
||||
# 🎯 Kimi K2.5
|
||||
|
||||
Modèle multimodal et agentique open-source de **Moonshot AI**, officiellement publié fin janvier 2026. Il combine compréhension texte/image/vidéo, génération de code à partir d'inputs visuels, et orchestration parallèle d'agents via **Agent Swarm**. K2.5 sert de prédécesseur direct à [[kimi-k2-6]].
|
||||
|
||||
## Spécifications
|
||||
| Élément | Valeur |
|
||||
|:---|:---|
|
||||
| Paramètres totaux | 1T (≈1.04T dans le papier) |
|
||||
| Paramètres actifs | 32B |
|
||||
| Contexte | 256K tokens |
|
||||
| Vision encoder | MoonViT / MoonViT-3D (~400M) |
|
||||
| Date de sortie | 2026-01-27 |
|
||||
|
||||
## Architecture
|
||||
- **Type** : [[transformer-architecture]] MoE avec **384 experts**, **8 experts activés par token** et **1 expert partagé**
|
||||
- **Structure** : **61 couches**, **64 têtes d'attention**, vocabulaire **160K**, activation **SwiGLU**
|
||||
- **Attention** : **MLA** (Multi-head Latent Attention)
|
||||
- **Multimodal natif** : pré-entraînement conjoint texte + vision sur environ **15T tokens mixtes**
|
||||
- **Agentique** : introduit **Agent Swarm**, un orchestrateur qui décompose les tâches en sous-agents parallèles
|
||||
- **Produit** : modes Instant, Thinking, Agent et Agent Swarm ; API compatible OpenAI/Anthropic selon Moonshot
|
||||
|
||||
## Performances
|
||||
- **HLE-Full** : 30.1 ; **HLE avec outils** : 50.2
|
||||
- **AIME 2025** : 96.1 ; **HMMT 2025** : 95.4 ; **GPQA-Diamond** : 87.6 ; **MMLU-Pro** : 87.1
|
||||
- **MMMU-Pro** : 78.5 ; **MathVista mini** : 90.1 ; **OCRBench** : 92.3 ; **InfoVQA** : 92.6
|
||||
- **SWE-Bench Verified** : 76.8 ; **SWE-Bench Multilingual** : 73.0 ; **Terminal Bench 2.0** : 50.8 ; **LiveCodeBench v6** : 85.0
|
||||
- **BrowseComp** : 60.6, puis **78.4** avec Agent Swarm ; **WideSearch** : 72.7, puis **79.0** avec Agent Swarm
|
||||
- Moonshot met aussi en avant une réduction de latence pouvant atteindre **4.5×** sur des scénarios parallélisables
|
||||
|
||||
## Licence & Disponibilité
|
||||
- **Licence** : **Modified MIT License** pour les poids et le code ; la métadonnée GitHub reste moins explicite que le README
|
||||
- **Poids** : publiés sur Hugging Face et GitHub (`moonshotai/Kimi-K2.5` / `MoonshotAI/Kimi-K2.5`)
|
||||
- **Accès** : disponible via Kimi Web, app mobile, API Moonshot et Kimi Code ; accès gratuit limité mentionné sur le site officiel
|
||||
- **Déploiement** : support communautaire et fournisseurs tiers, avec recommandation d'utiliser l'API officielle pour reproduire les benchmarks
|
||||
|
||||
## Pages Liées
|
||||
[[kimi-k2-6]] [[deepseek-v4]] [[llama-4]] [[qwen-3-7]] [[function-calling]] [[transformer-architecture]]
|
||||
Reference in New Issue
Block a user