wiki: 2026-06-12_1926

2026-06-12 19:26:55 +02:00
parent 250bc8bef6
commit e7b0b6c1be
30 changed files with 1710 additions and 3 deletions
@@ -0,0 +1,47 @@
+---
+title: Kimi K2.5
+created: 2026-06-11
+updated: 2026-06-11
+type: entity
+tags: [model, multimodal, agent, open-source]
+sources: [web research]
+confidence: medium
+contested: false
+---
+# 🎯 Kimi K2.5
+
+Modèle multimodal et agentique open-source de **Moonshot AI**, officiellement publié fin janvier 2026. Il combine compréhension texte/image/vidéo, génération de code à partir d'inputs visuels, et orchestration parallèle d'agents via **Agent Swarm**. K2.5 sert de prédécesseur direct à [[kimi-k2-6]].
+
+## Spécifications
+| Élément | Valeur |
+|:---|:---|
+| Paramètres totaux | 1T (≈1.04T dans le papier) |
+| Paramètres actifs | 32B |
+| Contexte | 256K tokens |
+| Vision encoder | MoonViT / MoonViT-3D (~400M) |
+| Date de sortie | 2026-01-27 |
+
+## Architecture
+- **Type** : [[transformer-architecture]] MoE avec **384 experts**, **8 experts activés par token** et **1 expert partagé**
+- **Structure** : **61 couches**, **64 têtes d'attention**, vocabulaire **160K**, activation **SwiGLU**
+- **Attention** : **MLA** (Multi-head Latent Attention)
+- **Multimodal natif** : pré-entraînement conjoint texte + vision sur environ **15T tokens mixtes**
+- **Agentique** : introduit **Agent Swarm**, un orchestrateur qui décompose les tâches en sous-agents parallèles
+- **Produit** : modes Instant, Thinking, Agent et Agent Swarm ; API compatible OpenAI/Anthropic selon Moonshot
+
+## Performances
+- **HLE-Full** : 30.1 ; **HLE avec outils** : 50.2
+- **AIME 2025** : 96.1 ; **HMMT 2025** : 95.4 ; **GPQA-Diamond** : 87.6 ; **MMLU-Pro** : 87.1
+- **MMMU-Pro** : 78.5 ; **MathVista mini** : 90.1 ; **OCRBench** : 92.3 ; **InfoVQA** : 92.6
+- **SWE-Bench Verified** : 76.8 ; **SWE-Bench Multilingual** : 73.0 ; **Terminal Bench 2.0** : 50.8 ; **LiveCodeBench v6** : 85.0
+- **BrowseComp** : 60.6, puis **78.4** avec Agent Swarm ; **WideSearch** : 72.7, puis **79.0** avec Agent Swarm
+- Moonshot met aussi en avant une réduction de latence pouvant atteindre **4.5×** sur des scénarios parallélisables
+
+## Licence & Disponibilité
+- **Licence** : **Modified MIT License** pour les poids et le code ; la métadonnée GitHub reste moins explicite que le README
+- **Poids** : publiés sur Hugging Face et GitHub (`moonshotai/Kimi-K2.5` / `MoonshotAI/Kimi-K2.5`)
+- **Accès** : disponible via Kimi Web, app mobile, API Moonshot et Kimi Code ; accès gratuit limité mentionné sur le site officiel
+- **Déploiement** : support communautaire et fournisseurs tiers, avec recommandation d'utiliser l'API officielle pour reproduire les benchmarks
+
+## Pages Liées
+[[kimi-k2-6]] [[deepseek-v4]] [[llama-4]] [[qwen-3-7]] [[function-calling]] [[transformer-architecture]]