🎯 Kimi K2.5

Modèle multimodal et agentique open-source de Moonshot AI, officiellement publié fin janvier 2026. Il combine compréhension texte/image/vidéo, génération de code à partir d'inputs visuels, et orchestration parallèle d'agents via Agent Swarm. K2.5 sert de prédécesseur direct à kimi-k2-6.

Spécifications

Élément	Valeur
Paramètres totaux	1T (≈1.04T dans le papier)
Paramètres actifs	32B
Contexte	256K tokens
Vision encoder	MoonViT / MoonViT-3D (~400M)
Date de sortie	2026-01-27

Architecture

Type : transformer-architecture MoE avec 384 experts, 8 experts activés par token et 1 expert partagé
Structure : 61 couches, 64 têtes d'attention, vocabulaire 160K, activation SwiGLU
Attention : MLA (Multi-head Latent Attention)
Multimodal natif : pré-entraînement conjoint texte + vision sur environ 15T tokens mixtes
Agentique : introduit Agent Swarm, un orchestrateur qui décompose les tâches en sous-agents parallèles
Produit : modes Instant, Thinking, Agent et Agent Swarm ; API compatible OpenAI/Anthropic selon Moonshot

Performances

HLE-Full : 30.1 ; HLE avec outils : 50.2
AIME 2025 : 96.1 ; HMMT 2025 : 95.4 ; GPQA-Diamond : 87.6 ; MMLU-Pro : 87.1
MMMU-Pro : 78.5 ; MathVista mini : 90.1 ; OCRBench : 92.3 ; InfoVQA : 92.6
SWE-Bench Verified : 76.8 ; SWE-Bench Multilingual : 73.0 ; Terminal Bench 2.0 : 50.8 ; LiveCodeBench v6 : 85.0
BrowseComp : 60.6, puis 78.4 avec Agent Swarm ; WideSearch : 72.7, puis 79.0 avec Agent Swarm
Moonshot met aussi en avant une réduction de latence pouvant atteindre 4.5× sur des scénarios parallélisables

Licence & Disponibilité

Licence : Modified MIT License pour les poids et le code ; la métadonnée GitHub reste moins explicite que le README
Poids : publiés sur Hugging Face et GitHub (moonshotai/Kimi-K2.5 / MoonshotAI/Kimi-K2.5)
Accès : disponible via Kimi Web, app mobile, API Moonshot et Kimi Code ; accès gratuit limité mentionné sur le site officiel
Déploiement : support communautaire et fournisseurs tiers, avec recommandation d'utiliser l'API officielle pour reproduire les benchmarks

Pages Liées

kimi-k2-6 deepseek-v4 llama-4 qwen-3-7 function-calling transformer-architecture

2.6 KiB Raw Permalink Blame History Unescape Escape