Files
2026-06-12 19:26:55 +02:00

2.6 KiB
Raw Permalink Blame History

title, created, updated, type, tags, sources, confidence, contested
title created updated type tags sources confidence contested
Kimi K2.5 2026-06-11 2026-06-11 entity
model
multimodal
agent
open-source
web research
medium false

🎯 Kimi K2.5

Modèle multimodal et agentique open-source de Moonshot AI, officiellement publié fin janvier 2026. Il combine compréhension texte/image/vidéo, génération de code à partir d'inputs visuels, et orchestration parallèle d'agents via Agent Swarm. K2.5 sert de prédécesseur direct à kimi-k2-6.

Spécifications

Élément Valeur
Paramètres totaux 1T (≈1.04T dans le papier)
Paramètres actifs 32B
Contexte 256K tokens
Vision encoder MoonViT / MoonViT-3D (~400M)
Date de sortie 2026-01-27

Architecture

  • Type : transformer-architecture MoE avec 384 experts, 8 experts activés par token et 1 expert partagé
  • Structure : 61 couches, 64 têtes d'attention, vocabulaire 160K, activation SwiGLU
  • Attention : MLA (Multi-head Latent Attention)
  • Multimodal natif : pré-entraînement conjoint texte + vision sur environ 15T tokens mixtes
  • Agentique : introduit Agent Swarm, un orchestrateur qui décompose les tâches en sous-agents parallèles
  • Produit : modes Instant, Thinking, Agent et Agent Swarm ; API compatible OpenAI/Anthropic selon Moonshot

Performances

  • HLE-Full : 30.1 ; HLE avec outils : 50.2
  • AIME 2025 : 96.1 ; HMMT 2025 : 95.4 ; GPQA-Diamond : 87.6 ; MMLU-Pro : 87.1
  • MMMU-Pro : 78.5 ; MathVista mini : 90.1 ; OCRBench : 92.3 ; InfoVQA : 92.6
  • SWE-Bench Verified : 76.8 ; SWE-Bench Multilingual : 73.0 ; Terminal Bench 2.0 : 50.8 ; LiveCodeBench v6 : 85.0
  • BrowseComp : 60.6, puis 78.4 avec Agent Swarm ; WideSearch : 72.7, puis 79.0 avec Agent Swarm
  • Moonshot met aussi en avant une réduction de latence pouvant atteindre 4.5× sur des scénarios parallélisables

Licence & Disponibilité

  • Licence : Modified MIT License pour les poids et le code ; la métadonnée GitHub reste moins explicite que le README
  • Poids : publiés sur Hugging Face et GitHub (moonshotai/Kimi-K2.5 / MoonshotAI/Kimi-K2.5)
  • Accès : disponible via Kimi Web, app mobile, API Moonshot et Kimi Code ; accès gratuit limité mentionné sur le site officiel
  • Déploiement : support communautaire et fournisseurs tiers, avec recommandation d'utiliser l'API officielle pour reproduire les benchmarks

Pages Liées

kimi-k2-6 deepseek-v4 llama-4 qwen-3-7 function-calling transformer-architecture