wiki: 2026-06-12_1926

2026-06-12 19:26:55 +02:00
parent 250bc8bef6
commit e7b0b6c1be
30 changed files with 1710 additions and 3 deletions
@@ -0,0 +1,40 @@
+---
+title: Yi-Lightning
+created: 2026-06-11
+updated: 2026-06-11
+type: entity
+tags: [model, architecture, proprietary, chinese, moe]
+sources: [web research]
+confidence: high
+contested: false
+---
+# ⚡ Yi-Lightning
+
+Modèle propriétaire **Mixture-of-Experts** de **01.AI**, présenté en octobre 2024 comme successeur plus rapide, moins cher et mieux aligné que Yi-Large. Yi-Lightning a surtout marqué par son **excellent rang Chatbot Arena** et par une stratégie agressive de **réduction des coûts d’inférence**, avec un prix plancher autour de **0,99 RMB / million de tokens**.
+
+## Spécifications
+| Version | Paramètres | Contexte | Usage |
+|:---|:---:|:---:|:---|
+| Yi-Lightning | ~200B total (MoE, 32 experts / 4 actifs selon catalogues tiers) | 16K tokens en API publique, 64K après extension long-contexte dans le rapport technique | Chat généraliste, code, math, raisonnement, multilingue |
+
+## Architecture
+- **Type** : **Mixture-of-Experts (MoE)** propriétaire
+- **Architecture rapportée** : fine-grained expert segmentation, routage amélioré, équilibrage **PEP** et optimisation du **KV-cache**
+- **Long contexte** : le rapport technique décrit une extension jusqu’à **64K tokens** par entraînement dédié ; les offres API publiques observées exposent surtout **16K**
+- **Serving** : arbitrage explicite entre **vitesse** et **qualité**, le rapport signalant que certains scores API peuvent être légèrement inférieurs aux évaluations en déploiement local interne
+- **Positionnement** : modèle fermé optimisé pour la préférence utilisateur réelle plutôt que pour la seule maximisation des benchmarks académiques
+
+## Performances
+- **Chatbot Arena** : **6e mondial** au 16 octobre 2024, score **1287**, à égalité avec **Grok-2-08-13** et au-dessus du GPT-4o initial selon le rapport technique
+- **Sous-classements Arena** : **2e en chinois**, **3e en multi-turn** et **math**, **4e en coding**, **hard prompts** et **longer query**
+- **Benchmarks académiques** (rapport technique) : **GPQA 50.9**, **MATH 76.4**, **HumanEval 83.5**, **IFEval 81.9**, **WildBench 65.1**, **Arena-Hard 91.8**, **AlignBench 7.54**, **MT-Bench 8.75**
+- **Comparatif interne** : dépasse nettement **Yi-Large-Preview** sur la plupart des mesures publiées dans le technical report
+
+## Licence & Disponibilité
+- **Licence** : **propriétaire**, API only
+- **Accès** : plateforme développeur **01.AI** ; disponibilité constatée aussi chez divers agrégateurs/API compatibles
+- **Tarification** : **0.99 RMB / million de tokens** au lancement, souvent converti autour de **$0.14 / M** dans les comparateurs internationaux
+- **Poids** : non ouverts ; pas de distribution officielle Hugging Face/ModelScope pour ce modèle fermé
+
+## Pages Liées
+[[deepseek-v4]] [[qwen-3-7]] [[mistral-large-3]] [[llama-4]]