wiki: 2026-06-12_1926
This commit is contained in:
@@ -0,0 +1,40 @@
|
||||
---
|
||||
title: Yi-Lightning
|
||||
created: 2026-06-11
|
||||
updated: 2026-06-11
|
||||
type: entity
|
||||
tags: [model, architecture, proprietary, chinese, moe]
|
||||
sources: [web research]
|
||||
confidence: high
|
||||
contested: false
|
||||
---
|
||||
# ⚡ Yi-Lightning
|
||||
|
||||
Modèle propriétaire **Mixture-of-Experts** de **01.AI**, présenté en octobre 2024 comme successeur plus rapide, moins cher et mieux aligné que Yi-Large. Yi-Lightning a surtout marqué par son **excellent rang Chatbot Arena** et par une stratégie agressive de **réduction des coûts d’inférence**, avec un prix plancher autour de **0,99 RMB / million de tokens**.
|
||||
|
||||
## Spécifications
|
||||
| Version | Paramètres | Contexte | Usage |
|
||||
|:---|:---:|:---:|:---|
|
||||
| Yi-Lightning | ~200B total (MoE, 32 experts / 4 actifs selon catalogues tiers) | 16K tokens en API publique, 64K après extension long-contexte dans le rapport technique | Chat généraliste, code, math, raisonnement, multilingue |
|
||||
|
||||
## Architecture
|
||||
- **Type** : **Mixture-of-Experts (MoE)** propriétaire
|
||||
- **Architecture rapportée** : fine-grained expert segmentation, routage amélioré, équilibrage **PEP** et optimisation du **KV-cache**
|
||||
- **Long contexte** : le rapport technique décrit une extension jusqu’à **64K tokens** par entraînement dédié ; les offres API publiques observées exposent surtout **16K**
|
||||
- **Serving** : arbitrage explicite entre **vitesse** et **qualité**, le rapport signalant que certains scores API peuvent être légèrement inférieurs aux évaluations en déploiement local interne
|
||||
- **Positionnement** : modèle fermé optimisé pour la préférence utilisateur réelle plutôt que pour la seule maximisation des benchmarks académiques
|
||||
|
||||
## Performances
|
||||
- **Chatbot Arena** : **6e mondial** au 16 octobre 2024, score **1287**, à égalité avec **Grok-2-08-13** et au-dessus du GPT-4o initial selon le rapport technique
|
||||
- **Sous-classements Arena** : **2e en chinois**, **3e en multi-turn** et **math**, **4e en coding**, **hard prompts** et **longer query**
|
||||
- **Benchmarks académiques** (rapport technique) : **GPQA 50.9**, **MATH 76.4**, **HumanEval 83.5**, **IFEval 81.9**, **WildBench 65.1**, **Arena-Hard 91.8**, **AlignBench 7.54**, **MT-Bench 8.75**
|
||||
- **Comparatif interne** : dépasse nettement **Yi-Large-Preview** sur la plupart des mesures publiées dans le technical report
|
||||
|
||||
## Licence & Disponibilité
|
||||
- **Licence** : **propriétaire**, API only
|
||||
- **Accès** : plateforme développeur **01.AI** ; disponibilité constatée aussi chez divers agrégateurs/API compatibles
|
||||
- **Tarification** : **0.99 RMB / million de tokens** au lancement, souvent converti autour de **$0.14 / M** dans les comparateurs internationaux
|
||||
- **Poids** : non ouverts ; pas de distribution officielle Hugging Face/ModelScope pour ce modèle fermé
|
||||
|
||||
## Pages Liées
|
||||
[[deepseek-v4]] [[qwen-3-7]] [[mistral-large-3]] [[llama-4]]
|
||||
Reference in New Issue
Block a user