40 lines
2.8 KiB
Markdown
40 lines
2.8 KiB
Markdown
---
|
||
title: Yi-Lightning
|
||
created: 2026-06-11
|
||
updated: 2026-06-11
|
||
type: entity
|
||
tags: [model, architecture, proprietary, chinese, moe]
|
||
sources: [web research]
|
||
confidence: high
|
||
contested: false
|
||
---
|
||
# ⚡ Yi-Lightning
|
||
|
||
Modèle propriétaire **Mixture-of-Experts** de **01.AI**, présenté en octobre 2024 comme successeur plus rapide, moins cher et mieux aligné que Yi-Large. Yi-Lightning a surtout marqué par son **excellent rang Chatbot Arena** et par une stratégie agressive de **réduction des coûts d’inférence**, avec un prix plancher autour de **0,99 RMB / million de tokens**.
|
||
|
||
## Spécifications
|
||
| Version | Paramètres | Contexte | Usage |
|
||
|:---|:---:|:---:|:---|
|
||
| Yi-Lightning | ~200B total (MoE, 32 experts / 4 actifs selon catalogues tiers) | 16K tokens en API publique, 64K après extension long-contexte dans le rapport technique | Chat généraliste, code, math, raisonnement, multilingue |
|
||
|
||
## Architecture
|
||
- **Type** : **Mixture-of-Experts (MoE)** propriétaire
|
||
- **Architecture rapportée** : fine-grained expert segmentation, routage amélioré, équilibrage **PEP** et optimisation du **KV-cache**
|
||
- **Long contexte** : le rapport technique décrit une extension jusqu’à **64K tokens** par entraînement dédié ; les offres API publiques observées exposent surtout **16K**
|
||
- **Serving** : arbitrage explicite entre **vitesse** et **qualité**, le rapport signalant que certains scores API peuvent être légèrement inférieurs aux évaluations en déploiement local interne
|
||
- **Positionnement** : modèle fermé optimisé pour la préférence utilisateur réelle plutôt que pour la seule maximisation des benchmarks académiques
|
||
|
||
## Performances
|
||
- **Chatbot Arena** : **6e mondial** au 16 octobre 2024, score **1287**, à égalité avec **Grok-2-08-13** et au-dessus du GPT-4o initial selon le rapport technique
|
||
- **Sous-classements Arena** : **2e en chinois**, **3e en multi-turn** et **math**, **4e en coding**, **hard prompts** et **longer query**
|
||
- **Benchmarks académiques** (rapport technique) : **GPQA 50.9**, **MATH 76.4**, **HumanEval 83.5**, **IFEval 81.9**, **WildBench 65.1**, **Arena-Hard 91.8**, **AlignBench 7.54**, **MT-Bench 8.75**
|
||
- **Comparatif interne** : dépasse nettement **Yi-Large-Preview** sur la plupart des mesures publiées dans le technical report
|
||
|
||
## Licence & Disponibilité
|
||
- **Licence** : **propriétaire**, API only
|
||
- **Accès** : plateforme développeur **01.AI** ; disponibilité constatée aussi chez divers agrégateurs/API compatibles
|
||
- **Tarification** : **0.99 RMB / million de tokens** au lancement, souvent converti autour de **$0.14 / M** dans les comparateurs internationaux
|
||
- **Poids** : non ouverts ; pas de distribution officielle Hugging Face/ModelScope pour ce modèle fermé
|
||
|
||
## Pages Liées
|
||
[[deepseek-v4]] [[qwen-3-7]] [[mistral-large-3]] [[llama-4]] |