Files
wiki/entities/yi-lightning.md
T
2026-06-12 19:26:55 +02:00

40 lines
2.8 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: Yi-Lightning
created: 2026-06-11
updated: 2026-06-11
type: entity
tags: [model, architecture, proprietary, chinese, moe]
sources: [web research]
confidence: high
contested: false
---
# ⚡ Yi-Lightning
Modèle propriétaire **Mixture-of-Experts** de **01.AI**, présenté en octobre 2024 comme successeur plus rapide, moins cher et mieux aligné que Yi-Large. Yi-Lightning a surtout marqué par son **excellent rang Chatbot Arena** et par une stratégie agressive de **réduction des coûts dinférence**, avec un prix plancher autour de **0,99 RMB / million de tokens**.
## Spécifications
| Version | Paramètres | Contexte | Usage |
|:---|:---:|:---:|:---|
| Yi-Lightning | ~200B total (MoE, 32 experts / 4 actifs selon catalogues tiers) | 16K tokens en API publique, 64K après extension long-contexte dans le rapport technique | Chat généraliste, code, math, raisonnement, multilingue |
## Architecture
- **Type** : **Mixture-of-Experts (MoE)** propriétaire
- **Architecture rapportée** : fine-grained expert segmentation, routage amélioré, équilibrage **PEP** et optimisation du **KV-cache**
- **Long contexte** : le rapport technique décrit une extension jusqu’à **64K tokens** par entraînement dédié ; les offres API publiques observées exposent surtout **16K**
- **Serving** : arbitrage explicite entre **vitesse** et **qualité**, le rapport signalant que certains scores API peuvent être légèrement inférieurs aux évaluations en déploiement local interne
- **Positionnement** : modèle fermé optimisé pour la préférence utilisateur réelle plutôt que pour la seule maximisation des benchmarks académiques
## Performances
- **Chatbot Arena** : **6e mondial** au 16 octobre 2024, score **1287**, à égalité avec **Grok-2-08-13** et au-dessus du GPT-4o initial selon le rapport technique
- **Sous-classements Arena** : **2e en chinois**, **3e en multi-turn** et **math**, **4e en coding**, **hard prompts** et **longer query**
- **Benchmarks académiques** (rapport technique) : **GPQA 50.9**, **MATH 76.4**, **HumanEval 83.5**, **IFEval 81.9**, **WildBench 65.1**, **Arena-Hard 91.8**, **AlignBench 7.54**, **MT-Bench 8.75**
- **Comparatif interne** : dépasse nettement **Yi-Large-Preview** sur la plupart des mesures publiées dans le technical report
## Licence & Disponibilité
- **Licence** : **propriétaire**, API only
- **Accès** : plateforme développeur **01.AI** ; disponibilité constatée aussi chez divers agrégateurs/API compatibles
- **Tarification** : **0.99 RMB / million de tokens** au lancement, souvent converti autour de **$0.14 / M** dans les comparateurs internationaux
- **Poids** : non ouverts ; pas de distribution officielle Hugging Face/ModelScope pour ce modèle fermé
## Pages Liées
[[deepseek-v4]] [[qwen-3-7]] [[mistral-large-3]] [[llama-4]]