wiki: 2026-06-12_1926

2026-06-12 19:26:55 +02:00
parent 250bc8bef6
commit e7b0b6c1be
30 changed files with 1710 additions and 3 deletions
@@ -0,0 +1,41 @@
+---
+title: Yi-Large
+created: 2026-06-11
+updated: 2026-06-11
+type: entity
+tags: [model, architecture, proprietary, chinese]
+sources: [web research]
+confidence: medium
+contested: false
+---
+# ⚡ Yi-Large
+
+Modèle propriétaire phare de **01.AI** lancé en 2024 pour concurrencer GPT-4 sur des usages généralistes, bilingues et orientés API. Yi-Large a servi de vitrine commerciale fermée pour la famille Yi avant d’être supplanté par [[yi-lightning]] sur le rapport coût/performance. Sa disponibilité est principalement **API-only**, avec une présence confirmée chez 01.AI et NVIDIA NIM.
+
+## Spécifications
+| Version | Paramètres | Contexte | Usage |
+|:---|:---:|:---:|:---|
+| Yi-Large | ~102.6B (MoE, 32 experts / 4 actifs, selon catalogues tiers) | 32K tokens | Chat généraliste, raisonnement, code, multilingue |
+| Yi-Large-Preview | Non divulgué publiquement | 32K tokens | Variante antérieure utilisée comme point de comparaison dans le rapport Yi-Lightning |
+
+## Architecture
+- **Type** : modèle propriétaire de grande taille ; les catalogues tiers le décrivent comme un **Mixture-of-Experts** d’environ **102.6B** paramètres
+- **Topologie rapportée** : **32 experts**, **4 experts actifs par token**, **64 couches**, **GQA**, dimension cachée **8192** (données issues d’InferenceBench)
+- **Modalité** : **texte seul**
+- **Contexte** : **32 768 tokens**
+- **Positionnement** : modèle fermé premium de 01.AI, axé sur la qualité générale et l’usage API plutôt que sur l’open-weight
+
+## Performances
+- **Yi-Large-Preview** (rapporté dans le papier Yi-Lightning) : **GPQA 43.8**, **MATH 62.6**, **HumanEval 75.6**, **IFEval 79.3**, **WildBench 55.3**, **Arena-Hard 79.1**, **AlignBench 7.20**, **MT-Bench 8.32**
+- **AlpacaEval 2.0** : 01.AI a communiqué un rang **2e derrière GPT-4 Turbo** en **LC Win Rate** au lancement
+- **SuperCLUE / évaluations chinoises** : communication de 01.AI reprise par KR-Asia, indiquant des scores supérieurs à GPT-4 sur plusieurs sous-benchmarks chinois
+- **Catalogues tiers** : InferenceBench mentionne **MMLU 78**, **HumanEval 47**, **GSM8K 82** ; ces chiffres doivent être lus avec prudence car ils ne proviennent pas d’un rapport technique officiel détaillé de Yi-Large
+
+## Licence & Disponibilité
+- **Licence** : **propriétaire**, pas de poids ouverts
+- **Accès** : **01.AI Platform**, **NVIDIA NIM**, et présence historique chez certains routeurs/API tiers
+- **Tarification observée** : environ **$3 / M tokens** en entrée et en sortie chez plusieurs agrégateurs ; 01.AI a aussi communiqué un prix de lancement d’environ **20 RMB / M tokens**
+- **Usage local** : pas de distribution officielle open-weight connue pour Yi-Large
+
+## Pages Liées
+[[yi-lightning]] [[qwen-3-7]] [[deepseek-v4]] [[mistral-large-3]] [[llama-4]]