--- title: Yi-Large created: 2026-06-11 updated: 2026-06-11 type: entity tags: [model, architecture, proprietary, chinese] sources: [web research] confidence: medium contested: false --- # ⚡ Yi-Large Modèle propriétaire phare de **01.AI** lancé en 2024 pour concurrencer GPT-4 sur des usages généralistes, bilingues et orientés API. Yi-Large a servi de vitrine commerciale fermée pour la famille Yi avant d’être supplanté par [[yi-lightning]] sur le rapport coût/performance. Sa disponibilité est principalement **API-only**, avec une présence confirmée chez 01.AI et NVIDIA NIM. ## Spécifications | Version | Paramètres | Contexte | Usage | |:---|:---:|:---:|:---| | Yi-Large | ~102.6B (MoE, 32 experts / 4 actifs, selon catalogues tiers) | 32K tokens | Chat généraliste, raisonnement, code, multilingue | | Yi-Large-Preview | Non divulgué publiquement | 32K tokens | Variante antérieure utilisée comme point de comparaison dans le rapport Yi-Lightning | ## Architecture - **Type** : modèle propriétaire de grande taille ; les catalogues tiers le décrivent comme un **Mixture-of-Experts** d’environ **102.6B** paramètres - **Topologie rapportée** : **32 experts**, **4 experts actifs par token**, **64 couches**, **GQA**, dimension cachée **8192** (données issues d’InferenceBench) - **Modalité** : **texte seul** - **Contexte** : **32 768 tokens** - **Positionnement** : modèle fermé premium de 01.AI, axé sur la qualité générale et l’usage API plutôt que sur l’open-weight ## Performances - **Yi-Large-Preview** (rapporté dans le papier Yi-Lightning) : **GPQA 43.8**, **MATH 62.6**, **HumanEval 75.6**, **IFEval 79.3**, **WildBench 55.3**, **Arena-Hard 79.1**, **AlignBench 7.20**, **MT-Bench 8.32** - **AlpacaEval 2.0** : 01.AI a communiqué un rang **2e derrière GPT-4 Turbo** en **LC Win Rate** au lancement - **SuperCLUE / évaluations chinoises** : communication de 01.AI reprise par KR-Asia, indiquant des scores supérieurs à GPT-4 sur plusieurs sous-benchmarks chinois - **Catalogues tiers** : InferenceBench mentionne **MMLU 78**, **HumanEval 47**, **GSM8K 82** ; ces chiffres doivent être lus avec prudence car ils ne proviennent pas d’un rapport technique officiel détaillé de Yi-Large ## Licence & Disponibilité - **Licence** : **propriétaire**, pas de poids ouverts - **Accès** : **01.AI Platform**, **NVIDIA NIM**, et présence historique chez certains routeurs/API tiers - **Tarification observée** : environ **$3 / M tokens** en entrée et en sortie chez plusieurs agrégateurs ; 01.AI a aussi communiqué un prix de lancement d’environ **20 RMB / M tokens** - **Usage local** : pas de distribution officielle open-weight connue pour Yi-Large ## Pages Liées [[yi-lightning]] [[qwen-3-7]] [[deepseek-v4]] [[mistral-large-3]] [[llama-4]]