⚡ Yi-Large

Modèle propriétaire phare de 01.AI lancé en 2024 pour concurrencer GPT-4 sur des usages généralistes, bilingues et orientés API. Yi-Large a servi de vitrine commerciale fermée pour la famille Yi avant d’être supplanté par yi-lightning sur le rapport coût/performance. Sa disponibilité est principalement API-only, avec une présence confirmée chez 01.AI et NVIDIA NIM.

Spécifications

Version	Paramètres	Contexte	Usage
Yi-Large	~102.6B (MoE, 32 experts / 4 actifs, selon catalogues tiers)	32K tokens	Chat généraliste, raisonnement, code, multilingue
Yi-Large-Preview	Non divulgué publiquement	32K tokens	Variante antérieure utilisée comme point de comparaison dans le rapport Yi-Lightning

Architecture

Type : modèle propriétaire de grande taille ; les catalogues tiers le décrivent comme un Mixture-of-Experts d’environ 102.6B paramètres
Topologie rapportée : 32 experts, 4 experts actifs par token, 64 couches, GQA, dimension cachée 8192 (données issues d’InferenceBench)
Modalité : texte seul
Contexte : 32 768 tokens
Positionnement : modèle fermé premium de 01.AI, axé sur la qualité générale et l’usage API plutôt que sur l’open-weight

Performances

Yi-Large-Preview (rapporté dans le papier Yi-Lightning) : GPQA 43.8, MATH 62.6, HumanEval 75.6, IFEval 79.3, WildBench 55.3, Arena-Hard 79.1, AlignBench 7.20, MT-Bench 8.32
AlpacaEval 2.0 : 01.AI a communiqué un rang 2e derrière GPT-4 Turbo en LC Win Rate au lancement
SuperCLUE / évaluations chinoises : communication de 01.AI reprise par KR-Asia, indiquant des scores supérieurs à GPT-4 sur plusieurs sous-benchmarks chinois
Catalogues tiers : InferenceBench mentionne MMLU 78, HumanEval 47, GSM8K 82 ; ces chiffres doivent être lus avec prudence car ils ne proviennent pas d’un rapport technique officiel détaillé de Yi-Large

Licence & Disponibilité

Licence : propriétaire, pas de poids ouverts
Accès : 01.AI Platform, NVIDIA NIM, et présence historique chez certains routeurs/API tiers
Tarification observée : environ $3 / M tokens en entrée et en sortie chez plusieurs agrégateurs ; 01.AI a aussi communiqué un prix de lancement d’environ 20 RMB / M tokens
Usage local : pas de distribution officielle open-weight connue pour Yi-Large

Pages Liées

yi-lightning qwen-3-7 deepseek-v4 mistral-large-3 llama-4

2.8 KiB Raw Blame History Unescape Escape