Modèle propriétaire phare de 01.AI lancé en 2024 pour concurrencer GPT-4 sur des usages généralistes, bilingues et orientés API. Yi-Large a servi de vitrine commerciale fermée pour la famille Yi avant d’être supplanté par yi-lightning sur le rapport coût/performance. Sa disponibilité est principalement API-only, avec une présence confirmée chez 01.AI et NVIDIA NIM.
Spécifications
Version
Paramètres
Contexte
Usage
Yi-Large
~102.6B (MoE, 32 experts / 4 actifs, selon catalogues tiers)
32K tokens
Chat généraliste, raisonnement, code, multilingue
Yi-Large-Preview
Non divulgué publiquement
32K tokens
Variante antérieure utilisée comme point de comparaison dans le rapport Yi-Lightning
Architecture
Type : modèle propriétaire de grande taille ; les catalogues tiers le décrivent comme un Mixture-of-Experts d’environ 102.6B paramètres
Positionnement : modèle fermé premium de 01.AI, axé sur la qualité générale et l’usage API plutôt que sur l’open-weight
Performances
Yi-Large-Preview (rapporté dans le papier Yi-Lightning) : GPQA 43.8, MATH 62.6, HumanEval 75.6, IFEval 79.3, WildBench 55.3, Arena-Hard 79.1, AlignBench 7.20, MT-Bench 8.32
AlpacaEval 2.0 : 01.AI a communiqué un rang 2e derrière GPT-4 Turbo en LC Win Rate au lancement
SuperCLUE / évaluations chinoises : communication de 01.AI reprise par KR-Asia, indiquant des scores supérieurs à GPT-4 sur plusieurs sous-benchmarks chinois
Catalogues tiers : InferenceBench mentionne MMLU 78, HumanEval 47, GSM8K 82 ; ces chiffres doivent être lus avec prudence car ils ne proviennent pas d’un rapport technique officiel détaillé de Yi-Large
Licence & Disponibilité
Licence : propriétaire, pas de poids ouverts
Accès : 01.AI Platform, NVIDIA NIM, et présence historique chez certains routeurs/API tiers
Tarification observée : environ $3 / M tokens en entrée et en sortie chez plusieurs agrégateurs ; 01.AI a aussi communiqué un prix de lancement d’environ 20 RMB / M tokens
Usage local : pas de distribution officielle open-weight connue pour Yi-Large