wiki: 2026-06-12_1926

This commit is contained in:
2026-06-12 19:26:55 +02:00
parent 250bc8bef6
commit e7b0b6c1be
30 changed files with 1710 additions and 3 deletions
+41
View File
@@ -0,0 +1,41 @@
---
title: Yi-Large
created: 2026-06-11
updated: 2026-06-11
type: entity
tags: [model, architecture, proprietary, chinese]
sources: [web research]
confidence: medium
contested: false
---
# ⚡ Yi-Large
Modèle propriétaire phare de **01.AI** lancé en 2024 pour concurrencer GPT-4 sur des usages généralistes, bilingues et orientés API. Yi-Large a servi de vitrine commerciale fermée pour la famille Yi avant d’être supplanté par [[yi-lightning]] sur le rapport coût/performance. Sa disponibilité est principalement **API-only**, avec une présence confirmée chez 01.AI et NVIDIA NIM.
## Spécifications
| Version | Paramètres | Contexte | Usage |
|:---|:---:|:---:|:---|
| Yi-Large | ~102.6B (MoE, 32 experts / 4 actifs, selon catalogues tiers) | 32K tokens | Chat généraliste, raisonnement, code, multilingue |
| Yi-Large-Preview | Non divulgué publiquement | 32K tokens | Variante antérieure utilisée comme point de comparaison dans le rapport Yi-Lightning |
## Architecture
- **Type** : modèle propriétaire de grande taille ; les catalogues tiers le décrivent comme un **Mixture-of-Experts** denviron **102.6B** paramètres
- **Topologie rapportée** : **32 experts**, **4 experts actifs par token**, **64 couches**, **GQA**, dimension cachée **8192** (données issues dInferenceBench)
- **Modalité** : **texte seul**
- **Contexte** : **32 768 tokens**
- **Positionnement** : modèle fermé premium de 01.AI, axé sur la qualité générale et lusage API plutôt que sur lopen-weight
## Performances
- **Yi-Large-Preview** (rapporté dans le papier Yi-Lightning) : **GPQA 43.8**, **MATH 62.6**, **HumanEval 75.6**, **IFEval 79.3**, **WildBench 55.3**, **Arena-Hard 79.1**, **AlignBench 7.20**, **MT-Bench 8.32**
- **AlpacaEval 2.0** : 01.AI a communiqué un rang **2e derrière GPT-4 Turbo** en **LC Win Rate** au lancement
- **SuperCLUE / évaluations chinoises** : communication de 01.AI reprise par KR-Asia, indiquant des scores supérieurs à GPT-4 sur plusieurs sous-benchmarks chinois
- **Catalogues tiers** : InferenceBench mentionne **MMLU 78**, **HumanEval 47**, **GSM8K 82** ; ces chiffres doivent être lus avec prudence car ils ne proviennent pas dun rapport technique officiel détaillé de Yi-Large
## Licence & Disponibilité
- **Licence** : **propriétaire**, pas de poids ouverts
- **Accès** : **01.AI Platform**, **NVIDIA NIM**, et présence historique chez certains routeurs/API tiers
- **Tarification observée** : environ **$3 / M tokens** en entrée et en sortie chez plusieurs agrégateurs ; 01.AI a aussi communiqué un prix de lancement denviron **20 RMB / M tokens**
- **Usage local** : pas de distribution officielle open-weight connue pour Yi-Large
## Pages Liées
[[yi-lightning]] [[qwen-3-7]] [[deepseek-v4]] [[mistral-large-3]] [[llama-4]]