Files
2026-06-12 19:26:55 +02:00

41 lines
2.8 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: Yi-Large
created: 2026-06-11
updated: 2026-06-11
type: entity
tags: [model, architecture, proprietary, chinese]
sources: [web research]
confidence: medium
contested: false
---
# ⚡ Yi-Large
Modèle propriétaire phare de **01.AI** lancé en 2024 pour concurrencer GPT-4 sur des usages généralistes, bilingues et orientés API. Yi-Large a servi de vitrine commerciale fermée pour la famille Yi avant d’être supplanté par [[yi-lightning]] sur le rapport coût/performance. Sa disponibilité est principalement **API-only**, avec une présence confirmée chez 01.AI et NVIDIA NIM.
## Spécifications
| Version | Paramètres | Contexte | Usage |
|:---|:---:|:---:|:---|
| Yi-Large | ~102.6B (MoE, 32 experts / 4 actifs, selon catalogues tiers) | 32K tokens | Chat généraliste, raisonnement, code, multilingue |
| Yi-Large-Preview | Non divulgué publiquement | 32K tokens | Variante antérieure utilisée comme point de comparaison dans le rapport Yi-Lightning |
## Architecture
- **Type** : modèle propriétaire de grande taille ; les catalogues tiers le décrivent comme un **Mixture-of-Experts** denviron **102.6B** paramètres
- **Topologie rapportée** : **32 experts**, **4 experts actifs par token**, **64 couches**, **GQA**, dimension cachée **8192** (données issues dInferenceBench)
- **Modalité** : **texte seul**
- **Contexte** : **32 768 tokens**
- **Positionnement** : modèle fermé premium de 01.AI, axé sur la qualité générale et lusage API plutôt que sur lopen-weight
## Performances
- **Yi-Large-Preview** (rapporté dans le papier Yi-Lightning) : **GPQA 43.8**, **MATH 62.6**, **HumanEval 75.6**, **IFEval 79.3**, **WildBench 55.3**, **Arena-Hard 79.1**, **AlignBench 7.20**, **MT-Bench 8.32**
- **AlpacaEval 2.0** : 01.AI a communiqué un rang **2e derrière GPT-4 Turbo** en **LC Win Rate** au lancement
- **SuperCLUE / évaluations chinoises** : communication de 01.AI reprise par KR-Asia, indiquant des scores supérieurs à GPT-4 sur plusieurs sous-benchmarks chinois
- **Catalogues tiers** : InferenceBench mentionne **MMLU 78**, **HumanEval 47**, **GSM8K 82** ; ces chiffres doivent être lus avec prudence car ils ne proviennent pas dun rapport technique officiel détaillé de Yi-Large
## Licence & Disponibilité
- **Licence** : **propriétaire**, pas de poids ouverts
- **Accès** : **01.AI Platform**, **NVIDIA NIM**, et présence historique chez certains routeurs/API tiers
- **Tarification observée** : environ **$3 / M tokens** en entrée et en sortie chez plusieurs agrégateurs ; 01.AI a aussi communiqué un prix de lancement denviron **20 RMB / M tokens**
- **Usage local** : pas de distribution officielle open-weight connue pour Yi-Large
## Pages Liées
[[yi-lightning]] [[qwen-3-7]] [[deepseek-v4]] [[mistral-large-3]] [[llama-4]]