47 lines
2.5 KiB
Markdown
47 lines
2.5 KiB
Markdown
---
|
|
title: DeepSeek R1
|
|
created: 2026-06-11
|
|
updated: 2026-06-11
|
|
type: entity
|
|
tags: [model, reasoning, open-source, chinese]
|
|
sources: [web research]
|
|
confidence: medium
|
|
contested: false
|
|
---
|
|
# 🧠 DeepSeek R1
|
|
|
|
Modèle de raisonnement open-weight de **DeepSeek**, publié en janvier 2025. Il reprend la base MoE de la lignée V3, puis ajoute une chaîne d'entraînement orientée raisonnement avec *cold start*, SFT et RL. Il est surtout connu pour avoir popularisé un positionnement « open o1-like » sur les tâches de maths, code et raisonnement long.
|
|
|
|
## Spécifications
|
|
| Élément | Valeur |
|
|
|:---|:---|
|
|
| Paramètres totaux | 671B (≈685B affichés sur Hugging Face) |
|
|
| Paramètres actifs | 37B |
|
|
| Contexte | 128K tokens |
|
|
| Génération max recommandée | 32 768 tokens |
|
|
| Famille | Modèle de raisonnement dérivé de DeepSeek V3 |
|
|
|
|
## Architecture
|
|
- **Type** : [[transformer-architecture]] de type MoE, avec architecture de base partagée avec la série V3
|
|
- **Entraînement** : pipeline en 4 étapes : *cold-start SFT*, RL orienté raisonnement, SFT par rejet/curation, puis RL d'alignement plus général
|
|
- **Origine technique** : DeepSeek indique que R1 est construit sur **DeepSeek-V3-Base**
|
|
- **Particularité** : privilégie le zéro-shot ; le papier note que le few-shot peut dégrader les performances
|
|
- **Écosystème** : a servi de source de distillation pour plusieurs variantes Qwen et Llama
|
|
|
|
## Performances
|
|
- **MMLU** : 90.8 ; **MMLU-Pro** : 84.0 ; **GPQA-Diamond** : 71.5
|
|
- **AIME 2024** : 79.8 ; **MATH-500** : 97.3 ; **CNMO 2024** : 78.8
|
|
- **LiveCodeBench (Pass@1-COT)** : 65.9 ; **Codeforces** : 96.3 percentile / 2029 Elo
|
|
- **SWE Verified** : 49.2 ; **Aider-Polyglot** : 53.3
|
|
- **AlpacaEval 2.0** : 87.6 ; **ArenaHard** : 92.3
|
|
- Se positionne comme référence ouverte antérieure à [[deepseek-v4]] et reste souvent comparé à [[llama-4]] et [[qwen-3-7]]
|
|
|
|
## Licence & Disponibilité
|
|
- **Licence** : MIT pour le dépôt et les poids ; usage commercial autorisé selon la documentation officielle
|
|
- **Poids** : disponibles sur Hugging Face (`deepseek-ai/DeepSeek-R1`) ; variantes distillées publiées séparément
|
|
- **API** : diffusé via DeepSeek Platform et plusieurs agrégateurs ; contexte API souvent étendu selon le fournisseur
|
|
- **Disponibilité** : modèle ouvert, exploitable en self-hosting via vLLM, SGLang et autres stacks compatibles
|
|
|
|
## Pages Liées
|
|
[[deepseek-v4]] [[deepseek-v4-flash]] [[llama-4]] [[qwen-3-7]] [[function-calling]] [[transformer-architecture]]
|