wiki: 2026-06-12_1926

2026-06-12 19:26:55 +02:00
parent 250bc8bef6
commit e7b0b6c1be
30 changed files with 1710 additions and 3 deletions
@@ -0,0 +1,47 @@
+---
+title: DeepSeek V3.1
+created: 2026-06-11
+updated: 2026-06-11
+type: entity
+tags: [model, hybrid-reasoning, open-source, chinese]
+sources: [web research]
+confidence: medium
+contested: false
+---
+# ⚙️ DeepSeek V3.1
+
+Modèle hybride open-weight de **DeepSeek**, lancé en août 2025. Sa particularité est d'unifier un mode *thinking* et un mode *non-thinking* dans un même checkpoint, avec sélection par *chat template*. Il vise un compromis entre vitesse, qualité générale, usage d'outils et performances agentiques.
+
+## Spécifications
+| Élément | Valeur |
+|:---|:---|
+| Paramètres totaux | 671B (≈685B affichés par certaines interfaces) |
+| Paramètres actifs | 37B |
+| Contexte | 128K tokens |
+| Modes | Thinking + non-thinking dans un seul modèle |
+| Date de sortie | 2025-08-21 |
+
+## Architecture
+- **Type** : [[transformer-architecture]] MoE de grande taille, post-entraîné à partir de **DeepSeek-V3.1-Base**
+- **Long contexte** : extension 32K portée à **630B tokens** et extension 128K portée à **209B tokens**
+- **Format numérique** : DeepSeek met en avant un entraînement en **UE8M0 FP8** pour les poids et activations
+- **Mode hybride** : changement de comportement via template, sans checkpoint séparé pour le raisonnement
+- **Outils** : support explicite du [[function-calling]] en mode non-thinking, plus scénarios agentiques de recherche et de code
+
+## Performances
+- **MMLU-Redux** : 91.8 en non-thinking, 93.7 en thinking
+- **MMLU-Pro** : 83.7 / 84.8 ; **GPQA-Diamond** : 74.9 / 80.1
+- **LiveCodeBench** : 56.4 / 74.8 ; **Aider-Polyglot** : 68.4 / 76.3
+- **Codeforces Div1** : 2091 en mode thinking
+- **SWE Verified (agent mode)** : 66.0 ; **SWE-bench Multilingual** : 54.5 ; **Terminal-bench** : 31.3
+- **AIME 2024** : 66.3 / 93.1 ; **AIME 2025** : 49.8 / 88.4 ; **HMMT 2025** : 33.5 / 84.2
+- En pratique, le mode thinking se rapproche de **DeepSeek R1 0528** tout en répondant plus vite selon DeepSeek
+
+## Licence & Disponibilité
+- **Licence** : MIT pour les poids et le dépôt officiel
+- **Poids** : disponibles sur Hugging Face et ModelScope (`deepseek-ai/DeepSeek-V3.1`)
+- **API** : exposé sur DeepSeek Platform et chez divers fournisseurs ; prix observés autour de **$0.56 / $1.67** par million de tokens selon Artificial Analysis
+- **Positionnement** : open-weight polyvalent, plus récent que R1 et antérieur à [[deepseek-v4]] / [[deepseek-v4-flash]]
+
+## Pages Liées
+[[deepseek-r1]] [[deepseek-v4]] [[deepseek-v4-flash]] [[llama-4]] [[qwen-3-7]] [[function-calling]] [[transformer-architecture]]