Famille de modèles de fondation de Qwen / Alibaba, publiée à partir de février 2026. Qwen 3.5 combine une stratégie open-weight Apache 2.0 pour plusieurs tailles et une déclinaison hébergée plus orientée production. La série se distingue par une architecture hybride Gated DeltaNet + MoE, un support multimodal natif, une couverture de 201 langues et dialectes, et un fort accent sur les usages agentiques et le codage.
Spécifications
Version
Paramètres
Contexte
Usage
Qwen3.5-397B-A17B
397B total / 17B actifs
262K natif, ~1M via YaRN
Flagship open-weight, multimodal, agents
Qwen3.5-122B-A10B
122B total / 10B actifs
262K natif, ~1M via YaRN
Raisonnement, code, agentique
Qwen3.5-35B-A3B
35B total / 3B actifs
262K natif, ~1M via YaRN
Déploiement plus accessible, multimodal
Qwen3.5-27B
27B dense
262K natif, ~1M via YaRN
Version dense généraliste
Qwen3.5-9B / 4B / 2B / 0.8B
9B à 0.8B
262K natif, ~1M via YaRN
Petites variantes locales
Qwen3.5-Plus / Flash
Variante hébergée
jusqu’à 1M tokens
API managée avec outils intégrés
Architecture
Type : architecture hybride Gated Delta Networks + sparse Mixture-of-Experts
Multimodal natif : entraînement à fusion précoce sur texte, image et vidéo
Langues : 201 langues et dialectes
Contexte : 262 144 tokens natifs sur les open weights, extensibles à environ 1 010 000 via YaRN ; les variantes hébergées offrent 1M par défaut
Exemple Qwen3.5-35B-A3B : 256 experts, 8 experts routés + 1 expert partagé, licence apache-2, distribution compatible Transformers, vLLM, SGLang, KTransformers
Distribution : poids officiels sur Hugging Face et ModelScope pour la série open-weight
Famille Qwen 3.5 : le dépôt officiel met en avant une amélioration simultanée sur le raisonnement, le code, les agents et la vision par rapport à la génération Qwen 3
Hosted variants : les fiches officielles indiquent que Qwen3.5-Flash correspond à une déclinaison production du 35B-A3B, avec 1M de contexte et des outils intégrés
Licence & Disponibilité
Licence : Apache 2.0 pour les modèles open-weight — apache-2
Poids : disponibles sur Hugging Face et ModelScope
API : Alibaba Cloud Model Studio pour les variantes hébergées (notamment Qwen3.5-Plus et Qwen3.5-Flash)
Usage local : déploiement possible avec ollama, llama-cpp, gguf et exl2 via l’écosystème et les conversions communautaires selon les variantes
Dates de sortie : 2026-02-16 pour le 397B-A17B initial ; 2026-02-24 pour 122B-A10B / 35B-A3B / 27B ; 2026-03-02 pour 9B / 4B / 2B / 0.8B