Modèle de fondation de Zhipu AI (Beijing), ciblant l'ingénierie de systèmes complexes et les tâches agentiques longue durée. Succède à GLM-4.5/4.7 avec une architecture MoE de 744B paramètres (40B actifs), entraîné sur 28.5T tokens et publié sous licence MIT. Meilleur open-source mondial sur raisonnement, codage et agentic au moment de sa sortie (février 2026).
Spécifications
Version
Paramètres totaux
Actifs
Contexte
Précision
GLM-5
744B
40B
205K tokens
BF16
GLM-5-FP8
744B
40B
205K tokens
FP8
GLM-5.1
744B
40B
205K tokens
BF16 (amélioré)
Architecture
Type : Mixture of Experts (MoE) — 256 experts, 80 couches
Attention : DeepSeek Sparse Attention (DSA) — intègre l'innovation d'attention sparse de DeepSeek pour réduire coûts