--- title: llama.cpp created: 2026-06-06 updated: 2026-06-06 type: entity tags: [IA, open-source, tech] confidence: high contested: false sources: [] --- # ⚙️ llama.cpp **llama.cpp** est le moteur d'inférence C/C++ qui est à la base de l'écosystème local (utilisé par [[ollama]]). ## Rôle C'est lui qui parse le format [[gguf]] et fait tourner le modèle sur CPU ou GPU avec une efficacité remarquable. ## Liens - Utilisé par : [[ollama]] - Format : [[gguf]]