---
title: llama.cpp
created: 2026-06-06
updated: 2026-06-06
type: entity
tags: [IA, open-source, tech]
confidence: high
contested: false
sources: []
---
# ⚙️ llama.cpp

**llama.cpp** est le moteur d'inférence C/C++ qui est à la base de l'écosystème local (utilisé par [[ollama]]).

## Rôle
C'est lui qui parse le format [[gguf]] et fait tourner le modèle sur CPU ou GPU avec une efficacité remarquable.

## Liens
- Utilisé par : [[ollama]]
- Format : [[gguf]]