Files
wiki/entities/llama-cpp.md
T
2026-06-09 18:40:21 +02:00

21 lines
474 B
Markdown

---
title: llama.cpp
created: 2026-06-06
updated: 2026-06-06
type: entity
tags: [IA, open-source, tech]
confidence: high
contested: false
sources: []
---
# ⚙️ llama.cpp
**llama.cpp** est le moteur d'inférence C/C++ qui est à la base de l'écosystème local (utilisé par [[ollama]]).
## Rôle
C'est lui qui parse le format [[gguf]] et fait tourner le modèle sur CPU ou GPU avec une efficacité remarquable.
## Liens
- Utilisé par : [[ollama]]
- Format : [[gguf]]