21 lines
474 B
Markdown
21 lines
474 B
Markdown
---
|
|
title: llama.cpp
|
|
created: 2026-06-06
|
|
updated: 2026-06-06
|
|
type: entity
|
|
tags: [IA, open-source, tech]
|
|
confidence: high
|
|
contested: false
|
|
sources: []
|
|
---
|
|
# ⚙️ llama.cpp
|
|
|
|
**llama.cpp** est le moteur d'inférence C/C++ qui est à la base de l'écosystème local (utilisé par [[ollama]]).
|
|
|
|
## Rôle
|
|
C'est lui qui parse le format [[gguf]] et fait tourner le modèle sur CPU ou GPU avec une efficacité remarquable.
|
|
|
|
## Liens
|
|
- Utilisé par : [[ollama]]
|
|
- Format : [[gguf]]
|