20 lines
427 B
Markdown
20 lines
427 B
Markdown
---
|
|
title: EXL2
|
|
created: 2026-06-06
|
|
updated: 2026-06-06
|
|
type: entity
|
|
tags: [IA, tech]
|
|
confidence: high
|
|
contested: false
|
|
sources: []
|
|
---
|
|
# ⚡ EXL2
|
|
|
|
**EXL2** est un format de quantification propriétaire (développé par exllamav2) offrant des performances optimales sur les GPU Nvidia.
|
|
|
|
## Avantage
|
|
Plus rapide que GGUF sur GPU, mais limité au matériel Nvidia et à l'inférence.
|
|
|
|
## Liens
|
|
- Concept : [[quantification-llm]]
|