37 lines
1.8 KiB
Markdown
37 lines
1.8 KiB
Markdown
---
|
|
title: Hébergement LLM Solo Dev
|
|
created: 2026-06-06
|
|
updated: 2026-06-06
|
|
type: comparison
|
|
tags: [IA, cloud, auto-hébergement, solo]
|
|
confidence: high
|
|
contested: false
|
|
sources: [synthesized]
|
|
---
|
|
# ⚖️ Hébergement LLM Solo Dev : Local vs RunPod vs Modal vs Replicate vs Hugging Face
|
|
|
|
Faire tourner un LLM sans se ruiner et sans se prendre la tête.
|
|
|
|
## Tableau Comparatif
|
|
| Critère | **Local (Ollama + GPU)** | **RunPod** | **Modal** | **Replicate** | **Hugging Face Inference** |
|
|
| :--- | :--- | :--- | :--- | :--- | :--- |
|
|
| **Simplicité** | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ (code-first) | ⭐⭐⭐⭐⭐ (API simple) | ⭐⭐⭐⭐ |
|
|
| **Coût / 1M tokens** | ⭐⭐⭐⭐⭐ (gratuit) | ⭐⭐⭐ (~0.30$) | ⭐⭐⭐ | ⭐⭐⭐⭐ (cold start gratuit) | ⭐⭐⭐ (HF Pro) |
|
|
| **Maintenance** | ⭐ (à toi) | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
|
|
| **VRAM dispo** | Limitée (ton GPU) | Jusqu'à H100 | Jusqu'à H100 | Variable | Variable |
|
|
| **Confidentialité** | ⭐⭐⭐⭐⭐ (données locales) | ⚠️ | ⚠️ | ⚠️ | ⚠️ |
|
|
| **Idéal pour** | Dev local, homelab | Modèles 70B+ ponctuels | Pipelines code-first | API rapide à intégrer | Fine-tuning + inférence |
|
|
|
|
## Recommandations Solo Dev
|
|
- **Développement quotidien, confidentialité** : **Local (Ollama)** (gratuit, illimité, idéal avec RTX 3060+).
|
|
- **Besoin ponctuel d'un gros modèle (70B+)** : **RunPod** (facturation à la minute, H100 dispo).
|
|
- **Tu veux écrire ton code comme si c'était local, mais cloud** : **Modal** (Pythonic, serverless GPU).
|
|
- **API REST simple et stable pour un SaaS** : **Replicate** (une URL, une ligne de fetch).
|
|
- **Tu veux fine-tuner ET héberger** : **Hugging Face** (Spaces + Endpoints + Training).
|
|
|
|
## Liens
|
|
- [[comparatif-llm-local]]
|
|
- [[ollama]]
|
|
- [[stack-ia-maison]]
|
|
- [[comparatif-stockage]]
|