Initial vault setup
This commit is contained in:
@@ -0,0 +1,36 @@
|
||||
---
|
||||
title: Hébergement LLM Solo Dev
|
||||
created: 2026-06-06
|
||||
updated: 2026-06-06
|
||||
type: comparison
|
||||
tags: [IA, cloud, auto-hébergement, solo]
|
||||
confidence: high
|
||||
contested: false
|
||||
sources: [synthesized]
|
||||
---
|
||||
# ⚖️ Hébergement LLM Solo Dev : Local vs RunPod vs Modal vs Replicate vs Hugging Face
|
||||
|
||||
Faire tourner un LLM sans se ruiner et sans se prendre la tête.
|
||||
|
||||
## Tableau Comparatif
|
||||
| Critère | **Local (Ollama + GPU)** | **RunPod** | **Modal** | **Replicate** | **Hugging Face Inference** |
|
||||
| :--- | :--- | :--- | :--- | :--- | :--- |
|
||||
| **Simplicité** | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ (code-first) | ⭐⭐⭐⭐⭐ (API simple) | ⭐⭐⭐⭐ |
|
||||
| **Coût / 1M tokens** | ⭐⭐⭐⭐⭐ (gratuit) | ⭐⭐⭐ (~0.30$) | ⭐⭐⭐ | ⭐⭐⭐⭐ (cold start gratuit) | ⭐⭐⭐ (HF Pro) |
|
||||
| **Maintenance** | ⭐ (à toi) | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
|
||||
| **VRAM dispo** | Limitée (ton GPU) | Jusqu'à H100 | Jusqu'à H100 | Variable | Variable |
|
||||
| **Confidentialité** | ⭐⭐⭐⭐⭐ (données locales) | ⚠️ | ⚠️ | ⚠️ | ⚠️ |
|
||||
| **Idéal pour** | Dev local, homelab | Modèles 70B+ ponctuels | Pipelines code-first | API rapide à intégrer | Fine-tuning + inférence |
|
||||
|
||||
## Recommandations Solo Dev
|
||||
- **Développement quotidien, confidentialité** : **Local (Ollama)** (gratuit, illimité, idéal avec RTX 3060+).
|
||||
- **Besoin ponctuel d'un gros modèle (70B+)** : **RunPod** (facturation à la minute, H100 dispo).
|
||||
- **Tu veux écrire ton code comme si c'était local, mais cloud** : **Modal** (Pythonic, serverless GPU).
|
||||
- **API REST simple et stable pour un SaaS** : **Replicate** (une URL, une ligne de fetch).
|
||||
- **Tu veux fine-tuner ET héberger** : **Hugging Face** (Spaces + Endpoints + Training).
|
||||
|
||||
## Liens
|
||||
- [[comparatif-llm-local]]
|
||||
- [[ollama]]
|
||||
- [[stack-ia-maison]]
|
||||
- [[comparatif-stockage]]
|
||||
Reference in New Issue
Block a user