Files
wiki/roadmap/expansion-wiki-tech.md
T
2026-06-12 19:26:55 +02:00

379 lines
15 KiB
Markdown

---
title: Roadmap d'Expansion du Wiki Tech/IA/Open-Source/Auto-hébergement
created: 2026-06-11
updated: 2026-06-11
type: roadmap
tags: [meta, roadmap, plan]
confidence: high
---
# 🗺️ Roadmap d'Expansion — Wiki Tech / IA / Open-Source / Auto-hébergement
> **Objectif** : Passer de ~1 700 pages à **3 000+ pages** en plusieurs phases, en couvrant 6 axes complémentaires.
> **Méthode** : Une phase à la fois, avec mise à jour du PROJET-CATALOGUE et du `log.md` à chaque étape.
> **Dernière mise à jour** : 2026-06-11 | Pages actuelles : ~1 700
---
## 📊 Résumé des 6 axes
| # | Axe | Pages actuelles | Pages cibles | Effort estimé |
|---|-----|:-----:|:-----:|:-----:|
| 1 | 🏷️ Compléter le catalogue self-hébergé | ~1 545 | ~1 800 | ⭐⭐⭐ |
| 2 | 🧠 Concepts IA | ~20 | ~300 | ⭐⭐⭐⭐ |
| 3 | ☸️ Concepts auto-hébergement avancés | ~15 | ~200 | ⭐⭐⭐ |
| 4 | 📗 Guides & tutos pratiques | ~7 | ~200 | ⭐⭐⭐ |
| 5 | ⚖️ Comparatifs par catégorie | ~17 | ~150 | ⭐⭐ |
| 6 | 🏛️ Licences & écosystème open-source | ~3 | ~80 | ⭐ |
| | **TOTAL** | **~1 700** | **~2 700+** | |
---
## 🔥 Phase 1 — Terminer le catalogue (priorité max)
**État** : ~1 545 fiches sur ~700 apps cataloguées dans selfh.st.
### Catégories restantes à couvrir
| Catégorie | Tag ID | Apps estimées | Collisions probables | Priorité |
|-----------|:------:|:-----:|:-----:|:-----:|
| Messaging / Chat | 21 | ~25 | Faible | P1 |
| Remote Access | 18 | ~22 | Moyenne | P1 |
| Observability / Tracing | 78 | ~18 | Faible | P1 |
| Proxy / Load Balancer | 86 | ~15 | Élevée (→ Reverse Proxy) | P1 |
| Finance / Budgeting | 50 | ~30 | Faible | P2 |
| Inventory / Asset Mgmt | 83 | ~12 | Faible | P2 |
| Knowledge Base / Wiki | 58 | ~14 | Faible | P2 |
| Communication (VoIP) | 119 | ~10 | Faible | P2 |
| Analytics / Matomo-like | 94 | ~12 | Faible | P3 |
| Gaming | 61 | ~20 | Faible | P3 |
| E-commerce | 133 | ~8 | Faible | P3 |
| Autres petites catégories | divers | ~40 | Variable | P3 |
**Objectif Phase 1** : ~200-250 fiches supplémentaires → **1 800+ fiches de catalogue**.
### Méthode
- [[references/scrape-selfhst-cdn.md]] pour le scraping CDN
- [[references/parallel-fiche-delegation.md]] pour la production en parallèle
- [[references/catalogue-session-7cat-2026-06-08.md]] pour le mode "travaille seul"
- Mini-fiches `app-redirect` pour les collisions ([[references/deduplication-multi-category.md]])
- Mise à jour PROJET-CATALOGUE.md à chaque fin de session
---
## 🧠 Phase 2 — Concepts IA (l'axe le plus riche)
**État** : ~20 pages (modèles, techniques de base).
### Sous-axes à développer
#### 2A — Modèles (fiches individuelles)
Ajouter une fiche par modèle notable, avec architecture, perf, licence, disponibilité :
| Modèle | Constructeur | Taille | Particularité |
|--------|-------------|:------:|--------------|
| [[Qwen3.5]] / [[Qwen3.6]] / [[Qwen3.7]] | Alibaba | 0.5B-236B | MoE, long contexte |
| [[DeepSeek-V4]] / [[DeepSeek-V4-Flash]] | DeepSeek | 671B MoE | Flash = distillation rapide |
| [[Gemma-4]] / [[Gemma-3]] | Google | 2B-27B | Ouvert, bien pour fine-tune |
| [[Claude-4]] | Anthropic | ? | Propriétaire mais référent |
| [[GPT-5]] | OpenAI | ? | Référent propriétaire |
| [[Llama-4]] | Meta | 8B-405B | Standard ouvert |
| [[Mistral-Large-3]] / [[Mistral-Small-3]] | Mistral AI | 24B-123B | Européen, open-weight |
| [[Yi-Lightning]] / [[Yi-Large]] | 01.AI | 6B-34B | Optimisé inférence |
| [[Phi-4]] | Microsoft | 14B | Petit mais performant |
| [[Command-R-plus]] / [[Command-A]] | Cohere | 35B-52B | RAG natif |
~30 fiches modèles.
#### 2B — Architectures & Concepts fondamentaux
| Concept | Description |
|---------|-------------|
| [[Mixture-of-Experts]] | MoE — routage par tokens vers sous-réseaux |
| [[Multi-Head-Latent-Attention]] | MLA — économie de cache KV (DeepSeek) |
| [[Grouped-Query-Attention]] | GQA — compromis qualité/vitesse |
| [[State-Space-Models]] | Mamba, Mamba-2 — alternatives aux transformers |
| [[Soft-Mixture-of-Experts]] | Soft MoE — pas de routage discret |
| [[Rotary-Position-Embedding]] | RoPE — position encodée dans l'attention |
| [[KV-Cache]] | Cache d'attention pour inférence rapide |
| [[Speculative-Decoding]] | Décodage spéculatif — petit modèle + grand modèle |
| [[Quantization]] | GGUF, EXL2, AWQ, bitsandbytes, FP8 |
| [[Distillation]] | Knowledge distillation, dataset synthétique |
| [[Context-Distillation]] | Distillation de contexte long vers court |
~15 pages.
#### 2C — Fine-tuning & Entraînement
| Concept | Description |
|---------|-------------|
| [[LoRA]] / [[QLoRA]] | Low-Rank Adaptation — fine-tuning paramètre-efficace |
| [[DPO]] | Direct Preference Optimization — pas de modèle de récompense |
| [[RLHF]] | Reinforcement Learning from Human Feedback |
| [[GRPO]] | Group Relative Policy Optimization — RL sans critique (DeepSeek) |
| [[SFT]] | Supervised Fine-Tuning — le classique |
| [[Curriculum-Learning]] | Apprentissage progressif par difficulté |
| [[Data-Mixing]] | Stratégie de mélange des données d'entraînement |
| [[Synthetic-Data]] | Génération de données d'entraînement par LLM |
~12 pages.
#### 2D — Techniques Agentiques & Inférence
| Concept | Description |
|---------|-------------|
| [[Tool-Use]] / [[Function-Calling]] | Appel d'outils structuré |
| [[ReAct]] | Reasoning + Acting — boucle pensée/action |
| [[Chain-of-Thought]] | Décomposition pas-à-pas |
| [[Tree-of-Thoughts]] | Exploration d'arbres de raisonnement |
| [[RAG]] | Retrieval-Augmented Generation — les variantes |
| [[Reranking]] | Cross-encoder pour reclasser les résultats RAG |
| [[Embeddings]] | Vectorisation sémantique (texte, image, code) |
| [[MCP-Protocol]] | Model Context Protocol — standard de contexte |
| [[A2A-Protocol]] | Agent-to-Agent — standard de communication entre agents |
| [[Structured-Outputs]] | JSON mode, grammar, outils de parsing |
| [[Streaming]] | Server-Sent Events, décodage incrémental |
| [[Prompt-Caching]] | Cache de contexte système/répété |
~15 pages.
#### 2E — Benchmarks & Évaluation
| Benchmarks connus | Description |
|-------------------|-------------|
| [[SWE-bench]] | Résolution de bugs logiciels réels |
| [[HumanEval]] / [[MBPP]] | Génération de code Python |
| [[MMLU]] / [[MMLU-Pro]] | Connaissance multi-domaine |
| [[GPQA]] | Questions de niveau doctorat |
| [[AIME]] / [[MATH]] | Mathématiques olympiades |
| [[Chatbot-Arena]] | Elo ranking par vote humain |
| [[LMSys-Challenges]] | Évaluation ouverte collaborative |
| [[HELM]] | Holistic Evaluation of Language Models |
~10 pages.
**Total Phase 2** : ~80-100 pages → porté de 20 à **~120 pages IA**.
---
## ☸️ Phase 3 — Concepts auto-hébergement avancés
**État** : ~15 pages (Docker, SSH, reverse proxy, backup...)
### 3A — Sécurité
| Concept | Description |
|---------|-------------|
| [[WAF]] | Web Application Firewall |
| [[IDS-IPS]] | Intrusion Detection / Prevention |
| [[CrowdSec-vs-Fail2ban]] | Comparatif détaillé |
| [[Zero-Trust-Homelab]] | Appliquer le zero-trust chez soi |
| [[Hardening-Docker]] | Sécurisation des conteneurs |
| [[SBOM]] | Software Bill of Materials |
| [[Vulnerability-Scanning]] | Trivy, Grype, Snyk |
| [[Secrets-Management]] | Vault, SOPS, bitwarden, rbw |
| [[Honeypot]] | Bastion, CrowdSec bouncers |
| [[Audit-Logging]] | Centralisation des logs sécurité |
~15 pages.
### 3B — Réseau
| Concept | Description |
|---------|-------------|
| [[WireGuard-vs-Tailscale]] | Comparatif VPN |
| [[Headscale]] | Self-hosted Tailscale control plane |
| [[SDN]] | Software-Defined Networking |
| [[MACVLAN]] / [[IPVLAN]] | Modes réseau Docker avancés |
| [[VXLAN]] | Overlay réseau |
| [[BGP-Homelab]] | Routage dynamique chez soi |
| [[DNS-Architecture]] | Résolveurs, bloqueurs, split-horizon |
| [[Reverse-Proxy-Comparison]] | Traefik vs Caddy vs Nginx vs HAProxy |
| [[API-Gateway]] vs [[Reverse-Proxy]] | Différence et cas d'usage |
| [[Load-Balancing]] | Round-robin, least-conn, sticky sessions |
~15 pages.
### 3C — Stockage & Sauvegardes
| Concept | Description |
|---------|-------------|
| [[RAID-vs-ZFS-vs-BTRFS]] | Comparatif filesystems |
| [[Distributed-Storage]] | Longhorn, Rook/Ceph, SeaweedFS |
| [[Object-Storage]] | MinIO — S3 compatible |
| [[Backup-3-2-1]] | Stratégie, Restic vs Borg vs Kopia vs Duplicati |
| [[Immutable-Backups]] | Sauvegardes non-modifiables |
| [[Offsite-Backup]] | Backblaze B2, rsync.net, auto-hébergé |
~10 pages.
### 3D — Orchestration & Déploiement
| Concept | Description |
|---------|-------------|
| [[Kubernetes-Homelab]] | K3s, MicroK8s, Kubeadm |
| [[Kubernetes-vs-Nomad-vs-Docker-Swarm]] | Comparatif orchestrateurs |
| [[GitOps]] | ArgoCD, Flux, déploiement déclaratif |
| [[Coolify-vs-Dokploy-vs-Caprover]] | Comparatif PaaS auto-hébergé |
| [[Blue-Green-Deployment]] | Déploiement sans interruption |
| [[Canary-Deployment]] | Déploiement progressif |
| [[Rolling-Update]] | Mise à jour sans downtime |
~10 pages.
**Total Phase 3** : ~50 pages → porté à **~70 pages auto-hébergement**.
---
## 📗 Phase 4 — Guides & Tutos pratiques
**État** : ~7 pages (checklists actuelles).
### Idées de guides
| Guide | Description | Type |
|-------|-------------|:----:|
| **Déployer Authentik avec Traefik + CrowdSec** | SSO complet, pas-à-pas | Tuto |
| **Migration de NPM vers Traefik** | Tout ce qu'il faut savoir | Tuto |
| **Durcir un serveur Ubuntu/Debian** | Checklist exhaustive | Checklist |
| **Sécuriser Docker en production** | Rootless, signatures, scan | Checklist |
| **Monitoring complet d'un homelab** | Uptime Kuma + Grafana + Loki + Alertes | Tuto |
| **Sauvegardes automatisées avec Restic** | Scripts, systemd timers, off-site | Tuto |
| **Déployer Coolify de A à Z** | VPS → Apps en prod | Tuto |
| **Déployer Dokploy de A à Z** | Alternative à Coolify | Tuto |
| **Reverse proxy multihôte avec Traefik** | Docker, file providers, middleware | Tuto |
| **Configurer Tailscale + Headscale** | Mesh VPN, ACLs, exit nodes | Tuto |
| **Configurer un serveur DNS Hidden Master** | Technitium → HE.NET | Tuto |
| **Guide complet Postfix/Dovecot** | Mail self-hosté (si tu veux) | Tuto |
| **[Créer un guide par service du catalogue]** | Les 20 apps les plus complexes | Tuto |
**Objectif Phase 4** : ~50-80 guides → porté à **~60-90 pages**.
---
## ⚖️ Phase 5 — Comparatifs
**État** : ~17 pages.
### Comparatifs à créer (un par catégorie d'outils)
| Catégorie | Outils comparés | Utilité |
|-----------|----------------|:-------:|
| Reverse Proxy | Traefik vs Caddy vs Nginx vs HAProxy | ⭐⭐ |
| Dashboard | Homepage vs Homer vs Dashy vs Flame | ⭐⭐⭐ |
| SSO | Authentik vs Authelia vs Keycloak vs Casdoor | ⭐⭐⭐ |
| Monitoring | Uptime Kuma vs Grafana vs Netdata vs Checkmk | ⭐⭐ |
| Observabilité | Loki vs SigNoz vs Highlight vs BetterStack | ⭐⭐ |
| Backup | Restic vs Borg vs Kopia vs Duplicati | ⭐⭐ |
| DNS | Technitium vs AdGuard vs Pi-hole vs Blocky vs Unbound | ⭐⭐ |
| Mail | Mailcow vs Mailu vs Stalwart vs Maddy | ⭐⭐ |
| Photo | Immich vs Photoprism vs LibrePhotos vs Piwigo | ⭐⭐ |
| Media | Jellyfin vs Plex vs Emby | ⭐⭐ |
| Notes | Joplin vs Outline vs Trillium vs SiYuan vs Obsidian LiveSync | ⭐⭐⭐ |
| Git | Gitea vs GitLab CE vs Forgejo vs SourceHut | ⭐⭐ |
| CI/CD | Drone vs Woodpecker vs Concourse vs Jenkins | ⭐ |
| VPN | WireGuard vs Tailscale vs OpenVPN vs Nebula | ⭐⭐ |
| Database | PostgreSQL vs MySQL vs MariaDB vs SQLite vs ClickHouse | ⭐⭐ |
| Queue | RabbitMQ vs Redis vs NATS vs Kafka vs ZeroMQ | ⭐ |
| Container Registry | Harbor vs Registry vs Zot vs Dragonfly | ⭐ |
| PaaS | Coolify vs Dokploy vs Caprover vs Kamal | ⭐⭐⭐ |
| Firewall | CrowdSec vs Fail2ban vs nftables vs OPNsense | ⭐⭐ |
**Objectif Phase 5** : ~30-50 comparatifs → porté à **~50-70 pages**.
---
## 🏛️ Phase 6 — Licences & Écosystème Open-Source
**État** : ~3 pages (Apache-2, GPLv3, MIT).
### Licences à documenter
| Licence | Type | Compatibilité |
|---------|:----:|:-------------:|
| [[LGPL-v3]] / [[LGPL-v2.1]] | Copyleft faible | GPL |
| [[BSD-2-Clause]] / [[BSD-3-Clause]] | Permissive | Apache-2, MIT, GPL |
| [[MPL-2.0]] | Copyleft faible (fichier) | Apache-2, GPL |
| [[AGPL-v3]] | Copyleft fort réseau | GPLv3 |
| [[EUPL]] | Copyleft européen | GPLv3 |
| [[BSL]] | Business Source License → Apache-2 | ↑ |
| [[SSPL]] | Server Side Public License — controversée | ↑ |
| [[Elastic-License]] | BSL-like → Elastic → SSPL | ↑ |
| [[Commons-Clause]] | Pas vraiment open-source | ↑ |
| [[Fair-Source]] | Mouvement alternatif | ↑ |
| [[Unlicense]] / [[CC0]] | Domaine public | Toutes |
| [[Prosperity]] | Source disponible non-commerciale | ↑ |
| [[PolyForm]] | Shield, Small Business, Noncommercial | ↑ |
| [[License-Compatibility-Matrix]] | Tableau de compatibilité complète | ⭐⭐ |
### Écosystème & Fondations
| Sujet | Description |
|-------|-------------|
| [[CNCF-Landscape]] | Cloud Native Computing Foundation — projets et catégories |
| [[Apache-Software-Foundation]] | Gouvernance des projets Apache |
| [[Linux-Foundation]] | Organisation mère de nombreux projets |
| [[Mozilla-Foundation]] | Firefox, MDN, Rust |
| [[OpenAI-Transition]] | Open → Closed → For-profit |
| [[License-History]] | Évolution des licences open-source (GPL → BSL → SSPL) |
| [[Commercial-Open-Source]] | Modèles économiques open-source durables |
| [[Fork-Patterns]] | Quand et pourquoi les projets forkent (Redis/Valkey, Terraform/OpenTofu) |
**Objectif Phase 6** : ~40 pages → porté de 3 à **~40 pages**.
---
## 📋 Plan d'exécution
### Ordre recommandé
```
Phase 1 → 🏷️ Terminer le catalogue (priorité max — reprendre là où on était)
Phase 2 → 🧠 Concepts IA (le plus gros potentiel de valeur)
Phase 5 → ⚖️ Comparatifs (complète les fiches du catalogue)
Phase 3 → ☸️ Concepts auto-hébergement (approfondir ce qu'on catalogue)
Phase 4 → 📗 Guides & tutos (pratique, consolide tout)
Phase 6 → 🏛️ Licences & open-source (fondamentaux, moins prioritaire)
```
Chaque phase peut être réalisée en sessions de 1-2h. Les phases 2-6 se chevauchent — on peut alterner.
### Méthode de travail
- **Sessions normales** : 1 axe par session, `delegate_task` pour les batchs, mise à jour PROJET/log.md en fin de session
- **Sessions marathon** : enchaîner 3-5 sous-axes avec la méthode [[references/catalogue-session-marathon-night-2026-06-07.md]]
- **Sessions autonomes** : Velli absent, mode roadmap + `delegate_task` massif
---
## 📈 Suivi de progression
| Phase | Pages cibles | Pages faites | % |
|-------|:-----------:|:-----------:|:-:|
| 1 — Catalogue | +250 | 0 | 0% |
| 2 — IA | +280 | 0 | 0% |
| 3 — Auto-hébergement | +185 | 0 | 0% |
| 4 — Guides | +193 | 0 | 0% |
| 5 — Comparatifs | +133 | 0 | 0% |
| 6 — Licences | +77 | 0 | 0% |
| **TOTAL** | **~2 730** | **~1 700** | **62%** |
---
## 🔗 Pages liées
- [[Catalogue-Self-Hosted]] — Le hub du catalogue
- [[references/scrape-selfhst-cdn.md]] — Scraper selfh.st
- [[references/parallel-fiche-delegation.md]] — Production parallèle
- [[references/catalogue-session-7cat-2026-06-08.md]] — Mode travail seul
- [[references/marathon-night-2026-06-07.md]] — Marathon mode
- [[Dashboard]] — Le dashboard Dataview du wiki
- [[log]] — Journal des actions
- [[PROJET-CATALOGUE]] — Suivi du catalogue