Files
wiki/roadmap/expansion-wiki-tech.md
T
2026-06-12 19:26:55 +02:00

15 KiB

title, created, updated, type, tags, confidence
title created updated type tags confidence
Roadmap d'Expansion du Wiki Tech/IA/Open-Source/Auto-hébergement 2026-06-11 2026-06-11 roadmap
meta
roadmap
plan
high

🗺️ Roadmap d'Expansion — Wiki Tech / IA / Open-Source / Auto-hébergement

Objectif : Passer de ~1 700 pages à 3 000+ pages en plusieurs phases, en couvrant 6 axes complémentaires. Méthode : Une phase à la fois, avec mise à jour du PROJET-CATALOGUE et du log.md à chaque étape. Dernière mise à jour : 2026-06-11 | Pages actuelles : ~1 700


📊 Résumé des 6 axes

# Axe Pages actuelles Pages cibles Effort estimé
1 🏷️ Compléter le catalogue self-hébergé ~1 545 ~1 800
2 🧠 Concepts IA ~20 ~300
3 ☸️ Concepts auto-hébergement avancés ~15 ~200
4 📗 Guides & tutos pratiques ~7 ~200
5 ⚖️ Comparatifs par catégorie ~17 ~150
6 🏛️ Licences & écosystème open-source ~3 ~80
TOTAL ~1 700 ~2 700+

🔥 Phase 1 — Terminer le catalogue (priorité max)

État : ~1 545 fiches sur ~700 apps cataloguées dans selfh.st.

Catégories restantes à couvrir

Catégorie Tag ID Apps estimées Collisions probables Priorité
Messaging / Chat 21 ~25 Faible P1
Remote Access 18 ~22 Moyenne P1
Observability / Tracing 78 ~18 Faible P1
Proxy / Load Balancer 86 ~15 Élevée (→ Reverse Proxy) P1
Finance / Budgeting 50 ~30 Faible P2
Inventory / Asset Mgmt 83 ~12 Faible P2
Knowledge Base / Wiki 58 ~14 Faible P2
Communication (VoIP) 119 ~10 Faible P2
Analytics / Matomo-like 94 ~12 Faible P3
Gaming 61 ~20 Faible P3
E-commerce 133 ~8 Faible P3
Autres petites catégories divers ~40 Variable P3

Objectif Phase 1 : ~200-250 fiches supplémentaires → 1 800+ fiches de catalogue.

Méthode


🧠 Phase 2 — Concepts IA (l'axe le plus riche)

État : ~20 pages (modèles, techniques de base).

Sous-axes à développer

2A — Modèles (fiches individuelles)

Ajouter une fiche par modèle notable, avec architecture, perf, licence, disponibilité :

Modèle Constructeur Taille Particularité
Qwen3.5 / Qwen3.6 / Qwen3.7 Alibaba 0.5B-236B MoE, long contexte
DeepSeek-V4 / DeepSeek-V4-Flash DeepSeek 671B MoE Flash = distillation rapide
Gemma-4 / Gemma-3 Google 2B-27B Ouvert, bien pour fine-tune
Claude-4 Anthropic ? Propriétaire mais référent
GPT-5 OpenAI ? Référent propriétaire
Llama-4 Meta 8B-405B Standard ouvert
Mistral-Large-3 / Mistral-Small-3 Mistral AI 24B-123B Européen, open-weight
Yi-Lightning / Yi-Large 01.AI 6B-34B Optimisé inférence
Phi-4 Microsoft 14B Petit mais performant
Command-R-plus / Command-A Cohere 35B-52B RAG natif

~30 fiches modèles.

2B — Architectures & Concepts fondamentaux

Concept Description
Mixture-of-Experts MoE — routage par tokens vers sous-réseaux
Multi-Head-Latent-Attention MLA — économie de cache KV (DeepSeek)
Grouped-Query-Attention GQA — compromis qualité/vitesse
State-Space-Models Mamba, Mamba-2 — alternatives aux transformers
Soft-Mixture-of-Experts Soft MoE — pas de routage discret
Rotary-Position-Embedding RoPE — position encodée dans l'attention
KV-Cache Cache d'attention pour inférence rapide
Speculative-Decoding Décodage spéculatif — petit modèle + grand modèle
Quantization GGUF, EXL2, AWQ, bitsandbytes, FP8
Distillation Knowledge distillation, dataset synthétique
Context-Distillation Distillation de contexte long vers court

~15 pages.

2C — Fine-tuning & Entraînement

Concept Description
LoRA / QLoRA Low-Rank Adaptation — fine-tuning paramètre-efficace
DPO Direct Preference Optimization — pas de modèle de récompense
RLHF Reinforcement Learning from Human Feedback
GRPO Group Relative Policy Optimization — RL sans critique (DeepSeek)
SFT Supervised Fine-Tuning — le classique
Curriculum-Learning Apprentissage progressif par difficulté
Data-Mixing Stratégie de mélange des données d'entraînement
Synthetic-Data Génération de données d'entraînement par LLM

~12 pages.

2D — Techniques Agentiques & Inférence

Concept Description
Tool-Use / Function-Calling Appel d'outils structuré
ReAct Reasoning + Acting — boucle pensée/action
Chain-of-Thought Décomposition pas-à-pas
Tree-of-Thoughts Exploration d'arbres de raisonnement
RAG Retrieval-Augmented Generation — les variantes
Reranking Cross-encoder pour reclasser les résultats RAG
Embeddings Vectorisation sémantique (texte, image, code)
MCP-Protocol Model Context Protocol — standard de contexte
A2A-Protocol Agent-to-Agent — standard de communication entre agents
Structured-Outputs JSON mode, grammar, outils de parsing
Streaming Server-Sent Events, décodage incrémental
Prompt-Caching Cache de contexte système/répété

~15 pages.

2E — Benchmarks & Évaluation

Benchmarks connus Description
SWE-bench Résolution de bugs logiciels réels
HumanEval / MBPP Génération de code Python
MMLU / MMLU-Pro Connaissance multi-domaine
GPQA Questions de niveau doctorat
AIME / MATH Mathématiques olympiades
Chatbot-Arena Elo ranking par vote humain
LMSys-Challenges Évaluation ouverte collaborative
HELM Holistic Evaluation of Language Models

~10 pages.

Total Phase 2 : ~80-100 pages → porté de 20 à ~120 pages IA.


☸️ Phase 3 — Concepts auto-hébergement avancés

État : ~15 pages (Docker, SSH, reverse proxy, backup...)

3A — Sécurité

Concept Description
WAF Web Application Firewall
IDS-IPS Intrusion Detection / Prevention
CrowdSec-vs-Fail2ban Comparatif détaillé
Zero-Trust-Homelab Appliquer le zero-trust chez soi
Hardening-Docker Sécurisation des conteneurs
SBOM Software Bill of Materials
Vulnerability-Scanning Trivy, Grype, Snyk
Secrets-Management Vault, SOPS, bitwarden, rbw
Honeypot Bastion, CrowdSec bouncers
Audit-Logging Centralisation des logs sécurité

~15 pages.

3B — Réseau

Concept Description
WireGuard-vs-Tailscale Comparatif VPN
Headscale Self-hosted Tailscale control plane
SDN Software-Defined Networking
MACVLAN / IPVLAN Modes réseau Docker avancés
VXLAN Overlay réseau
BGP-Homelab Routage dynamique chez soi
DNS-Architecture Résolveurs, bloqueurs, split-horizon
Reverse-Proxy-Comparison Traefik vs Caddy vs Nginx vs HAProxy
API-Gateway vs Reverse-Proxy Différence et cas d'usage
Load-Balancing Round-robin, least-conn, sticky sessions

~15 pages.

3C — Stockage & Sauvegardes

Concept Description
RAID-vs-ZFS-vs-BTRFS Comparatif filesystems
Distributed-Storage Longhorn, Rook/Ceph, SeaweedFS
Object-Storage MinIO — S3 compatible
Backup-3-2-1 Stratégie, Restic vs Borg vs Kopia vs Duplicati
Immutable-Backups Sauvegardes non-modifiables
Offsite-Backup Backblaze B2, rsync.net, auto-hébergé

~10 pages.

3D — Orchestration & Déploiement

Concept Description
Kubernetes-Homelab K3s, MicroK8s, Kubeadm
Kubernetes-vs-Nomad-vs-Docker-Swarm Comparatif orchestrateurs
GitOps ArgoCD, Flux, déploiement déclaratif
Coolify-vs-Dokploy-vs-Caprover Comparatif PaaS auto-hébergé
Blue-Green-Deployment Déploiement sans interruption
Canary-Deployment Déploiement progressif
Rolling-Update Mise à jour sans downtime

~10 pages.

Total Phase 3 : ~50 pages → porté à ~70 pages auto-hébergement.


📗 Phase 4 — Guides & Tutos pratiques

État : ~7 pages (checklists actuelles).

Idées de guides

Guide Description Type
Déployer Authentik avec Traefik + CrowdSec SSO complet, pas-à-pas Tuto
Migration de NPM vers Traefik Tout ce qu'il faut savoir Tuto
Durcir un serveur Ubuntu/Debian Checklist exhaustive Checklist
Sécuriser Docker en production Rootless, signatures, scan Checklist
Monitoring complet d'un homelab Uptime Kuma + Grafana + Loki + Alertes Tuto
Sauvegardes automatisées avec Restic Scripts, systemd timers, off-site Tuto
Déployer Coolify de A à Z VPS → Apps en prod Tuto
Déployer Dokploy de A à Z Alternative à Coolify Tuto
Reverse proxy multihôte avec Traefik Docker, file providers, middleware Tuto
Configurer Tailscale + Headscale Mesh VPN, ACLs, exit nodes Tuto
Configurer un serveur DNS Hidden Master Technitium → HE.NET Tuto
Guide complet Postfix/Dovecot Mail self-hosté (si tu veux) Tuto
[Créer un guide par service du catalogue] Les 20 apps les plus complexes Tuto

Objectif Phase 4 : ~50-80 guides → porté à ~60-90 pages.


⚖️ Phase 5 — Comparatifs

État : ~17 pages.

Comparatifs à créer (un par catégorie d'outils)

Catégorie Outils comparés Utilité
Reverse Proxy Traefik vs Caddy vs Nginx vs HAProxy
Dashboard Homepage vs Homer vs Dashy vs Flame
SSO Authentik vs Authelia vs Keycloak vs Casdoor
Monitoring Uptime Kuma vs Grafana vs Netdata vs Checkmk
Observabilité Loki vs SigNoz vs Highlight vs BetterStack
Backup Restic vs Borg vs Kopia vs Duplicati
DNS Technitium vs AdGuard vs Pi-hole vs Blocky vs Unbound
Mail Mailcow vs Mailu vs Stalwart vs Maddy
Photo Immich vs Photoprism vs LibrePhotos vs Piwigo
Media Jellyfin vs Plex vs Emby
Notes Joplin vs Outline vs Trillium vs SiYuan vs Obsidian LiveSync
Git Gitea vs GitLab CE vs Forgejo vs SourceHut
CI/CD Drone vs Woodpecker vs Concourse vs Jenkins
VPN WireGuard vs Tailscale vs OpenVPN vs Nebula
Database PostgreSQL vs MySQL vs MariaDB vs SQLite vs ClickHouse
Queue RabbitMQ vs Redis vs NATS vs Kafka vs ZeroMQ
Container Registry Harbor vs Registry vs Zot vs Dragonfly
PaaS Coolify vs Dokploy vs Caprover vs Kamal
Firewall CrowdSec vs Fail2ban vs nftables vs OPNsense

Objectif Phase 5 : ~30-50 comparatifs → porté à ~50-70 pages.


🏛️ Phase 6 — Licences & Écosystème Open-Source

État : ~3 pages (Apache-2, GPLv3, MIT).

Licences à documenter

Licence Type Compatibilité
LGPL-v3 / LGPL-v2.1 Copyleft faible GPL
BSD-2-Clause / BSD-3-Clause Permissive Apache-2, MIT, GPL
MPL-2.0 Copyleft faible (fichier) Apache-2, GPL
AGPL-v3 Copyleft fort réseau GPLv3
EUPL Copyleft européen GPLv3
BSL Business Source License → Apache-2
SSPL Server Side Public License — controversée
Elastic-License BSL-like → Elastic → SSPL
Commons-Clause Pas vraiment open-source
Fair-Source Mouvement alternatif
Unlicense / CC0 Domaine public Toutes
Prosperity Source disponible non-commerciale
PolyForm Shield, Small Business, Noncommercial
License-Compatibility-Matrix Tableau de compatibilité complète

Écosystème & Fondations

Sujet Description
CNCF-Landscape Cloud Native Computing Foundation — projets et catégories
Apache-Software-Foundation Gouvernance des projets Apache
Linux-Foundation Organisation mère de nombreux projets
Mozilla-Foundation Firefox, MDN, Rust
OpenAI-Transition Open → Closed → For-profit
License-History Évolution des licences open-source (GPL → BSL → SSPL)
Commercial-Open-Source Modèles économiques open-source durables
Fork-Patterns Quand et pourquoi les projets forkent (Redis/Valkey, Terraform/OpenTofu)

Objectif Phase 6 : ~40 pages → porté de 3 à ~40 pages.


📋 Plan d'exécution

Ordre recommandé

Phase 1  →  🏷️ Terminer le catalogue     (priorité max — reprendre là où on était)
   ↓
Phase 2  →  🧠 Concepts IA                (le plus gros potentiel de valeur)
   ↓
Phase 5  →  ⚖️ Comparatifs               (complète les fiches du catalogue)
   ↓
Phase 3  →  ☸️ Concepts auto-hébergement  (approfondir ce qu'on catalogue)
   ↓
Phase 4  →  📗 Guides & tutos             (pratique, consolide tout)
   ↓
Phase 6  →  🏛️ Licences & open-source     (fondamentaux, moins prioritaire)

Chaque phase peut être réalisée en sessions de 1-2h. Les phases 2-6 se chevauchent — on peut alterner.

Méthode de travail

  • Sessions normales : 1 axe par session, delegate_task pour les batchs, mise à jour PROJET/log.md en fin de session
  • Sessions marathon : enchaîner 3-5 sous-axes avec la méthode references/catalogue-session-marathon-night-2026-06-07.md
  • Sessions autonomes : Velli absent, mode roadmap + delegate_task massif

📈 Suivi de progression

Phase Pages cibles Pages faites %
1 — Catalogue +250 0 0%
2 — IA +280 0 0%
3 — Auto-hébergement +185 0 0%
4 — Guides +193 0 0%
5 — Comparatifs +133 0 0%
6 — Licences +77 0 0%
TOTAL ~2 730 ~1 700 62%

🔗 Pages liées