--- title: Roadmap d'Expansion du Wiki Tech/IA/Open-Source/Auto-hébergement created: 2026-06-11 updated: 2026-06-11 type: roadmap tags: [meta, roadmap, plan] confidence: high --- # 🗺️ Roadmap d'Expansion — Wiki Tech / IA / Open-Source / Auto-hébergement > **Objectif** : Passer de ~1 700 pages à **3 000+ pages** en plusieurs phases, en couvrant 6 axes complémentaires. > **Méthode** : Une phase à la fois, avec mise à jour du PROJET-CATALOGUE et du `log.md` à chaque étape. > **Dernière mise à jour** : 2026-06-11 | Pages actuelles : ~1 700 --- ## 📊 Résumé des 6 axes | # | Axe | Pages actuelles | Pages cibles | Effort estimé | |---|-----|:-----:|:-----:|:-----:| | 1 | 🏷️ Compléter le catalogue self-hébergé | ~1 545 | ~1 800 | ⭐⭐⭐ | | 2 | 🧠 Concepts IA | ~20 | ~300 | ⭐⭐⭐⭐ | | 3 | ☸️ Concepts auto-hébergement avancés | ~15 | ~200 | ⭐⭐⭐ | | 4 | 📗 Guides & tutos pratiques | ~7 | ~200 | ⭐⭐⭐ | | 5 | ⚖️ Comparatifs par catégorie | ~17 | ~150 | ⭐⭐ | | 6 | 🏛️ Licences & écosystème open-source | ~3 | ~80 | ⭐ | | | **TOTAL** | **~1 700** | **~2 700+** | | --- ## 🔥 Phase 1 — Terminer le catalogue (priorité max) **État** : ~1 545 fiches sur ~700 apps cataloguées dans selfh.st. ### Catégories restantes à couvrir | Catégorie | Tag ID | Apps estimées | Collisions probables | Priorité | |-----------|:------:|:-----:|:-----:|:-----:| | Messaging / Chat | 21 | ~25 | Faible | P1 | | Remote Access | 18 | ~22 | Moyenne | P1 | | Observability / Tracing | 78 | ~18 | Faible | P1 | | Proxy / Load Balancer | 86 | ~15 | Élevée (→ Reverse Proxy) | P1 | | Finance / Budgeting | 50 | ~30 | Faible | P2 | | Inventory / Asset Mgmt | 83 | ~12 | Faible | P2 | | Knowledge Base / Wiki | 58 | ~14 | Faible | P2 | | Communication (VoIP) | 119 | ~10 | Faible | P2 | | Analytics / Matomo-like | 94 | ~12 | Faible | P3 | | Gaming | 61 | ~20 | Faible | P3 | | E-commerce | 133 | ~8 | Faible | P3 | | Autres petites catégories | divers | ~40 | Variable | P3 | **Objectif Phase 1** : ~200-250 fiches supplémentaires → **1 800+ fiches de catalogue**. ### Méthode - [[references/scrape-selfhst-cdn.md]] pour le scraping CDN - [[references/parallel-fiche-delegation.md]] pour la production en parallèle - [[references/catalogue-session-7cat-2026-06-08.md]] pour le mode "travaille seul" - Mini-fiches `app-redirect` pour les collisions ([[references/deduplication-multi-category.md]]) - Mise à jour PROJET-CATALOGUE.md à chaque fin de session --- ## 🧠 Phase 2 — Concepts IA (l'axe le plus riche) **État** : ~20 pages (modèles, techniques de base). ### Sous-axes à développer #### 2A — Modèles (fiches individuelles) Ajouter une fiche par modèle notable, avec architecture, perf, licence, disponibilité : | Modèle | Constructeur | Taille | Particularité | |--------|-------------|:------:|--------------| | [[Qwen3.5]] / [[Qwen3.6]] / [[Qwen3.7]] | Alibaba | 0.5B-236B | MoE, long contexte | | [[DeepSeek-V4]] / [[DeepSeek-V4-Flash]] | DeepSeek | 671B MoE | Flash = distillation rapide | | [[Gemma-4]] / [[Gemma-3]] | Google | 2B-27B | Ouvert, bien pour fine-tune | | [[Claude-4]] | Anthropic | ? | Propriétaire mais référent | | [[GPT-5]] | OpenAI | ? | Référent propriétaire | | [[Llama-4]] | Meta | 8B-405B | Standard ouvert | | [[Mistral-Large-3]] / [[Mistral-Small-3]] | Mistral AI | 24B-123B | Européen, open-weight | | [[Yi-Lightning]] / [[Yi-Large]] | 01.AI | 6B-34B | Optimisé inférence | | [[Phi-4]] | Microsoft | 14B | Petit mais performant | | [[Command-R-plus]] / [[Command-A]] | Cohere | 35B-52B | RAG natif | ~30 fiches modèles. #### 2B — Architectures & Concepts fondamentaux | Concept | Description | |---------|-------------| | [[Mixture-of-Experts]] | MoE — routage par tokens vers sous-réseaux | | [[Multi-Head-Latent-Attention]] | MLA — économie de cache KV (DeepSeek) | | [[Grouped-Query-Attention]] | GQA — compromis qualité/vitesse | | [[State-Space-Models]] | Mamba, Mamba-2 — alternatives aux transformers | | [[Soft-Mixture-of-Experts]] | Soft MoE — pas de routage discret | | [[Rotary-Position-Embedding]] | RoPE — position encodée dans l'attention | | [[KV-Cache]] | Cache d'attention pour inférence rapide | | [[Speculative-Decoding]] | Décodage spéculatif — petit modèle + grand modèle | | [[Quantization]] | GGUF, EXL2, AWQ, bitsandbytes, FP8 | | [[Distillation]] | Knowledge distillation, dataset synthétique | | [[Context-Distillation]] | Distillation de contexte long vers court | ~15 pages. #### 2C — Fine-tuning & Entraînement | Concept | Description | |---------|-------------| | [[LoRA]] / [[QLoRA]] | Low-Rank Adaptation — fine-tuning paramètre-efficace | | [[DPO]] | Direct Preference Optimization — pas de modèle de récompense | | [[RLHF]] | Reinforcement Learning from Human Feedback | | [[GRPO]] | Group Relative Policy Optimization — RL sans critique (DeepSeek) | | [[SFT]] | Supervised Fine-Tuning — le classique | | [[Curriculum-Learning]] | Apprentissage progressif par difficulté | | [[Data-Mixing]] | Stratégie de mélange des données d'entraînement | | [[Synthetic-Data]] | Génération de données d'entraînement par LLM | ~12 pages. #### 2D — Techniques Agentiques & Inférence | Concept | Description | |---------|-------------| | [[Tool-Use]] / [[Function-Calling]] | Appel d'outils structuré | | [[ReAct]] | Reasoning + Acting — boucle pensée/action | | [[Chain-of-Thought]] | Décomposition pas-à-pas | | [[Tree-of-Thoughts]] | Exploration d'arbres de raisonnement | | [[RAG]] | Retrieval-Augmented Generation — les variantes | | [[Reranking]] | Cross-encoder pour reclasser les résultats RAG | | [[Embeddings]] | Vectorisation sémantique (texte, image, code) | | [[MCP-Protocol]] | Model Context Protocol — standard de contexte | | [[A2A-Protocol]] | Agent-to-Agent — standard de communication entre agents | | [[Structured-Outputs]] | JSON mode, grammar, outils de parsing | | [[Streaming]] | Server-Sent Events, décodage incrémental | | [[Prompt-Caching]] | Cache de contexte système/répété | ~15 pages. #### 2E — Benchmarks & Évaluation | Benchmarks connus | Description | |-------------------|-------------| | [[SWE-bench]] | Résolution de bugs logiciels réels | | [[HumanEval]] / [[MBPP]] | Génération de code Python | | [[MMLU]] / [[MMLU-Pro]] | Connaissance multi-domaine | | [[GPQA]] | Questions de niveau doctorat | | [[AIME]] / [[MATH]] | Mathématiques olympiades | | [[Chatbot-Arena]] | Elo ranking par vote humain | | [[LMSys-Challenges]] | Évaluation ouverte collaborative | | [[HELM]] | Holistic Evaluation of Language Models | ~10 pages. **Total Phase 2** : ~80-100 pages → porté de 20 à **~120 pages IA**. --- ## ☸️ Phase 3 — Concepts auto-hébergement avancés **État** : ~15 pages (Docker, SSH, reverse proxy, backup...) ### 3A — Sécurité | Concept | Description | |---------|-------------| | [[WAF]] | Web Application Firewall | | [[IDS-IPS]] | Intrusion Detection / Prevention | | [[CrowdSec-vs-Fail2ban]] | Comparatif détaillé | | [[Zero-Trust-Homelab]] | Appliquer le zero-trust chez soi | | [[Hardening-Docker]] | Sécurisation des conteneurs | | [[SBOM]] | Software Bill of Materials | | [[Vulnerability-Scanning]] | Trivy, Grype, Snyk | | [[Secrets-Management]] | Vault, SOPS, bitwarden, rbw | | [[Honeypot]] | Bastion, CrowdSec bouncers | | [[Audit-Logging]] | Centralisation des logs sécurité | ~15 pages. ### 3B — Réseau | Concept | Description | |---------|-------------| | [[WireGuard-vs-Tailscale]] | Comparatif VPN | | [[Headscale]] | Self-hosted Tailscale control plane | | [[SDN]] | Software-Defined Networking | | [[MACVLAN]] / [[IPVLAN]] | Modes réseau Docker avancés | | [[VXLAN]] | Overlay réseau | | [[BGP-Homelab]] | Routage dynamique chez soi | | [[DNS-Architecture]] | Résolveurs, bloqueurs, split-horizon | | [[Reverse-Proxy-Comparison]] | Traefik vs Caddy vs Nginx vs HAProxy | | [[API-Gateway]] vs [[Reverse-Proxy]] | Différence et cas d'usage | | [[Load-Balancing]] | Round-robin, least-conn, sticky sessions | ~15 pages. ### 3C — Stockage & Sauvegardes | Concept | Description | |---------|-------------| | [[RAID-vs-ZFS-vs-BTRFS]] | Comparatif filesystems | | [[Distributed-Storage]] | Longhorn, Rook/Ceph, SeaweedFS | | [[Object-Storage]] | MinIO — S3 compatible | | [[Backup-3-2-1]] | Stratégie, Restic vs Borg vs Kopia vs Duplicati | | [[Immutable-Backups]] | Sauvegardes non-modifiables | | [[Offsite-Backup]] | Backblaze B2, rsync.net, auto-hébergé | ~10 pages. ### 3D — Orchestration & Déploiement | Concept | Description | |---------|-------------| | [[Kubernetes-Homelab]] | K3s, MicroK8s, Kubeadm | | [[Kubernetes-vs-Nomad-vs-Docker-Swarm]] | Comparatif orchestrateurs | | [[GitOps]] | ArgoCD, Flux, déploiement déclaratif | | [[Coolify-vs-Dokploy-vs-Caprover]] | Comparatif PaaS auto-hébergé | | [[Blue-Green-Deployment]] | Déploiement sans interruption | | [[Canary-Deployment]] | Déploiement progressif | | [[Rolling-Update]] | Mise à jour sans downtime | ~10 pages. **Total Phase 3** : ~50 pages → porté à **~70 pages auto-hébergement**. --- ## 📗 Phase 4 — Guides & Tutos pratiques **État** : ~7 pages (checklists actuelles). ### Idées de guides | Guide | Description | Type | |-------|-------------|:----:| | **Déployer Authentik avec Traefik + CrowdSec** | SSO complet, pas-à-pas | Tuto | | **Migration de NPM vers Traefik** | Tout ce qu'il faut savoir | Tuto | | **Durcir un serveur Ubuntu/Debian** | Checklist exhaustive | Checklist | | **Sécuriser Docker en production** | Rootless, signatures, scan | Checklist | | **Monitoring complet d'un homelab** | Uptime Kuma + Grafana + Loki + Alertes | Tuto | | **Sauvegardes automatisées avec Restic** | Scripts, systemd timers, off-site | Tuto | | **Déployer Coolify de A à Z** | VPS → Apps en prod | Tuto | | **Déployer Dokploy de A à Z** | Alternative à Coolify | Tuto | | **Reverse proxy multihôte avec Traefik** | Docker, file providers, middleware | Tuto | | **Configurer Tailscale + Headscale** | Mesh VPN, ACLs, exit nodes | Tuto | | **Configurer un serveur DNS Hidden Master** | Technitium → HE.NET | Tuto | | **Guide complet Postfix/Dovecot** | Mail self-hosté (si tu veux) | Tuto | | **[Créer un guide par service du catalogue]** | Les 20 apps les plus complexes | Tuto | **Objectif Phase 4** : ~50-80 guides → porté à **~60-90 pages**. --- ## ⚖️ Phase 5 — Comparatifs **État** : ~17 pages. ### Comparatifs à créer (un par catégorie d'outils) | Catégorie | Outils comparés | Utilité | |-----------|----------------|:-------:| | Reverse Proxy | Traefik vs Caddy vs Nginx vs HAProxy | ⭐⭐ | | Dashboard | Homepage vs Homer vs Dashy vs Flame | ⭐⭐⭐ | | SSO | Authentik vs Authelia vs Keycloak vs Casdoor | ⭐⭐⭐ | | Monitoring | Uptime Kuma vs Grafana vs Netdata vs Checkmk | ⭐⭐ | | Observabilité | Loki vs SigNoz vs Highlight vs BetterStack | ⭐⭐ | | Backup | Restic vs Borg vs Kopia vs Duplicati | ⭐⭐ | | DNS | Technitium vs AdGuard vs Pi-hole vs Blocky vs Unbound | ⭐⭐ | | Mail | Mailcow vs Mailu vs Stalwart vs Maddy | ⭐⭐ | | Photo | Immich vs Photoprism vs LibrePhotos vs Piwigo | ⭐⭐ | | Media | Jellyfin vs Plex vs Emby | ⭐⭐ | | Notes | Joplin vs Outline vs Trillium vs SiYuan vs Obsidian LiveSync | ⭐⭐⭐ | | Git | Gitea vs GitLab CE vs Forgejo vs SourceHut | ⭐⭐ | | CI/CD | Drone vs Woodpecker vs Concourse vs Jenkins | ⭐ | | VPN | WireGuard vs Tailscale vs OpenVPN vs Nebula | ⭐⭐ | | Database | PostgreSQL vs MySQL vs MariaDB vs SQLite vs ClickHouse | ⭐⭐ | | Queue | RabbitMQ vs Redis vs NATS vs Kafka vs ZeroMQ | ⭐ | | Container Registry | Harbor vs Registry vs Zot vs Dragonfly | ⭐ | | PaaS | Coolify vs Dokploy vs Caprover vs Kamal | ⭐⭐⭐ | | Firewall | CrowdSec vs Fail2ban vs nftables vs OPNsense | ⭐⭐ | **Objectif Phase 5** : ~30-50 comparatifs → porté à **~50-70 pages**. --- ## 🏛️ Phase 6 — Licences & Écosystème Open-Source **État** : ~3 pages (Apache-2, GPLv3, MIT). ### Licences à documenter | Licence | Type | Compatibilité | |---------|:----:|:-------------:| | [[LGPL-v3]] / [[LGPL-v2.1]] | Copyleft faible | GPL | | [[BSD-2-Clause]] / [[BSD-3-Clause]] | Permissive | Apache-2, MIT, GPL | | [[MPL-2.0]] | Copyleft faible (fichier) | Apache-2, GPL | | [[AGPL-v3]] | Copyleft fort réseau | GPLv3 | | [[EUPL]] | Copyleft européen | GPLv3 | | [[BSL]] | Business Source License → Apache-2 | ↑ | | [[SSPL]] | Server Side Public License — controversée | ↑ | | [[Elastic-License]] | BSL-like → Elastic → SSPL | ↑ | | [[Commons-Clause]] | Pas vraiment open-source | ↑ | | [[Fair-Source]] | Mouvement alternatif | ↑ | | [[Unlicense]] / [[CC0]] | Domaine public | Toutes | | [[Prosperity]] | Source disponible non-commerciale | ↑ | | [[PolyForm]] | Shield, Small Business, Noncommercial | ↑ | | [[License-Compatibility-Matrix]] | Tableau de compatibilité complète | ⭐⭐ | ### Écosystème & Fondations | Sujet | Description | |-------|-------------| | [[CNCF-Landscape]] | Cloud Native Computing Foundation — projets et catégories | | [[Apache-Software-Foundation]] | Gouvernance des projets Apache | | [[Linux-Foundation]] | Organisation mère de nombreux projets | | [[Mozilla-Foundation]] | Firefox, MDN, Rust | | [[OpenAI-Transition]] | Open → Closed → For-profit | | [[License-History]] | Évolution des licences open-source (GPL → BSL → SSPL) | | [[Commercial-Open-Source]] | Modèles économiques open-source durables | | [[Fork-Patterns]] | Quand et pourquoi les projets forkent (Redis/Valkey, Terraform/OpenTofu) | **Objectif Phase 6** : ~40 pages → porté de 3 à **~40 pages**. --- ## 📋 Plan d'exécution ### Ordre recommandé ``` Phase 1 → 🏷️ Terminer le catalogue (priorité max — reprendre là où on était) ↓ Phase 2 → 🧠 Concepts IA (le plus gros potentiel de valeur) ↓ Phase 5 → ⚖️ Comparatifs (complète les fiches du catalogue) ↓ Phase 3 → ☸️ Concepts auto-hébergement (approfondir ce qu'on catalogue) ↓ Phase 4 → 📗 Guides & tutos (pratique, consolide tout) ↓ Phase 6 → 🏛️ Licences & open-source (fondamentaux, moins prioritaire) ``` Chaque phase peut être réalisée en sessions de 1-2h. Les phases 2-6 se chevauchent — on peut alterner. ### Méthode de travail - **Sessions normales** : 1 axe par session, `delegate_task` pour les batchs, mise à jour PROJET/log.md en fin de session - **Sessions marathon** : enchaîner 3-5 sous-axes avec la méthode [[references/catalogue-session-marathon-night-2026-06-07.md]] - **Sessions autonomes** : Velli absent, mode roadmap + `delegate_task` massif --- ## 📈 Suivi de progression | Phase | Pages cibles | Pages faites | % | |-------|:-----------:|:-----------:|:-:| | 1 — Catalogue | +250 | 0 | 0% | | 2 — IA | +280 | 0 | 0% | | 3 — Auto-hébergement | +185 | 0 | 0% | | 4 — Guides | +193 | 0 | 0% | | 5 — Comparatifs | +133 | 0 | 0% | | 6 — Licences | +77 | 0 | 0% | | **TOTAL** | **~2 730** | **~1 700** | **62%** | --- ## 🔗 Pages liées - [[Catalogue-Self-Hosted]] — Le hub du catalogue - [[references/scrape-selfhst-cdn.md]] — Scraper selfh.st - [[references/parallel-fiche-delegation.md]] — Production parallèle - [[references/catalogue-session-7cat-2026-06-08.md]] — Mode travail seul - [[references/marathon-night-2026-06-07.md]] — Marathon mode - [[Dashboard]] — Le dashboard Dataview du wiki - [[log]] — Journal des actions - [[PROJET-CATALOGUE]] — Suivi du catalogue