Files
wiki/concepts/load-shedding.md
T
2026-06-09 18:40:21 +02:00

50 lines
1.8 KiB
Markdown

---
title: Load Shedding
created: 2026-06-06
updated: 2026-06-06
type: concept
tags: [architecture, devops, tech]
confidence: high
contested: false
sources: [synthesized]
---
# ✂️ Load Shedding
## Définition Courte
Stratégie consistant à **rejeter délibérément certaines requêtes** sous forte charge pour **préserver la stabilité** du service, plutôt que de tout laisser s'effondrer.
## Explication Détaillée
**Principe** : quand un système sature, accepter de perdre quelques requêtes pour éviter de perdre *toutes* les requêtes. C'est un compromis explicite disponibilité/charge.
**Stratégies** :
- **Priority-based** : rejeter d'abord les clients bas-priorité (free users avant paid).
- **Adaptive** : baisser la qualité des réponses (ex: pas d'images, pas de recommandations).
- **Circuit Breaker** : couper un service en panne pour éviter l'effet domino.
- **Queue-based** : accepter la requête, la mettre en file, refuser si la queue est pleine.
- **Geographic** : couper certaines régions d'abord.
**Différent du rate limiting** : le rate limiting est **préventif** (limite par user). Le load shedding est **réactif** (le système se protège globalement).
## Cas d'Usage
- API LLM en cas de pic de trafic soudain.
- Plateforme de e-commerce pendant le Black Friday.
- Service de paiement lors d'un incident bancaire.
- Toute infra avec auto-scaling limité.
## Outils Liés
- **Hystrix** (Netflix, historique).
- **Resilience4j** (Java).
- **Polly** (.NET).
- **Istio** (priority routing).
- **Cloudflare** (rate limit adaptatif).
## Pages Liées
- [[haute-disponibilite]]
- [[rate-limiting]]
- [[circuit-breaker]]
- [[chaos-engineering]]
## Questions Ouvertes
- Comment communiquer élégamment les rejets aux clients (UX) ?
- Le load shedding peut-il être automatisé par IA (prédire la saturation) ?