--- title: Load Shedding created: 2026-06-06 updated: 2026-06-06 type: concept tags: [architecture, devops, tech] confidence: high contested: false sources: [synthesized] --- # ✂️ Load Shedding ## Définition Courte Stratégie consistant à **rejeter délibérément certaines requêtes** sous forte charge pour **préserver la stabilité** du service, plutôt que de tout laisser s'effondrer. ## Explication Détaillée **Principe** : quand un système sature, accepter de perdre quelques requêtes pour éviter de perdre *toutes* les requêtes. C'est un compromis explicite disponibilité/charge. **Stratégies** : - **Priority-based** : rejeter d'abord les clients bas-priorité (free users avant paid). - **Adaptive** : baisser la qualité des réponses (ex: pas d'images, pas de recommandations). - **Circuit Breaker** : couper un service en panne pour éviter l'effet domino. - **Queue-based** : accepter la requête, la mettre en file, refuser si la queue est pleine. - **Geographic** : couper certaines régions d'abord. **Différent du rate limiting** : le rate limiting est **préventif** (limite par user). Le load shedding est **réactif** (le système se protège globalement). ## Cas d'Usage - API LLM en cas de pic de trafic soudain. - Plateforme de e-commerce pendant le Black Friday. - Service de paiement lors d'un incident bancaire. - Toute infra avec auto-scaling limité. ## Outils Liés - **Hystrix** (Netflix, historique). - **Resilience4j** (Java). - **Polly** (.NET). - **Istio** (priority routing). - **Cloudflare** (rate limit adaptatif). ## Pages Liées - [[haute-disponibilite]] - [[rate-limiting]] - [[circuit-breaker]] - [[chaos-engineering]] ## Questions Ouvertes - Comment communiquer élégamment les rejets aux clients (UX) ? - Le load shedding peut-il être automatisé par IA (prédire la saturation) ?