Initial vault setup
This commit is contained in:
@@ -0,0 +1,49 @@
|
||||
---
|
||||
title: Load Shedding
|
||||
created: 2026-06-06
|
||||
updated: 2026-06-06
|
||||
type: concept
|
||||
tags: [architecture, devops, tech]
|
||||
confidence: high
|
||||
contested: false
|
||||
sources: [synthesized]
|
||||
---
|
||||
# ✂️ Load Shedding
|
||||
|
||||
## Définition Courte
|
||||
Stratégie consistant à **rejeter délibérément certaines requêtes** sous forte charge pour **préserver la stabilité** du service, plutôt que de tout laisser s'effondrer.
|
||||
|
||||
## Explication Détaillée
|
||||
**Principe** : quand un système sature, accepter de perdre quelques requêtes pour éviter de perdre *toutes* les requêtes. C'est un compromis explicite disponibilité/charge.
|
||||
|
||||
**Stratégies** :
|
||||
- **Priority-based** : rejeter d'abord les clients bas-priorité (free users avant paid).
|
||||
- **Adaptive** : baisser la qualité des réponses (ex: pas d'images, pas de recommandations).
|
||||
- **Circuit Breaker** : couper un service en panne pour éviter l'effet domino.
|
||||
- **Queue-based** : accepter la requête, la mettre en file, refuser si la queue est pleine.
|
||||
- **Geographic** : couper certaines régions d'abord.
|
||||
|
||||
**Différent du rate limiting** : le rate limiting est **préventif** (limite par user). Le load shedding est **réactif** (le système se protège globalement).
|
||||
|
||||
## Cas d'Usage
|
||||
- API LLM en cas de pic de trafic soudain.
|
||||
- Plateforme de e-commerce pendant le Black Friday.
|
||||
- Service de paiement lors d'un incident bancaire.
|
||||
- Toute infra avec auto-scaling limité.
|
||||
|
||||
## Outils Liés
|
||||
- **Hystrix** (Netflix, historique).
|
||||
- **Resilience4j** (Java).
|
||||
- **Polly** (.NET).
|
||||
- **Istio** (priority routing).
|
||||
- **Cloudflare** (rate limit adaptatif).
|
||||
|
||||
## Pages Liées
|
||||
- [[haute-disponibilite]]
|
||||
- [[rate-limiting]]
|
||||
- [[circuit-breaker]]
|
||||
- [[chaos-engineering]]
|
||||
|
||||
## Questions Ouvertes
|
||||
- Comment communiquer élégamment les rejets aux clients (UX) ?
|
||||
- Le load shedding peut-il être automatisé par IA (prédire la saturation) ?
|
||||
Reference in New Issue
Block a user