Autoscaling
Progression
#Autoscaling
L’autoscaling ajuste les ressources à la demande. Le scaling réactif par métriques d’infrastructure (CPU, mémoire) est simple mais myope. Un scaling par file d’attente ou par SLI cible directement ce qui compte pour l’utilisateur. Le scaling prédictif s’appuie sur des cycles connus, mais il reste prudent face à l’incertitude.
La stabilité compte autant que la vitesse: on filtre le bruit par des fenêtres, on impose des délais de refroidissement, et on cappe la croissance pour éviter les effets ping‑pong. Les limites par service et par namespace empêchent un service bavard d’asphyxier les autres.
#Parcours visuel
1/4
#Démos rapides
RPS
0
Pods
0
Latence p95 (ms)
0
#Bons réglages (hystérésis)
Fenêtre glissante
Lisser 30–60s pour éviter le ping‑pong sur pics brefs.
Cooldown
Attendre avant une action opposée (ex.: 2–5 min après scale out).
Cap & min
Fixer bornes raisonnables pour absorber sans étouffer le cluster.