Autoscaling

Progression

#Autoscaling

L’autoscaling ajuste les ressources à la demande. Le scaling réactif par métriques d’infrastructure (CPU, mémoire) est simple mais myope. Un scaling par file d’attente ou par SLI cible directement ce qui compte pour l’utilisateur. Le scaling prédictif s’appuie sur des cycles connus, mais il reste prudent face à l’incertitude.

La stabilité compte autant que la vitesse: on filtre le bruit par des fenêtres, on impose des délais de refroidissement, et on cappe la croissance pour éviter les effets ping‑pong. Les limites par service et par namespace empêchent un service bavard d’asphyxier les autres.

#Parcours visuel

1/4

#Démos rapides

RPS

Pods

Latence p95 (ms)

#Bons réglages (hystérésis)

Fenêtre glissante

Lisser 30–60s pour éviter le ping‑pong sur pics brefs.

Cooldown

Attendre avant une action opposée (ex.: 2–5 min après scale out).

Cap & min

Fixer bornes raisonnables pour absorber sans étouffer le cluster.

Autoscaling

Progression

#AutoscalingCopier le lien

#Parcours visuelCopier le lien

#Démos rapidesCopier le lien

#Bons réglages (hystérésis)Copier le lien

#Autoscaling

#Parcours visuel

#Démos rapides

#Bons réglages (hystérésis)