Aller au contenu principal

Observabilité

Progression

#Observabilité

On observe par trois canaux complémentaires: métriques pour les tendances, logs pour les événements, et traces pour les parcours distribués. Les SLI mesurent ce qui compte pour l’utilisateur, les SLO fixent un objectif raisonnable, et l’erreur budgétée cadre le rythme des changements. Une alerte doit pointer une action concrète et éviter le bruit chronique.

L’observabilité n’est pas un « dashboard » de plus: c’est un outil d’enquête. On instrumente d’abord, on pose des hypothèses ensuite, puis on étaye par des corrélations et des expériences contrôlées. Les traces aident à comprendre les dépendances; les métriques de saturation évitent de confondre symptômes et causes.

#Animation: de l’instrumentation aux SLO

Instrumenter
Logs, métriques, traces (OpenTelemetry)
SLI/SLO
Ce que voit l’utilisateur
Alerter
Seuils, taux d’erreur, burn rate
Enquêter
Corréler et tracer le chemin
Améliorer
Boucle: post‑mortems, budgets

#Diagramme: requête traçée de bout en bout

Frontend
API
DB
1. GET /items (traceId=...)
2. SELECT ... (span, tags)
3. rows + duration
4. 200 + traceId