Aller au contenu principal

Mise en production des modèles

Progression

#Mise en production des modèles

Mettre un modèle en production ne se résume pas à exposer une API. On définit des contrats d’entrées et de sorties, on versionne le modèle et ses dépendances, et on surveille la latence, les erreurs et la dérive de données. Les tests d’intégration couvrent le pipeline de features autant que l’inférence.

La stratégie de déploiement alterne canary, A/B et shadow traffic pour limiter les risques. Le feedback de production alimente un processus d’amélioration continue avec des données fraîches et des protocoles de ré‑entraînement maîtrisés.

#Animation: du labo à la prod

Contrat
Schéma d’entrée/sortie stable
Packaging
Versionner modèle + dépendances
CI/CD
Tests + benchmark + sécurité
Déploiement
Canary/A‑B/Shadow
Surveillance
Latence, erreurs, dérive
Ré‑entraînement
Datasets frais, protocole

#Diagramme: canary contrôlé

Client
Gateway
Model v1
Model v2 (canary)
1. POST /infer
2. Routage 95%
3. Routage 5%
4. Réponse + métriques
5. Réponse + métriques
6. 200 (selon branche)

Mini‑exercice: définissez les SLI/SLO (latence p95, taux d’erreur, drift de features) et les seuils de promotion/rollback d’un canary. Décrivez le protocole de ré‑entraînement (fenêtre de données, validation hors‑ligne, tests d’intégration).