Aller au contenu principal

Bases des probabilités

Progression

#Bases des probabilités

Un univers aléatoire se décrit par un ensemble d’issues possibles, un ensemble d’événements (des sous‑ensembles) et une mesure de probabilité qui attribue un nombre entre 0 et 1 à chaque événement. Les axiomes de Kolmogorov fixent le cadre: positivité, normalisation à 1, et additivité sur des événements disjoints. Tout raisonnement probabiliste cohérent s’y inscrit.

La probabilité conditionnelle P(A|B) quantifie la chance de A sachant que B est vrai. Elle modélise l’idée intuitive que l’information change les chances. La formule de Bayes renverse les probabilités pour relier une hypothèse et une observation; on s’en sert pour mettre à jour des croyances au vu de nouvelles données. Il est crucial d’intégrer la base rate: un test très sensible peut générer beaucoup de faux positifs si l’événement testé est rare dans la population.

L’indépendance exprime qu’apprendre B ne change pas la probabilité de A. Dans les problèmes réels, c’est souvent une approximation utile mais à vérifier. Une dépendance subtile suffit à renverser une conclusion naïve; confondre corrélation et causalité mène à des politiques inefficaces.

Un exercice canonique éclaire ces pièges: un dépistage avec 99% de sensibilité et 99% de spécificité ne signifie pas « 99% de chances d’être malade si le test est positif ». Si la prévalence est de 1%, la probabilité d’être malade sachant un test positif est proche de 50%. La différence entre précision conditionnelle et taux de base explique ce résultat.

#Animation: construire un modèle probabiliste

Espace Ω
Issues possibles (univers)
Événements
Sous‑ensembles de Ω
Mesure P
Axiomes, additivité
Conditionnelle
P(A|B) ; Bayes
Indépendance
P(A∩B)=P(A)P(B)

#Explorer : impact du taux de base

Explorer le théorème de Bayes

Ajustez prévalence, sensibilité et spécificité. Observez le taux de vrais positifs parmi les tests positifs (précision) et l’impact du taux de base.

Population générale, test très sensible mais faible prévalence.

Prédictivité du test

PPV (Précision)
50.0 %
NPV
100.0 %
Taux de base
1.0 %
Lift vs taux de base
×50.00

PPV = P(malade | test +). Même un test très précis peut avoir un PPV faible si la prévalence est minime : c’est le piège classique du taux de base.

Table de contingence (pour 10 000 personnes)

Test + & malade
99
Test + & sain
99
Test − & sain
9 801
Test − & malade
1

Les volumes absolus aident à expliquer la surprise des faux positifs. Comparez toujours le nombre de tests positifs (198) au nombre réel de cas (99).

#Playground: loi des grands nombres (Monte Carlo)

Chargement de l’éditeur...