Intervalle de fluctuation - (niveau 1)

Intervalle de fluctuation – niveau 1

 

Modèle de Bernoulli 

 

On considère une expérience de Bernoulli, c’est à dire une expérience aléatoire ayant uniquement deux issues possibles : succès et échec.

C’est par exemple le cas du lancer d’une pièce, selon l’exercice, obtenir “pile” constituera un succès et obtenir “face” sera un échec.

La probabilité d’obtenir le succès $S$ est $p$ et la somme des deux probabilités devant valoir 1, la probabilité de l’échec, noté $overline{S}$, vaut $1 – p$.

On répète cette expérience $n$ fois.

La théorie qui suit nécessite que les hypothèses suivantes soient vérifiées : $n \geq 25$ (si ce n’est pas le cas, on considère que le nombre de répétitions n’était pas suffisant pour obtenir un ensemble représentatif de la réalité) et $0,2 \leq \p \leq 0,8$.

Lorsque l’on jette une pièce et que l’on observe le résultat, on obtient en théorie “pile” avec une probabilité de $0,5$.

Cependant, lorsque l’on jette par exemple la pièce 10 fois, on n’obtient pas systématiquement 5 fois pile et 5 fois face. Le nombre de “pile” obtenu fluctue donc d’une série de lancers à l’autre, il varie donc un intervalle de fluctuations. 

Ainsi, dans les conditions décrites précédemment, l’intervalle de fluctuation $I_f$ vaut :

$ I_f = \left [p – dfrac{1}{sqrt{n}}; \p + dfrac{1}{sqrt{n}} \right ]$ au seuil de $95 %$.

Cela signifie que dans $95 %$ des cas, la probabilité du succès observée appartiendra à l’intervalle. 

 

Exemple : 

Un joueur tire une carte dans un jeu puis la remet.

Le succès dans cette expérience aléatoire est donc d’obtenir un coeur, et la probabilité d’obtenir un coeur est $p = 0,25$. 

Il répète cette expérience $n$ fois.

 

On suppose dans un premier temps que $n = 100$. On a bien $n \geq 25$ et $0,2 \leq \p \leq 0,8$.

Ainsi, $I_f = \left [p – dfrac{1}{sqrt{100}}; \p + dfrac{1}{sqrt{100}} \right ]$ c’est à dire :

$I_f =  [0,15; 0,35]$.

Cela signifie donc que si on choisit 100 fois de suite une carte, on obtiendra un coeur entre $15 %$ et $35 %$ des cas. 

 

On suppose à présent que $n = 10 000$. On obtient alors :

$I_f =  [0,24; 0,26]$. 

Cela signifie donc que si on choisit 10 000 fois de suite une carte, la fréquence d’apparition d’un coeur variera entre $0,24$ et $0,26$ dans $95%$ des cas. 

 

En conclusion, plus on répète un grand nombre de fois une expérience, plus les bornes de l’intervalle de fluctuation se resserrent autour de la probabilité théorique $p$. 

Intervalle de fluctuation (niveau 2)

Intervalle de fluctuation – niveau 2

 

Rappel

 

On rappelle la loi faible des grands nombres à travers un exemple :

On lance une pièce 100 fois et on note la fréquence d’apparition du côté face.

Si la pièce est bien équilibrée et la taille de l’échantillon étant suffisante, cette fréquence doit être voisine de 0,5 qui correspond à la probabilité théorique d’obtenir le côté face. 

Dans cette expérience, nous sommes en présence d’un schéma de Bernoulli, c’est à dire la répétition d’une même épreuve 100 fois avec deux issues possibles, ces épreuves étant toutes indépendantes les unes des autres, avec une probabilité de succès constante valant 0,5. 

 

Propriété 

 

Pour environ 95% des échantillons de taille $n$, dans un modèle de Bernoulli, avec $p$ la probabilité du succès, la fréquence d’apparition du succès  appartient à l’intervalle de fluctuation au seuil de 95% donné par :

$ f_{obs} \in I_F = \left [ \p – dfrac{1}{sqrt{n}}; p + dfrac{1}{sqrt{n}}right ] $.

Deux conditions sont à vérifier pour que l’intervalle donné soit valide :

$n \geq 25$, la taille de l’échantillon doit être suffisamment grande

$0,2 \leq \p \leq 0,8$, la probabilité \ne doit pas être trop petite ni trop grande.

 

Applications à la prise de décision 

 

1) On lance 4000 fois une pièce et on obtient 2050 fois le côté pile. On se demande si la pièce est truquée. 

On teste donc l’hypothèse que la pièce n’est pas truquée et donc que $p = 0,5$. 

On vérifie alors les conditions d’applications de la formule :

$p = 0,5 \in [0,2; 0,8]$ et $ n = 4000 \geq 25$.

On peut alors appliquer la formule. 

Si la pièce n’est pas truquée, la fréquence de pile observée $f_{obs} = \dfrac{2050}{4000} = 0,5125$ doit appartenir à l’intervalle de fluctuation

$I_F = \left [0,5 – dfrac{1}{sqrt{4000}}; 0,5 + dfrac{1}{sqrt{4000}} \right ] \approx [0,484; 0,516]$.

On constante que $0,5125$ apparient à $I_F$, ainsi l’hypothèse que $p=0,5$ n’est pas rejetée, la pièce n’est donc pas truquée.

 

2) Dans une maternité sont nés 132 enfants donc 46 filles. 

On se demande si les naissances se font au hasard, c’est à dire si dans une maternité, il y a autant de chance que cela soit un garçon qui naisse qu’une fille.

 On teste donc l’hypothèse que la probabilité qu’une fille naisse vaut $p = 0,5$. 

Les conditions d’application du théorème sont vérifiées ($ \p = 0,5 \in [0,2; 0,8]$ et $n = 132 \geq 25$). 

L’intervalle de fluctuation vaut alors $I_F = \left [0,5 – dfrac{1}{sqrt{132}}; 0,5 + dfrac{1}{sqrt{132}} \right ] \approx [0,413; 0,587]$.

Or, la fréquence observée de naissance de filles vaut $f_{obs} = \dfrac{46}{132} \approx 0,348 \notin I_F$. 

L’hypothèse que les naissances sont le fruit du hasard est donc rejetée.