Cours Stage - Inégalité de Bienaymé-Tchebychev

Exercice - Inégalité de Bienaymé Tchebychev

L'énoncé

Répondre aux questions suivantes 


Question 1

Rappeler l'inégalité de Bienaymé Tchebychev. 

Soit $X$ une variable aléatoire quelconque, d'espérance $\mu$ et de variance $V$,
Soit $\epsilon > 0$,
L'inégalité de Bienaymé Tchebychev nous apprend que :
$P(|X-\mu|\geq \epsilon) \leq \dfrac{V}{\epsilon^2}$

On se référera au cours si besoin. 

Question 2

Une élection oppose deux candidats $A$ et $B$. On note $p$ la proportion inconnue de personnes décidée à voter pour le candidat $A$. On souhaite estimer cette proportion. On effectue pour cela un sondage, que l'on assimile à $n$ tirages avec remise. 
On note $X_i$ la variable aléatoire qui vaut $1$ si la $i$-ème personne vote pour le candidat $A$ et $0$ sinon.

On souhaite estimer $p$ avec la variable aléatoire $M_n = \dfrac{X_1 + X_2 + ... + X_n}{n}$. 

Donner l'espérance et la variance de $M_n$. 

Les variables aléatoire $X_i$ sont des variables aléatoire de Bernoulli de paramètre $p$ indépendantes et identiquement distribuées. $S_n = X_1 + X_2 + ... + X_n$ suit donc une loi de Bernoulli de paramètres $(n, p)$. 

Ainsi $\mathbb{E}(S_n) = np$ et $V(S_n) = np(1-p)$ d'après les propriétés d'une loi binomiale.

Or, on remarque que $M_n = \dfrac{S_n}{n}$.
En outre, on sait que l'espérance est un opérateur linéaire ($\mathbb{E}(aY) = a\mathbb{E}(Y)$) et que la variance a pour propriété $V(aY) = a^2 V(Y)$.

Finalement, on en déduit donc que $\mathbb{E}(M_n) = \dfrac{\mathbb{E}(S_n)}{n} = p$ (on retrouve le fait qu'il est naturel d'estimer $p$ par $M_n$) et que $V(M_n) = \dfrac{V(S_n)}{n^2} = \dfrac{p(1-p)}{n}$

Quelle loi suit $X_i$ ? 


On pourra commencer par étudier $S_n = X_1 + X_2 + ... + X_n$. 

Question 3

Soit $\epsilon > 0$,
Majorer la probabilité suivante $P(|M_n - p|\geq \epsilon)$.

Soit $\epsilon > 0$,
On utilise l'inégalité de Bienaymé Tchebychev : 
$P(|M_n - p|\geq \epsilon) \leq \dfrac{p(1-p)}{n\epsilon^2}$

On utilisera l'inégalité rappelée en question $1$. 

Question 4

Soit $f$ la fonction défini sur un intervalle $D$ que l'on déterminera par $f(p) = p(1-p)$.
Etudier la fonction $f$.

On remarque que l'on étudie ici le dénominateur du majorant de la probabilité étudiée. Ainsi, la probabilité $p$ prend des valeurs dans l'intervalle $D = [0; 1]$.
Soit $p \in I$,
$f$ est dérivable en tant que produit de fonctions dérivables sur $I$.
En outre, $f'(p) = (1 - p) - p = 1 - 2p$. 
Soit $p \in I$,
$f'(p) \geq 0 \iff 1 - 2p \geq 0 \iff \dfrac{1}{2} \geq p$
De même, $f'(p) \leq 0 \iff 1 - 2p \leq 0 \iff \dfrac{1}{2} \leq p$

En outre, $f(0) = f(1) = 0$ et $f\left ( \dfrac{1}{2} \right ) = \dfrac{1}{4}$

On en déduit donc le tableau de variation suivant :
TABLEAU A INSERER ICI

L'emploi de la variable $p$ n'est pas anodin...

Question 5

En déduire une majoration de $P(|M_n - p|\geq \epsilon) $ indépendante de $p$.

On sait que $p(1-p) \leq \dfrac{1}{4}$.
Ainsi, pour $\epsilon > 0$,
$P(|M_n - p|\geq \epsilon) \leq \dfrac{p(1-p)}{n\epsilon^2} \leq \dfrac{1}{4n\epsilon^2}$

On utilisera le maximum de la question précédente.

Question 6

En déduire un minorant de la probabilité $P(p \in ]M_n - \epsilon; M_n + \epsilon [)$. 

Soit $\epsilon > 0$,
$ P(p \in ]M_n - \epsilon; M_n + \epsilon [) = 1 - P(|M_n - p|\geq \epsilon) \geq 1 - \dfrac{1}{4n\epsilon^2}$
On dira alors que l'intervalle $I = ]M_n - \epsilon; M_n + \epsilon [$ est un intervalle de confiance pour $p$ au niveau $1 - \dfrac{1}{4n\epsilon^2}$

On utilisera à nouveau la question précédente. 

Question 7

On dit que l'intervalle $I = ]M_n - \epsilon; M_n + \epsilon [$ est un intervalle de confiance pour $p$ au niveau $1 - \dfrac{1}{4n\epsilon^2}$.
Un sondage réalisé auprès de $1000$ personnes donne une fréquence observée de $0,53$. 
Déterminer epsilon pour que le niveau de confiance soit au moins égal à $95\%$. 

La fréquence observée nous donne la valeur de $M_{1000} = 0,53$
On souhaite donc déterminer $\epsilon$ tel que $P(p \in ]0,53 - \epsilon; 0,53 + \epsilon [) \geq 0,95$ c'est à dire $1 - \dfrac{1}{4000\epsilon^2} \geq 0,95 \iff \epsilon \geq \dfrac{1}{10\sqrt{2}} \approx 0,071$

Cela revient à déterminer $\epsilon$ tel que $P(p \in ]0,53 - \epsilon; 0,53 + \epsilon [) \geq 0,95$

Question 8

Peut-on affirmer la victoire du candidat $A$ avec une erreur inférieure $5\%$ ? 

On sait d'après la question précédente que $\epsilon \approx 0,071$. 
L'intervalle de confiance au seuil de $95 \%$ est donc $I = ]0,53 - 0,071 ; 0,53 + 0,071 [ = ]0,459; 0,601 [$.
Ainsi $p$ peut prendre des valeurs inférieures à $0,5$.

On ne peut donc pas affirmer une victoire du candidat $A$ avec une erreur inférieure à $5\%$. 

On pourra écrire l'intervalle de confiance trouvé.