L'énoncé
Répondre aux questions suivantes
Question 1
Rappeler l'inégalité de Bienaymé Tchebychev.
Soit $X$ une variable aléatoire quelconque, d'espérance $\mu$ et de variance $V$,
Soit $\epsilon > 0$,
L'inégalité de Bienaymé Tchebychev nous apprend que :
$P(|X-\mu|\geq \epsilon) \leq \dfrac{V}{\epsilon^2}$
On se référera au cours si besoin.
Question 2
Une élection oppose deux candidats $A$ et $B$. On note $p$ la proportion inconnue de personnes décidée à voter pour le candidat $A$. On souhaite estimer cette proportion. On effectue pour cela un sondage, que l'on assimile à $n$ tirages avec remise.
On note $X_i$ la variable aléatoire qui vaut $1$ si la $i$-ème personne vote pour le candidat $A$ et $0$ sinon.
On souhaite estimer $p$ avec la variable aléatoire $M_n = \dfrac{X_1 + X_2 + ... + X_n}{n}$.
Donner l'espérance et la variance de $M_n$.
Les variables aléatoire $X_i$ sont des variables aléatoire de Bernoulli de paramètre $p$ indépendantes et identiquement distribuées. $S_n = X_1 + X_2 + ... + X_n$ suit donc une loi de Bernoulli de paramètres $(n, p)$.
Ainsi $\mathbb{E}(S_n) = np$ et $V(S_n) = np(1-p)$ d'après les propriétés d'une loi binomiale.
Or, on remarque que $M_n = \dfrac{S_n}{n}$.
En outre, on sait que l'espérance est un opérateur linéaire ($\mathbb{E}(aY) = a\mathbb{E}(Y)$) et que la variance a pour propriété $V(aY) = a^2 V(Y)$.
Finalement, on en déduit donc que $\mathbb{E}(M_n) = \dfrac{\mathbb{E}(S_n)}{n} = p$ (on retrouve le fait qu'il est naturel d'estimer $p$ par $M_n$) et que $V(M_n) = \dfrac{V(S_n)}{n^2} = \dfrac{p(1-p)}{n}$
Quelle loi suit $X_i$ ?
On pourra commencer par étudier $S_n = X_1 + X_2 + ... + X_n$.
Question 3
Soit $\epsilon > 0$,
Majorer la probabilité suivante $P(|M_n - p|\geq \epsilon)$.
Soit $\epsilon > 0$,
On utilise l'inégalité de Bienaymé Tchebychev :
$P(|M_n - p|\geq \epsilon) \leq \dfrac{p(1-p)}{n\epsilon^2}$
On utilisera l'inégalité rappelée en question $1$.
Question 4
Soit $f$ la fonction défini sur un intervalle $D$ que l'on déterminera par $f(p) = p(1-p)$.
Etudier la fonction $f$.
On remarque que l'on étudie ici le dénominateur du majorant de la probabilité étudiée. Ainsi, la probabilité $p$ prend des valeurs dans l'intervalle $D = [0; 1]$.
Soit $p \in I$,
$f$ est dérivable en tant que produit de fonctions dérivables sur $I$.
En outre, $f'(p) = (1 - p) - p = 1 - 2p$.
Soit $p \in I$,
$f'(p) \geq 0 \iff 1 - 2p \geq 0 \iff \dfrac{1}{2} \geq p$
De même, $f'(p) \leq 0 \iff 1 - 2p \leq 0 \iff \dfrac{1}{2} \leq p$
En outre, $f(0) = f(1) = 0$ et $f\left ( \dfrac{1}{2} \right ) = \dfrac{1}{4}$
On en déduit donc le tableau de variation suivant :
TABLEAU A INSERER ICI
L'emploi de la variable $p$ n'est pas anodin...
Question 5
En déduire une majoration de $P(|M_n - p|\geq \epsilon) $ indépendante de $p$.
On sait que $p(1-p) \leq \dfrac{1}{4}$.
Ainsi, pour $\epsilon > 0$,
$P(|M_n - p|\geq \epsilon) \leq \dfrac{p(1-p)}{n\epsilon^2} \leq \dfrac{1}{4n\epsilon^2}$
On utilisera le maximum de la question précédente.
Question 6
En déduire un minorant de la probabilité $P(p \in ]M_n - \epsilon; M_n + \epsilon [)$.
Soit $\epsilon > 0$,
$ P(p \in ]M_n - \epsilon; M_n + \epsilon [) = 1 - P(|M_n - p|\geq \epsilon) \geq 1 - \dfrac{1}{4n\epsilon^2}$
On dira alors que l'intervalle $I = ]M_n - \epsilon; M_n + \epsilon [$ est un intervalle de confiance pour $p$ au niveau $1 - \dfrac{1}{4n\epsilon^2}$
On utilisera à nouveau la question précédente.
Question 7
On dit que l'intervalle $I = ]M_n - \epsilon; M_n + \epsilon [$ est un intervalle de confiance pour $p$ au niveau $1 - \dfrac{1}{4n\epsilon^2}$.
Un sondage réalisé auprès de $1000$ personnes donne une fréquence observée de $0,53$.
Déterminer epsilon pour que le niveau de confiance soit au moins égal à $95\%$.
La fréquence observée nous donne la valeur de $M_{1000} = 0,53$
On souhaite donc déterminer $\epsilon$ tel que $P(p \in ]0,53 - \epsilon; 0,53 + \epsilon [) \geq 0,95$ c'est à dire $1 - \dfrac{1}{4000\epsilon^2} \geq 0,95 \iff \epsilon \geq \dfrac{1}{10\sqrt{2}} \approx 0,071$
Cela revient à déterminer $\epsilon$ tel que $P(p \in ]0,53 - \epsilon; 0,53 + \epsilon [) \geq 0,95$
Question 8
Peut-on affirmer la victoire du candidat $A$ avec une erreur inférieure $5\%$ ?
On sait d'après la question précédente que $\epsilon \approx 0,071$.
L'intervalle de confiance au seuil de $95 \%$ est donc $I = ]0,53 - 0,071 ; 0,53 + 0,071 [ = ]0,459; 0,601 [$.
Ainsi $p$ peut prendre des valeurs inférieures à $0,5$.
On ne peut donc pas affirmer une victoire du candidat $A$ avec une erreur inférieure à $5\%$.
On pourra écrire l'intervalle de confiance trouvé.