Inégalité de concentration
Inégalité de concentration
Propriété :
Soit $(X_1, X_2, …, X_n)$ un échantillon de variables aléatoires d’espérance $\mu$ et de variance $V$, et $M_n = \dfrac{X_1 + X_2 + … + X_n}{n}$ la variable moyenne de cet échantillon,
Pour tout réel $\delta$ tel que $\delta > 0$,
$P(|M_n – \mu | \geq \delta) \leq \dfrac{V}{n\delta^2}$
Or, $|M_n – \mu | \geq \delta \iff \left \{ \begin{array}{l} M_n \geq \mu + \delta \\ M_n \leq \mu- \delta \end{array} \right. \iff M_n \notin [\mu – \delta; \mu + \delta ]$
Ainsi, $P(M_n \notin [\mu – \delta; \mu + \delta ]) \leq \dfrac{V}{n\delta^2}$
Concrètement, plus $n$ est grand et donc plus la taille de l’échantillon est importante, plus l’écart de la moyenne à l’espérance va être petit.
La moyenne se concentre donc autour de l’espérance.
Exemple :
100 personnes jouent indépendamment à un même jeu dont la variable aléatoire associée au gain en euros a pour espérance $11$ et variance $2$.
Donner une minoration de la probabilité que la moyenne des gains de ces 100 personnes soit comprise entre 9 et 13 euros.
On appelle $X_i$ pour $i$ entier entre $1$ et $100$ le gain du $i$-ème joueur.
Ainsi, $(X_1, … X_{100})$ est un échantillon associé à une loi d’espérance $11$ et de variance $2$.
On note $M = \dfrac{X_1 + … + X_{100}}{100}$ sa moyenne.
On cherche donc $P(M\in[9; 13])$.
Ce n’est pas exactement l’inégalité du cours, il faut donc transformer l’écriture en utilisant l’évènement contraire.
$P(M\in[9; 13]) = 1 – P(M\notin[9; 13]) $
$P(M\in[9; 13]) = 1 – P(|M – 11| \geq 2)$.
Or $P(|M – 11| \geq 2) \leq \dfrac{2}{100 \times 2^2}$
Finalement,
$P(M\in[9; 13]) \geq 1 – \dfrac{2}{100 \times 2^2} = 0,995$