Un échantillonnage consiste à observer une tendance sur une partie d’une population, en faisant l’hypothèse que toute la population suit cette tendance.
Exemple
Avant les élections présidentielles en France, des sondages estiment la popularité des candidats à la présidence auprès de la population française. Cependant, il est impossible d’interroger chaque français, car la population est trop nombreuse : on se restreint donc à un échantillon qu’on suppose représentatif.
Remarque
Dans la définition, une population n’est pas nécessairement un ensemble d’individus. Cela peut-être un ensemble d’objets (l’ensemble des voitures exportées par la France en 2014 par exemple), d’actions (une série de lancers d’un dé), etc.
BIntervalle de fluctuation
Définition
Intervalle de fluctuation au seuil de 95 %
Soit X une variable aléatoire suivant la loi binomiale B(n;p).
L’intervalle de fluctuation au seuil de 95 % de X est l’intervalle [a;b] où a est le plus grand entier tel que P(X<a)≤0,025=2,5 % et b le plus petit entier tel que P(X>b)≤0,025=2,5 %.
L’intervalle de fluctuation au seuil de 95 % en fréquence de X est l’intervalle [na;nb].
Remarque
Le graphique représente la loi d’une variable aléatoire suivant une loi de Bernoulli. L'intervalle de fluctuation se calcule en éliminant les valeurs extrêmes de X qui représentent moins de 2,5 % de chaque côté, c’est à dire telles que la somme des probabilités de chaque zone délimité par ces valeurs est moins que 2,5 % (les zones sont représentées en rouge et vert).
L’intervalle de fluctuation au seuil de 95 % donne une indication sur la valeur du nombre de succès le plus probable d’un schéma de Bernoulli, en laissant une marge d’incertitude.
Propriété
Intervalle de fluctuation au seuil de 95 %
Soit X une variable aléatoire suivant la loi binomiale B(n;p).
Lorsque n≥25 et 0,2≤p≤0,8, l’intervalle de fluctuation au seuil de 95 % en fréquence de X est approché par l’intervalle [p−n1;p+n1]
CApplication à l’étude d’une population
Propriété
Évaluer une hypothèse sur la proportion d’une population
Soit un échantillon de population de taille n, une fréquence p, et un caractère qui apparaît avec une fréquence f dans cet échantillon.
Si f est dans l’intervalle de fluctuation au seuil de 95 % en fréquence associé à la loi binomiale B(n;p), alors on considère que le caractère apparaît avec la fréquence p dans la population.
Si f est dans l’intervalle de fluctuation au seuil de 95 % en fréquence associé à la loi binomiale B(n;p), on rejette cette hypothèse.
Remarque
Il est plus sûr de prélever plusieurs échantillons de la population, et de vérifier que les fréquences fi d’apparition du caractère dans chacun des échantillons sont bien dans l’intervalle de fluctuation au seuil de 95 % en fréquence.