On est dans une situation d’échantillonnage lorsque :
on connaît ou on suppose la proportion p de la population globale étudiée présentant le caractère étudié ;
on veut prévoir la fluctuation potentielle de la proportion d’individus (ou fréquence f) présentant ce même caractère au sein d’un échantillon réduit (en déterminant un intervalle dans lequel cette proportion a de grandes chances de se trouver).
On parle alors d’intervalle de fluctuation.
Exemple
Pour Noël, la cantine d’un collège prévoit de servir des bûches de Noël. Le responsable des achats veut d’un côté que tous ceux qui en veulent en aient, mais d’un autre côté, il ne veut pas qu’il en reste trop car le lendemain c’est les vacances, et il faudra tout jeter.
Il lui faut donc approcher de façon précise la proportion d’élèves du collège aimant la bûche de Noël de façon à savoir quelle quantité de bûches acheter.
Il a accès à des statistiques nationales faites par les cantines de tous les collèges de France. Celles-ci affirment que 75 % des élèves de collège aiment la bûche de Noël.
On est typiquement dans une situation d’échantillonnage : on connaît la proportion générale d’élèves aimant ce dessert (on considère la population collégienne française assez grande pour être représentative), et on doit prévoir cette même proportion sur un échantillon réduit : le collège. Un calcul d’échantillonnage donnera un intervalle de fluctuation du type [70 % ;80 %] dans lequel il aura par exemple 95 % de chances de trouver la proportion recherchée. S’il privilégie la minimisation des restes, il choisira 70 % ; s’il privilégie le fait que tous les élèves qui veulent de la bûche en aient, il choisira 80 % pour déterminer combien de bûches il commandera.
Remarque
Il ne s’agit pas de supprimer entièrement le risque : il y aura toujours une probabilité (très faible) qu’aucun élève de ce collège n’aime la bûche de Noël. Il s’agit de connaître le risque que l’on prend de façon à savoir si on va chercher à le diminuer ou si on l’accepte tel quel.
Plus l’échantillon étudié est grand, plus il aura de chance de se trouver proche de la proportion générale p.
BEstimation : $$p$$ inconnu
Définition
Situation d'estimation
On est dans une situation d’estimation lorsque :
on connaît la proportion d’individus (ou fréquence) f présentant un certain caractère au sein d’un échantillon test réduit ;
on veut estimer (par un intervalle dans lequel elle a de grandes chances de se trouver) la proportion p de la population globale présentant ce même caractère.
On parle alors d’intervalle de confiance.
Exemple
Les élections présidentielles approchent en France, et une entreprise de sondage a été chargée d’estimer la proportion de français qui iraient voter.
Pour cela, l’entreprise contacte par téléphone un échantillon de 1000 personnes prises au hasard et leur demande s’ils ont l’intention d’aller voter. 19,5 % répondent négativement.
Pour autant, l’entreprise ne pourra pas conclure en disant qu’il y aura exactement 19,5 % d’abstention.
Elle pourra seulement affirmer que par exemple, le taux d’abstention a une probabilité de 0,95 de se trouver dans un intervalle de confiance du type [18 % ;21 %].
On est dans une situation d’estimation : on cherche à estimer la proportion totale d’abstentionnistes à partir d’un test sur un échantillon de personnes. Pour avoir un résultat certain à 100 % il faudrait contacter la population entière, ce qui est évidemment impossible.
Remarque
Plus l'échantillon choisi est grand, plus l'intervalle de confiance est précis. Il faut en pratique faire un compromis entre la précision et le coût que représente l’augmentation de la taille de l’échantillon.