On est dans une situation d’échantillonnage lorsque :
on connaît ou on suppose la proportion p de la population globale étudiée présentant le caractère étudié ;
on veut prévoir la fluctuation potentielle de la proportion d’individus (ou fréquence) f présentant ce même caractère au sein d’un échantillon réduit (en déterminant un intervalle dans lequel cette proportion a de grandes chances de se trouver).
On parle alors d’intervalle de fluctuation.
Exemple
Pour Noël, la cantine d’un collège prévoit de servir des bûches de Noël. Le responsable des achats veut d’un côté que tout ceux qui en veulent en aient, mais d’un autre côté, il ne veut pas qu’il en reste trop car le lendemain c’est les vacances, il faudra tout jeter.
Il lui faut donc approcher de façon précise la proportion d’élèves du collège aimant la bûche de Noël de façon à savoir quelle quantité de bûches acheter.
Il a accès à des statistiques nationales faites par les cantines de tous les collèges de France. Celles-ci affirment que 75 % des élèves de collège aiment la bûche de Noël.
On est typiquement dans une situation d’échantillonnage : on connaît la proportion générale d’élèves aimant ce dessert (on considère la population collégienne française assez grande pour être représentative), et on doit prévoir cette même proportion sur un échantillon réduit : le collège. Un calcul d’échantillonnage lui donnera un intervalle de fluctuation du type [70 % ; 80 %] dans lequel il aura par exemple 95 % de chances de trouver la proportion recherchée. S’il privilégie la minimisation des restes, il prendra 70 % ; s’il privilégie le fait que tous les élèves qui en veulent en aient, il choisira 80 % pour déterminer combien de bûches il commandera.
Remarque
Il ne s’agit pas de supprimer entièrement le risque : il y aura toujours une probabilité (très faible) qu’aucun élève de ce collège n’aime la bûche de Noël. Il s’agit de connaître le risque que l’on prend de façon à savoir si on va chercher à le diminuer, ou si on l’accepte tel quel.
Plus l’échantillon étudié est grand, plus il aura de probabilité de se trouver proche de la proportion générale p.
BEstimation : $$p$$ inconnu
Définition
Situation d’estimation
On est dans une situation d’estimation lorsque :
on connaît la proportion d’individus (ou fréquence) f présentant un certain caractère au sein d’un échantillon test réduit ;
on veut estimer (par un intervalle dans lequel elle a de grandes chances de se trouver) la proportion p de la population globale présentant ce même caractère.
On parle alors d’intervalle de confiance.
Exemple
Les élections présidentielles approchent en France, et une entreprise de sondage a été chargée d’estimer la proportion de français qui iraient voter.
Pour cela, l’entreprise contacte par téléphone un échantillon de 1000 personnes prises au hasard et leur demande s’ils ont l’intention d’aller voter. 19,5 % répondent négativement.
Pour autant, l’entreprise ne pourra pas conclure en disant qu’il y aura exactement 19,5 % d’abstention.
Elle pourra seulement affirmer que par exemple, le taux d’abstention a une probabilité de 0,95 de se trouver dans un intervalle de confiance du type [18 % ; 21 %].
On est dans une situation d’estimation : on cherche à estimer la proportion totale d’abstentionnistes à partir d’un test sur un échantillon de personnes. Pour avoir un résultat certain à 100 % il faudrait contacter la population entière, et cela est évidemment impossible.
Remarque
Plus on prendra un grand échantillon, plus on pourra préciser l’intervalle de confiance, ou prendre moins de risque sur le résultat. Il faut en pratique faire un compromis entre précision et coût que représente l’augmentation de la taille de l’échantillon.