Une usine fabrique des composants électroniques et les vend par lots de 200. Une étude sur le long terme a montré que l’usine fabriquait des composants défectueux avec une probabilité de 0,03. Le responsable qualité a décidé que les lots pour lesquels la borne supérieure de l’intervalle de fluctuation asymptotique au seuil de 0,95 serait dépassée ne seraient pas commercialisés. À partir de combien de composants défectueux dans un lot, celui-ci n'est-il pas commercialisé ?
0
0
Poser clairement les hypothèses et objectifs
Soit X la variable aléatoire dénombrant les composants défectueux au sein d’un lot. Elle suit la loi binomiale B(200;0,03) (on répète pour chaque lot 200 fois une épreuve de Bernoulli de probabilité 0,03).
Pour le calcul de l’intervalle de fluctuation, on prendra donc n=200 et p=0,03.
Étant donné que l’on recherche l’intervalle de fluctuation asymptotique au seuil de 0,95, on prendra α=0,05, et donc uα≈1,96.
Nous allons commencer par calculer l’intervalle de fluctuation asymptotique au seuil de 0,95, pour ensuite pouvoir conclure sur le nombre de composants défectueux entraînant la mise au rebut d’un lot.
1
1
Vérifier que les conditions de validité de l’intervalle de fluctuation sont remplies
n=200≥30
np=200×0,03=6≥5
np=200×0,97=194≥5
Les conditions sont donc bien réunies : on peut appliquer l’approximation des intervalles de fluctuation.
La borne supérieur de In est une fréquence. Ainsi, la traduction de ce que souhaite le responsable qualité est que tout lot contenant plus de 5,36 % de composants défectueux ne soit pas commercialisé. Cela représente 0,0536×200=10,72 composants défectueux dans un même lot.
Ainsi, à partir de 11 composants défectueux, le lot ne sera pas commercialisé.
Vérifier une hypothèse par de l’échantillonnage
Le propriétaire d’une piscine souhaite faire une étude pour mieux adapter ses horaires d’ouverture aux besoins de sa clientèle. Pour cela, il estime que 3 % de sa clientèle est formée de personnes âgées de plus de 70 ans. Toutefois, afin d’être certain de ne pas se tromper, il préfère vérifier cette hypothèse. Il mène donc une enquête sur un échantillon de 200 clients. Cette enquête révèle qu'une seule personne interrogée est âgée de plus de 70 ans. Ayant déjà une bonne idée du résultat, et souhaitant simplement la valider, il utilise la méthode des intervalles de fluctuation asymptotique au seuil 0,95. Cette méthode lui permet-elle de valider son hypothèse des 3 % ?
0
0
Poser clairement les hypothèses et objectifs
p=0,03
n=200
f=2001=0,005
Le but est de vérifier si f se trouve effectivement dans l’intervalle de fluctuation asymptotique au seuil 0,95 calculé à partir de l’hypothèse p=0,03.
1
1
Calculer l’intervalle de fluctuation
On se référera pour cela à l’exercice précédent, qui a les mêmes valeurs numériques, et présente le calcul de l’intervalle de fluctuation. Il ne faut surtout pas oublier l’étape de la vérification des conditions d’application des intervalles de fluctuation. On obtient :
In=[0,0064;0,0536]
2
2
Conclure
La fréquence mesurée sur l’échantillon est de 0,005.
0,005<0,0064
Elle est donc à l’extérieur de In.
L’enquête ne permet donc pas de rendre vraisemblable l’hypothèse de départ. À partir de là, deux options s’offrent au gérant :
il peut effectuer d’autres enquêtes similaires pour voir si ce n’est pas simplement un manque de chance ;
sinon, il peut mener une estimation de la proportion de clients âgés de plus de 70 ans par la méthode des intervalles de confiance.
Estimer une proportion inconnue à partir d’un échantillon
Reprenons le cas précédent. Suite à un résultat négatif, le gérant de la piscine souhaite estimer la proportions p de clients âgés de plus de 70 ans. Lors de l’enquête précédente, 1 personne sur les 200 interrogées était âgée de plus de 70 ans. Le gérant souhaite trouver l’intervalle de confiance de p de niveau de confiance 0,95. Détermine cet intervalle.
0
0
Poser clairement les hypothèses de l’énoncé
n=200
f=2001=0,005
On cherche à estimer p par son intervalle de confiance de niveau de confiance 0,95.
1
1
Calculer l’intervalle de confiance
Le cours nous donne la formule suivante pour l’intervalle de confiance recherché :
[f−n1;f+n1]=[0,005−2001;0,005+n1]
=[−0,0657;0,0757]
2
2
Conclure
Ainsi,
P(p∈[−0,0657;0,0757])≥0,95
Attention, p ne peut pas être négatif, donc on peut tronquer l’intervalle à 0 :
P(p∈[0;0,0757])≥0,95
Autrement dit, p a plus de 95 % de chances de se trouver entre 0 % et 7,57 %.
3
3
Remarque
Cet intervalle est très large, et n’aide donc pas beaucoup le gérant. Il faudrait qu’il fasse une enquête sur un plus grand échantillon afin d’avoir une idée plus précise de la proportion de personnes âgées de plus 70 ans parmi sa clientèle.
Déterminer une taille d’échantillon suffisante pour obtenir une précision donnée sur un intervalle de confiance au niveau de confiance 0.95
Reprenons encore le cas de notre gérant de piscine. Celui-ci n’est pas satisfait par l’intervalle de confiance précédent, qu'il trouve trop large. Toujours dans le but d’estimer la proportion p de ses clients ayant plus de 70 ans, il souhaite savoir combien de personne il doit interroger afin d’obtenir un intervalle de niveau de confiance 0,95 de largeur 2 %. Que lui conseillerais-tu ?
0
0
Énoncer la formule de cours
On sait que la largeur d’un intervalle de confiance de niveau de confiance 0,95 a pour largeur :
n2
Ici, on veut qu’elle vaille 0,02.
1
1
Poser et résoudre l’équation
On cherche donc n tel que :
n2=0,02
⇒n=0,022
⇒n=(0,022)2=10000
2
2
Conclure
Le gérant devrait interroger 10000 personnes afin d’obtenir la précision qu’il souhaite.
À lui de comparer l'intérêt d'obtenir une telle précision et le coût d’une enquête de cette envergure...