Statistique inférentielle - Échantillonnage
Échantillonnage
⎯⎯⎯⎯⎯⎯ 1 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Distribution d'échantillonnage des moyennes :
Électronique Une machine fabrique des pièces de forme circulaire en série. A chaque pièce tirée au hasard on associe son diamètre exprimé en millimètres. On définit ainsi une variable aléatoire X. On suppose que X suit la loi normale de moyenne µ = 32 et d'écart type σ = 1 Pour contrôler la fabrication, on prélève à intervalles réguliers des échantillons de 20 pièces. On appelle X la variable aléatoire qui, à chaque échantillon de n = 20 pièces associe la moyenne des diamètres de cet échantillon. On assimile ces échantillons à des échantillons aléatoires prélevés avec remise. On suppose que cette variable aléatoire X suit alors la loi normale de moyenne µ = 32 et d'écart type σ 1 σ' = = . n 20 Déterminer l'intervalle [µ - h ; µ + h] tel que la probabilité que X appartienne à cet intervalle soit 0,99. On déterminera, la valeur approchée de h, à 10 −2 près.
Groupement B 2000 Dans cette question, on veut contrôler la moyenne µ de l'ensemble des diamètres, en mm, des pieds de boulons constituant un stock très important ; on se propose de construire un test d'hypothèse. On note Y la variable aléatoire qui, à chaque boulon tiré au hasard dans le stock, associe le diamètre, en mm, de son pied. La variable aléatoire Y suit la loi normale de moyenne inconnue µ et d'écart type σ = 0,1. On désigne par Y la variable aléatoire qui, à chaque échantillon aléatoire de 100 boulons prélevé dans un stock, associe la moyenne des diamètres des pieds de ces 100 boulons (le stock est assez important pour que l'on puisse assimiler ces prélèvements à des tirages avec remise). a) Justifier que, sous l'hypothèse que la moyenne de la variable aléatoire Y est 10, la variable aléatoire Y suit la loi normale de moyenne 10 et d'écart type 0,01. b) Déterminer le nombre réel positif h tel que P(10 – h ≤ Y ≤ 10 + h) = 0,95.
⎯⎯⎯⎯⎯⎯ 2 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Industries céramiques Dans une entreprise, un atelier est spécialisé dans la fabrication d'un certain type de carreaux de grès. A chaque carreau fabriqué prélevé au hasard dans la production on associe son épaisseur exprimée en millimètres. On définit ainsi une variable aléatoire X dont on admet qu'elle suit la loi normale de paramètres µ = 7 et σ = 0,2. A chaque échantillon de 25 carreaux tirés au hasard de la fabrication de manière non exhaustive, on associe la moyenne des épaisseurs des carreaux de cet échantillon. On définit ainsi une nouvelle variable aléatoire X . 1° Quelle est la loi suivie par X ? (On précisera les deux paramètres de cette loi ). 2° Déterminer la probabilité que X soit comprise entre 6,99 et 7,01.
⎯⎯⎯⎯⎯⎯ 3 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Construction navale Une entreprise produit en grande série des bagues de verrouillage utilisées pour la fabrication de raccords rapides. Ces bagues, en alliages, sont obtenues sur une presse automatique. Plusieurs outillages sont en service suivant les alliages utilisés et les dimensions à obtenir. On suppose que la variable aléatoire X qui, à toute bague prélevée au hasard dans la fabrication de l'entreprise, associe son diamètre intérieur exprimé en millimètres, suit la loi normale de moyenne µ = 24,20 et d'écart type σ = 0,045. 1° La procédure de contrôle est basée sur des prélèvements à intervalles réguliers, d'échantillons de 20 bagues. La production est suffisamment importante pour qu'on puisse assimiler un prélèvement de 20 bagues à un prélèvement aléatoire avec remise. On nomme X la variable aléatoire qui à tout prélèvement de 20 bagues associe la moyenne des diamètres intérieurs des 20 bagues. a - Quelle est la loi de probabilité suivie par X ? Quels sont les paramètres de cette loi ? b - Déterminer un intervalle [Ls1 , Ls2] centré en µ = 24,20 et tel que la variable aléatoire X prenne une valeur dans cet intervalle avec la probabilité 0,95. (Les nombres Ls1 et Ls2 s'appellent les limites de surveillance). c - Déterminer un intervalle [Lc1 , Lc2] centré en µ = 24,20 et tel que la variable aléatoire X prenne une valeur dans cet intervalle avec la probabilité 0,99. (Les nombres Lc1 et Lc2 s'appellent les limites de contrôle). 2° La procédure de contrôle prévoit qu'après chaque prélèvement, on mesure les diamètres intérieurs des 20 bagues obtenues ; on calcule leur moyenne x et - si x n'appartient pas à l'intervalle [Lc1 , Lc2] on procède immédiatement aux réglages, - si x appartient à l'un des intervalles [Lc1 , Ls1] ou [Ls2 , Lc2] on prélève immédiatement un autre échantillon (procédure d'alerte). Sur un prélèvement de 20 bagues, on obtient les mesures suivantes : diamètre xi
[24,09 ; 24,11]
[24,11 ; 24,13]
[24,13 ; 24,15]
[24,15 ; 24,17]
[24,17 ; 24,19]
effectif ni
1
2
3
4
3
diamètre xi
[24,19 ; 24,21]
[24,21 ; 24,33]
[24,23 ; 24,25]
[24,25 ; 24,27]
[24,27 ; 24,29]
effectif ni
2
2
1
1
1
Quelle décision doit-on prendre au vu de ce prélèvement ?
⎯⎯⎯⎯⎯⎯ 4 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Maintenance Une usine assure le conditionnement d'un très grand nombre de bouteilles d'un certain type. On désigne par X la variable aléatoire qui, à toute bouteille prise au hasard, associe sa contenance L exprimée en litres. On admet que lorsque la machine est bien réglée X suit la loi normale de moyenne 1 L et d'écart type 0,01 L. On effectue régulièrement des prélèvements aléatoires d'échantillons de 100 bouteilles, les tirages pouvant être considérés comme faits avec remise. On appelle X la variable aléatoire qui, à chaque échantillon, associe la contenance moyenne des 100 bouteilles de cet échantillon. Si la machine est bien réglée : a) Quelle est la loi suivie par X ? b) Déterminer, à 10 −3 près par excès, le réel h tel que : P(1 – h ≤ X ≤ 1 + h) = 0,95.
Équipement technique énergie Une machine fabrique en grande série des pièces de diamètre nominal 38 mm. Soit X la variable aléatoire qui, à chaque pièce prélevée au hasard dans la production, associe son diamètre exprimé en mm. On admet que, lorsque la machine est bien réglée, X suit la loi normale de moyenne µ = 38 et d'écart type σ = 0,49. On effectue régulièrement des prélèvements d'échantillons aléatoires de 100 pièces, les tirages pouvant être considérés comme faits avec remise. On appelle X la variable aléatoire qui, à chaque échantillon, associe le diamètre moyen des pièces de cet échantillon. Si la machine est bien réglée : a) Quelle est la loi suivie par X ? b) Déterminer le réel a tel que : P(38 – a ≤ X ≤ 38 + a) = 0,95.
⎯⎯⎯⎯⎯⎯ 5 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Géomètre topographe Un traceur à rouleau dessine, sur chaque plan produit par un cabinet de géomètre, un cartouche ayant la forme d'un rectangle dont la longueur doit mesurer 10 cm. Pour tester le réglage du traceur, on prélève un échantillon aléatoire de 100 cartouches. On porte les mesures effectuées dans le tableau suivant : Mesure xi
9,94
9,96
9,98
10
10,02
10,04
10,06
Effectif ni
13
17
19
28
16
4
3
1° Donner la moyenne x e et l'écart type σe de cet échantillon. 2° Soit X la variable aléatoire qui, à chaque dessin aléatoire de cartouche, associe sa longueur. Le traceur est réglé pour une moyenne de X qui serait m = 10 cm et un écart type σ = 0,03 cm. On note X 100 la variable aléatoire qui, à chaque échantillon aléatoire non exhaustif de taille 100, associe la moyenne des longueurs des 100 cartouches qu'il contient. On admet que X 100 suit la loi normale de moyenne 10 et d'écart type 0,003. a) Déterminer le réel positif h tel que P(10 – h ≤ X 100 ≤ 10 + h) = 0,95. b) On avait convenu que : si x e appartient à l'intervalle [10 – h , 10 + h] le traceur est bien réglé, si x e n'appartient pas à l'intervalle [10 – h , 10 + h] on règle à nouveau le traceur. Au vu du résultat de la question 1° devra-t-on procéder à un nouveau réglage du traceur ?
Mécanique et automatismes industriels Une machine est chargée de conditionner des paquets de farine. On désigne par M la variable aléatoire qui, à chaque paquet prélevé au hasard, associe sa masse exprimée en grammes ; M suit une loi normale d'écart type constant, σ = 30, et dont la moyenne m peut être modifiée. Un paquet est refusé si sa masse est inférieure à 955 grammes. Afin de diminuer le nombre de paquets refusés on décide de modifier le réglage de la machine. a) Quelle doit être la valeur de µ pour que la probabilité d'accepter un paquet soit égale à 0,99 ? b) La machine est réglée de telle sorte que µ = 1025. Soit X la variable aléatoire qui, à tout échantillon aléatoire de 20 paquets, associe la moyenne des masses des 20 paquets. On assimile ces échantillons de 20 paquets à des échantillons prélevés avec remise. Quelle est la loi suivie par la variable aléatoire X ? Déterminer un intervalle centré en µ tel que la probabilité que X appartienne à cet intervalle soit 0,95 .
⎯⎯⎯⎯⎯⎯ 6 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Productique Un atelier produit des joints Plaustra, type IE qui assurent l'étanchéité du palier d'arbre d'entrée d'un réducteur de vitesse. La variable aléatoire X qui, à chaque joint prélevé au hasard, associe sa durée de vie x exprimée en heures suit la loi normale de moyenne 970 et d'écart type 200. L'ensemble de la production d'un jour J est conditionné en boîtes de 100 joints puis expédié aux clients. Ceux-ci font connaître au service de suivi de fabrication la durée de vie moyenne des joints d'une boîte ; on définit ainsi une nouvelle variable aléatoire X qui, à chaque boîte, associe la durée de vie moyenne des joints de cette boite. On assimile les tirages de 100 joints à des tirages avec remise. a) Quelle est la moyenne µ et l'écart type σ de cette nouvelle variable aléatoire X . b) Quelle est, à 10 −4 près, la probabilité que la durée de vie moyenne d'un lot de 100 joints diffère de µ de plus de 0,03 × µ ?
⎯⎯⎯⎯⎯⎯ 7 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Microtechnique Les deux questions sont indépendantes. Les résultats seront donnés à 10 −3 près. Une usine produit des boules en grande série. 1° On définit une variable aléatoire X en associant à chaque boule, prélevée au hasard dans la production, son diamètre exprimé en millimètres. On suppose que X suit une loi normale de moyenne µ = 50 et d'écart type σ = 0,5. a) Déterminer le nombre réel positif a tel que la probabilité qu'une boule tirée au hasard dans la production ait un diamètre compris entre 50 – a et 50 + a soit de 95 %. b) Une boule est dite défectueuse si son diamètre n'est pas dans l'intervalle [49 ; 51]. Calculer la probabilité qu'une boule tirée au hasard soit défectueuse. c) On prélève au hasard des échantillons aléatoires de 36 boules. Le prélèvement ainsi opéré sera considéré comme 36 tirages avec remise. On note Y la variable aléatoire qui, à chaque échantillon, associe la moyenne des diamètres des 36 boules. Quelle est la loi suivie par Y ? Déterminer le nombre réel positif b tel que P ( 50 – b ≤ Y ≤ 50 + b ) = 0,9. 2. On suppose qu'il y a 5 % de rebuts dans la production. Un tirage au hasard de n boules de cette production est assimilé à un tirage avec remise. On désigne par Z la variable aléatoire qui associe à chacun de ces tirages le nombre de boules à rejeter parmi les n boules. a) Quelle est la loi de probabilité de la variable aléatoire Z ? Si n = 10, calculer P(Z > 1). b) Dans le cas où n = 100, on admet qu'on peut approcher la loi de probabilité de Z par une loi de Poisson. Déterminer le paramètre de cette dernière. En utilisant cette approximation, calculer P(Z < 6).
⎯⎯⎯⎯⎯⎯ 8 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Comptabilité et gestion (Nouvelle Calédonie) 2000 Calcul des probabilités (TP2) ; Statistique inférentielle (TP1)
Les quatre parties de cet exercice sont indépendantes.
Une centrale d’achat fournit trois types de poulets à une chaîne d’hypermarchés de la région RhôneAlpes : - des poulets “ biologiques ” élevés dans le Centre, dits poulets P1 ; - des poulets de Bresse, dits poulets P2 ; - des poulets élevés en plein air en Bretagne, dits poulets P3 . Avant leur conditionnement et leur mise en vente en grande surface, les poulets sont stockés dans un entrepôt frigorifique. Dans la suite, on s’intéresse aux stocks de ces trois types de poulets une journée donnée. Une étude de marché a montré qu’un poulet se vend mal lorsque son poids est inférieur ou égal à 1 kg.
Partie I
On note X la variable aléatoire qui, à chaque poulet choisi au hasard dans le stock de poulets P1 , associe son poids en kilogrammes. X suit une loi normale de moyenne 1,46 et d’écart type 0,30. Calculer, à 10−2 près, la probabilité de l’événement A : “ un poulet choisi au hasard dans le stock de poulets P1 a un poids inférieur ou égal à 1 kg ”.
Partie II
On note B l’événement : “ un poulet choisi au hasard dans le stock de poulets P2 a un poids inférieur ou égal à 1 kg ”. On suppose que la probabilité de l’événement B est 0,03. On prélève au hasard 100 poulets dans le stock de poulets P2 . Le stock est assez important pour que l’on puisse assimiler ce prélèvement à un tirage avec remise de 100 poulets. On considère la variable aléatoire Y qui, à tout prélèvement de 100 poulets ainsi défini, associe le nombre de poulets ayant un poids inférieur ou égal à 1 kg. 1° Expliquer pourquoi Y suit une loi binomiale. En déterminer les paramètres. 2° On approche la loi de la variable aléatoire Y par la loi de Poisson de même espérance mathématique. Donner le paramètre de cette loi.
3° Utiliser cette approximation pour calculer, à 10 − 2 près, la probabilité de l’événement C : “ dans l’échantillon choisi au hasard, il y a au plus 4 poulets ayant un poids inférieur ou égal à 1 kg ”. Partie III
Pour un hypermarché de la région Rhône-Alpes, on conditionne des lots de deux poulets constitués d’un poulet P1 et d’un poulet P2 .
⎯⎯⎯⎯⎯⎯ 9 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
On note A l’événement : “ un poulet P1 choisi au hasard dans le stock des poulets P1 a un poids inférieur ou égal à 1 kg ”. On note de même B l’événement : “ un poulet P2 choisi au hasard dans le stock des poulets P2 a un poids inférieur ou égal à 1 kg ”. On admet que les probabilités des événements A et B sont P(A) = 0,06 et P(B) = 0,03 et on suppose que ces deux événements sont indépendants. Un lot de deux poulets P1 et P2 étant choisi au hasard dans le stock prévu pour l’hypermarché, calculer la probabilité de chacun des événements suivants :
E 1 : “ chacun des deux poulets constituant le lot a un poids inférieur ou égal à 1 kg ” ; E 2 : “ l’un au moins des deux poulets constituant le lot a un poids inférieur ou égal à 1 kg ” ; E 3 : “ aucun des deux poulets constituant le lot n’a un poids inférieur ou égal à 1 kg ”. Partie IV
Dans cette partie, on cherche à estimer le pourcentage p inconnu de poulets pesant moins de 1 kg dans le stock de poulets P3 . On considère un échantillon de 100 poulets choisis au hasard et avec remise dans le stock de poulets P3 ; on constate qu’il contient 4 poulets pesant moins de 1 kg. 1° Donner une estimation ponctuelle du pourcentage p de poulets pesant moins de 1 kg dans le stock de poulets P3 . 2° Soit F la variable aléatoire qui, à tout échantillon de 100 poulets choisis au hasard et avec remise dans le stock de poulets P3 , associe le pourcentage de poulets de cet échantillon pesant moins de 1 kg. ⎛ p(1 − p ) ⎞⎟ où p est le pourcentage inconnu de poulets On suppose que F suit la loi normale n ⎜ p ; ⎜ 100 ⎟⎠ ⎝ pesant moins de 1 kg dans le stock de poulets P3 .
a) Déterminer un intervalle de confiance du pourcentage p avec le coefficient de confiance 95% ; les bornes seront données à 10 − 4 près.
b) On considère l’affirmation suivante : “ le pourcentage p est obligatoirement dans l’intervalle de confiance obtenu à la question a) ”. Peut-on déduire de ce qui précède qu’elle est vraie ?
⎯⎯⎯⎯⎯⎯ 10 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Comptabilité et gestion des organisations 2002 Dans une station de sports d'hiver, une étude statistique est réalisée dans le but d'étudier la durée d'attente au pied des remontées mécaniques. Dans ce problème, on s'intéresse à l'étude de la durée d’attente, exprimée en minutes, au pied d'une remontée mécanique particulière. Partie A : étude de la durée d'attente en début de journée
On désigne par A et B les événements suivants :
A : "la durée d’attente lors de la première montée est supérieure à 3 minutes " ; B : "la durée d'attente lors de la deuxième montée est supérieure à 3 minutes". Des observations permettent d'admettre que p(A) = 0,2. De plus, on constate que : -
si la durée d'attente lors de la première montée est supérieure à 3 minutes, la probabilité que la durée d'attente lors de la deuxième montée soit supérieure à 3 minutes est 0,3 ;
-
si la durée d'attente lors de la première montée est strictement inférieure à 3 minutes, la probabilité que la durée d'attente lors de la deuxième montée soit supérieure à 3 minutes est 0,5.
On désigne par A l’événement contraire de A et B/ A l’événement : « B est réalisé sachant que A est réalisé ». a) Donner P(B / A) et P(B / A ) .
Calculer les probabilités des événements A , A ∩ B et A ∩ B . b) En déduire que p(B) = 0,46. 2. Un skieur emprunte cinq fois consécutives cette remontée. On appelle X la variable aléatoire exprimant le nombre de montées où la durée d'attente est supérieure à 3 minutes. X suit-elle une loi binomiale ? Justifiez votre réponse. Partie B : étude de l'effet du renouvellement de la remontée mécanique
On renouvelle cette remontée mécanique en vue d'améliorer son débit. On étudie les nouvelles durées d'attente aux moments de forte affluence pour cette nouvelle remontée. À cet effet, on considère un échantillon de 100 skieurs pris au hasard et on constate que la moyenne des durées d'attente pour cet échantillon est 5,3 minutes et que l'écart type est 2,5 minutes. Le nombre de skieurs est suffisamment grand pour qu'on puisse assimiler ce prélèvement à un tirage avec remise. On note Z la variable aléatoire qui, à tout échantillon de 100 skieurs prélevés au hasard et avec remise dans l'ensemble des skieurs, associe la moyenne des durées d'attente pour cette nouvelle remontée. On suppose que Z suit la loi normale de moyenne inconnue m et d’écart type
σ
100
.
1. À partir des informations portant sur l'échantillon, calculer, à 0,01 près, une estimation ponctuelle de σ. 2. À partir des informations portant sur l'échantillon, donner une estimation de la moyenne m des durées d'attente au pied de la nouvelle remontée mécanique par un intervalle de confiance avec le ⎯⎯⎯⎯⎯⎯ 11 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
coefficient de confiance de 95 %. On prendra pour écart type σ l'estimation obtenue à la question précédente. On donnera des valeurs arrondies à 0,1 près des bornes de l'intervalle. 3. Cette étude permet-elle d’affirmer que la durée d'attente moyenne pour l'ensemble des skieurs au pied de cette nouvelle remontée mécanique est dans l'intervalle trouvé à la question précédente ? Justifiez votre réponse.
⎯⎯⎯⎯⎯⎯ 12 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Détermination de la taille d'un échantillon :
Plastiques et composites Un atelier produit en grande série des pièces cylindriques. On désigne par X la variable aléatoire associant, à chaque pièce tirée au hasard dans la production, son diamètre x, en millimètres. On suppose que X suit la loi normale de moyenne 12,50 et d'écart type 0,02. On note X la variable aléatoire qui, à tout échantillon de n pièces pris au hasard et avec remise dans la production, associe la moyenne des diamètres des n pièces. On note pn la probabilité que cette variable aléatoire X appartienne à l'intervalle [12,495 ; 12,505]. On suppose n assez grand et on rappelle que dans ce cas X suit approximativement la loi normale de 0,02 moyenne 12,50 et d'écart type . n
En utilisant cette loi, déterminer la taille minimale n de l'échantillon pour que la probabilité pn soit supérieure ou égale à 0,97.
Microtechniques Un atelier produit en grande série des pièces cylindriques. Soit Y la variable aléatoire associant à chaque pièce tirée au hasard de la production son diamètre en millimètres. On admet que Y suit la loi normale de moyenne µ = 17,50 et d'écart type σ0 = 0,025. 1. Calculer la probabilité que le diamètre d'une pièce prélevée au hasard soit compris entre 17,45 et 17,55. Soit n un entier naturel (tel que n ≥ 30) et X la variable aléatoire associant à tout échantillon aléatoire non exhaustif de n pièces, la moyenne des diamètres des pièces de cet échantillon.
σ 2. On rappelle que X suit la loi normale de moyenne E( X ) = µ et d'écart type σ( X ) = 0 n On prélève un échantillon aléatoire non exhaustif de taille n. Quelle doit être la taille de l'échantillon pour que la moyenne des diamètres des n pièces de l'échantillon appartienne à l'intervalle [17,495 ; 17,505] avec une probabilité au moins égale à 0,97 ?
⎯⎯⎯⎯⎯⎯ 13 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Conception et réalisation de carrosseries Une machine perce un trou dans une patte de fixation de bouclier avant. La variable aléatoire qui, à chaque patte de fixation associe le diamètre du trou mesuré en millimètres suit la loi normale de moyenne µ = 16,56 et d'écart type σ = 0,19. On prélève dans la production un échantillon de taille n. Calculer n pour que moyenne des diamètres sur les pièces prélevées appartienne à [16,4 ; 16,72] avec la probabilité 0,95.
Productique On s'intéresse au fonctionnement de la machine une semaine donnée. La production d'une bille est considérée comme une épreuve aléatoire. On désigne par X la variable aléatoire qui, à chaque bille produite, associe son diamètre exprimé en centimètres. On admet que la semaine considérée X suit la loi normale de moyenne µ = 3,32 cm et d'écart type σ = 0,1 cm. On prélève, au hasard, au cours de la même semaine des échantillons aléatoires de n billes (n entier naturel non nul). On assimile ces échantillons à des échantillons prélevés avec remise. Soit X la variable aléatoire prenant pour valeurs la moyenne des diamètres des différentes billes constituant chacun de ces échantillons. a) Quelle est la loi suivie par X ? b) Quelle valeur minimale faut-il donner à n pour que X soit dans l'intervalle [3,29 ; 3,35] avec une probabilité au moins égale à 0,99.
Informatique de gestion (Nouméa) Une enquête concernant les montants des tickets de caisse a été effectuée dans un supermarché. On note X la variable aléatoire qui, tout ticket de caisse aléatoire, associe son montant, exprimé en francs. On admet que X suit la loi normale d'espérance mathématique µ = 500 et d'écart type σ = 200. On prélève successivement et avec remise, des échantillons aléatoire de n tickets de caisse. On note Z, la variable aléatoire qui, à tout échantillon de n tickets, associe la moyenne des montants des tickets de caisse de cet échantillon. On admet que la variable aléatoire Z suit la loi normale 200 . d'espérance mathématique µ = 500 et d'écart type σ' = n Soit E1 l'événement (Z ≤ 538). Déterminer la valeur minimale de n pour que P(E1) ≥ 0,99.
⎯⎯⎯⎯⎯⎯ 14 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Distribution d'échantillonnage des pourcentages :
Domotique Une entreprise fabrique en grande série des pièces pour le bâtiment. Pour analyser la qualité de la fabrication, on prélève au hasard d'un échantillon de n = 64 pièces dans la production. On suppose que le pourcentage de pièces défectueuses dans la production est 4 %. Soit F la variable aléatoire qui, à tout échantillon de 64 pièces, associe le pourcentage de pièces défectueuses de cet échantillon. On assimile ces échantillons de 64 pièces à des échantillons aléatoires prélevés avec remise et on p (1 − p) admet que, F suit la loi normale n(p , ) où n = 64 et p = 0,04. n Déterminer le nombre réel a positif tel que P(0,04 – a ≤ F ≤ 0,04 + a) = 0,95.
Analyses biologiques On décide de construire un test qui, à la suite des contrôles sur un échantillon de 50 sportifs prélevé au hasard, permette de décider si, au seuil de signification de 10 %, le pourcentage de sportifs contrôlés positifs est de p = 0,02. Soit F la variable aléatoire qui, à tout échantillon aléatoire (supposé non exhaustif) de 50 sportifs contrôlés, associe le pourcentage de sportifs contrôlés positivement. ⎛
On suppose que F, suit la loi normale n ⎜ p, ⎜ ⎝
p(1 − p) ⎞⎟ où p = 0,02 et n = 50. ⎟ n ⎠
Déterminer, à 10 −4 près, le réel positif a tel que P(p – a ≤ F ≤ p + a) = 0,9.
⎯⎯⎯⎯⎯⎯ 15 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Maintenance Une machine fabrique des tiges en grande série. La production étant importante on assimile tout prélèvement d'échantillon à un prélèvement avec remise. On admet que la proportion de tiges acceptables dans la population est p = 90% Soit F la variable aléatoire qui à tout échantillon aléatoire de 150 tiges associe le pourcentage de tiges acceptables dans cet échantillon. F suit la loi normale de moyenne p, proportion de tiges acceptables p (1 − p) . dans la population et d'écart type 150 Déterminer, à 10 −4 près, le nombre réel h tel que
P(F > h) = 0,95.
Qualité dans les industries alimentaires Les résultats numériques seront arrondis au centième le plus proche. Sur chaque type de terrain, tous les melons produits à la même époque ont la même probabilité d'avoir un taux de sucre suffisant. Victor a un terrain mal exposé : ce même juillet, chacun de ses melons a la même probabilité pb = 0,6 d'avoir un taux de sucre suffisant. On note Y la variable aléatoire qui, à tout échantillon aléatoire de n melons (assimilé à un échantillon non exhaustif), associe le nombre de melons de l'échantillon qui ont un taux de sucre suffisant. Y On note F = la variable aléatoire qui, à tout échantillon du type précédent, associe la proportion de n melons dont le taux de sucre est suffisant dans l'échantillon. 1) Quelle est la loi de probabilité de la variable aléatoire Y ? 2) Exprimer l'écart type σ(Y) en fonction de n et de pb. En déduire que la variable aléatoire F admet pour écart type σ(F) =
p b (1 − p b ) . n
⎯⎯⎯⎯⎯⎯ 16 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Informatique de gestion Statistique descriptive (TP2) ; calcul des probabilités (TP2 - TP5) ; statistique inférentielle (TP1)
Les questions 1°, 2° et 3° peuvent être traitées indépendamment les unes des autres. La société ARIANE a mis au point depuis quelques années un logiciel de gestion destiné aux entreprises. Le tableau suivant donne pour les années 1990 à 1995 les montants x i des ventes du logiciel et yi des dépenses publicitaires, exprimés en milliers de francs. ANNEES 1990 1991 1992 1993 1994 1995 4500 4800 4950 5100 5250 5400 xi 26 27 29 31 32 35 yi Dans les questions 1° a) et c), on utilisera les fonctions de la calculatrice. Le détail des calculs n’est pas demandé.
1° a) Calculer le coefficient de corrélation linéaire entre x et y. On donnera une valeur approchée à -3 10 près). Pourquoi la valeur de ce coefficient justifie-t-elle un ajustement linéaire de y en x ? b) Déterminer une équation de la droite de régression de y par rapport à x par la méthode des moindres carrés. c) On suppose que la tendance ne change pas et que le budget des dépenses publicitaires pour l’année 1996 est de 37 milliers de francs. Calculer en utilisant le résultat de la question 1°c) une estimation du montant des ventes pour l’année 1996. 2° La société ARIANE cherche à s’implanter dans une nouvelle région. Désirant obtenir une estimation de la proportion p d’entreprises de cette région intéressées par son logiciel, elle interroge 500 entreprises tirées au hasard (avec remise). 340 d’entre elles répondent qu’elles sont disposées à acheter son logiciel. a) Déterminer une estimation ponctuelle de p. b) Déterminer un intervalle de confiance de p au seuil de confiance 0,97 (pour les bornes de cet intervalle on donnera des valeurs approchées à 10 −3 près). 3° La société ARIANE achète à un fournisseur des disquettes par lots de 1 000. Une étude statistique a montré que la probabilité qu’une disquette choisie au hasard dans un lot de 1 000 soit défectueuse est 0,03. On désigne par Z la variable aléatoire mesurant le nombre de disquettes défectueuses dans un lot de 1 000 disquettes. a) Quelle est la loi suivie par Z ? Donner les paramètres de cette loi. b) Calculer l’espérance mathématique m et l’écart type σ de Z (on donnera une valeur approchée de σ arrondie au dixième). c) On admet que la loi de Z peut-être approchée par une loi normale n(m’ , σ‘). Justifier que m’ = 30 et σ‘ = 5,4. Déterminer en utilisant cette loi normale, une valeur approchée à 10 −3 près, de la probabilité P(18 ≤ Z ≤ 42).
⎯⎯⎯⎯⎯⎯ 17 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
Groupement B 2002 Les quatre questions de cet exercice sont indépendantes. Dans un groupe d'assurances on s'intéresse aux sinistres susceptibles de survenir, une année donnée, aux véhicules de la flotte d'une importante entreprise de maintenance de chauffage collectif Dans cet exercice, sauf mention contraire, les résultats approchés sont à arrondir à 10 −3 .
1. Étude du nombre de sinistres par véhicule
Soit X la variable aléatoire qui, à tout véhicule tiré au hasard dans un des parcs de la flotte, associe le nombre de sinistres survenant pendant l'année considérée. On admet que X suit la loi de Poisson de paramètre 0,28. a) Calculer la probabilité de l'événement A : « un véhicule tiré au hasard dans le parc n'a aucun sinistre pendant l'année considérée ». b) Calculer la probabilité de l'événement B : « un véhicule tiré au hasard dans le parc a, au plus, deux sinistres pendant l'année considérée ». 2. Étude du nombre de sinistres dans une équipe de 15 conducteurs
On note E l'événement : « un conducteur tiré au hasard dans l'ensemble des conducteurs de l'entreprise n'a pas de sinistre pendant l'année considérée ». On suppose que la probabilité de l'événement E est 0,6. On tire au hasard 15 conducteurs dans l'effectif des conducteurs de l'entreprise. Cet effectif est assez important pour que l'on puisse assimiler ce prélèvement à un tirage avec remise de 15 conducteurs. On considère la variable aléatoire Y qui, à tout prélèvement de 15 conducteurs, associe le nombre de conducteurs n'ayant pas de sinistre pendant l'année considérée. a) Justifier que la variable aléatoire Y suit une loi binomiale et déterminer ses paramètres. b) Calculer la probabilité que, dans un tel prélèvement, 10 conducteurs n'aient pas de sinistre pendant l'année considérée. 3. Étude du coût des sinistres
Dans ce qui suit, on s'intéresse au coût d'une certaine catégorie de sinistres survenus dans l'entreprise pendant l'année considérée. On considère la variable aléatoire C qui, à chaque sinistre tiré au hasard parmi les sinistres de cette catégorie, associe son coût en euros. On suppose que C suit la loi normale de moyenne 1200 et d'écart type 200. Calculer la probabilité qu'un sinistre tiré au hasard parmi les sinistres de ce type coûte entre 1000 euros et 1500 euros. 4. On considère un échantillon de 100 véhicules prélevés au hasard dans le parc de véhicules mis en service depuis 6 mois. Ce parc contient suffisamment de véhicules pour qu'on puisse assimiler ce tirage à un tirage avec remise.
⎯⎯⎯⎯⎯⎯ 18 ⎯⎯⎯⎯⎯⎯
Statistique inférentielle - Échantillonnage
On constate que 91 véhicules de cet échantillon n'ont pas eu de sinistre. a) Donner une estimation ponctuelle du pourcentage p de véhicules de ce parc qui n'ont pas eu de sinistre 6 mois après leur mise en service. b) Soit F la variable aléatoire qui à tout échantillon de 100 véhicules prélevés au hasard et avec remise dans ce parc, associe le pourcentage de véhicules qui n'ont pas eu de sinistre 6 mois après leur mise en service.
⎛ ⎞ ⎜ p, p (1 − p) ⎟ où p est le pourcentage inconnu de ⎜ 100 ⎟⎠ ⎝ véhicules du parc qui n'ont pas eu de sinistre 6 mois après leur mise en service. On suppose que F suit la loi normale
n
Déterminer un intervalle de confiance du pourcentage p avec le coefficient de confiance 95 %. c) On considère l'affirmation suivante « le pourcentage p est obligatoirement dans l'intervalle de confiance obtenu à la question b) ». Est-elle vraie ? (On ne demande pas de justification.).
⎯⎯⎯⎯⎯⎯ 19 ⎯⎯⎯⎯⎯⎯