ECOLE NATIONALE POLYTECHNIQUE D’ORAN Département de la Formation Préparatoire en Sciences et Technologies
ANNEE UNIVERSITAIRE 2020-2021 Année pédagogique : 1ère ANNEE
Fiche de TD n°3 probabilité-statistique (1er Semestre) Exercice n°1 : On donne le tableau de répartition suivant : X : nombre de fréquentations hebdomadaires d’un magasin, Y : montant des achats Y X 1. Calculer les distributions jointes et marginales en fréquences. 1 2. Calculer les moyennes et variances de ces distributions marginales. 2 Conclure sur l’indépendance de ces distributions. 3 3. Calculer les distributions conditionnelles de X / Y = 25 et Y / X = 3. 4 Calculer les moyennes et variances de ces distributions.
[0,50[
[50,100[
[100,200[
40 60 80 220
60 90 70 20
150 140 60 10
Exercice 2 : L’évolution de la consommation (Kg par habitant) d’un produit dans deux pays A et B en fonction des années a permis de construire le tableau suivant. Y : la consommation du produit dans A, Z : la consommation du produit dans B. Année 2001 2002 2003 2004 2005 2006 2007 2008 Y 1 3 5 8 10 14 17 20 Z 80 40 30 60 40 10 20 100 1. Calculer la covariance entre la variable Y et la variable Z. Que peut-on déduire sur la relation entre Y et Z. 2. Calculer le coefficient de corrélation linéaire ry,z . 3. Conclure sur l’intensité de la liaison entre les deux variables Y et Z. 4. On note X la variable donnant le rang de l’année, et on veut étudier la consommation dans A (Y ) en fonction du rang de l’année (X) ; voir le tableau suivant : Année 2001 2002 2003 2004 2005 2006 2007 2008 X 1 2 3 4 5 6 7 8 Y 1 3 5 8 10 14 17 20 4.1. Construire à l’aide des données, le nuage des points de coordonnées ( xi , yi ). 4.2. Déterminer l’équation de la droite des moindres carrés de Y en fonction de X. Interpréter la pente de la droite obtenue. 4.3. Déduire la consommation (Kg par habitant) du produit dans A en 2015. 4.4. Calculer le coefficient de corrélation linéaire rx,y ; conclure sur le sens et l'intensité de la liaison entre la variable X (rang de l’année) et la consommation du produit dans A. 4.5. Déterminer l'équation de la droite des moindres carrés de Y en fonction de X si on est certain que : si X = 0 alors Y = 0. Remarque : Pour l’exercice 2, il est indispensable de faire les calculs 3 chiffres après la virgule avec arrondissement.
Exercice n°3 : L’évolution de la population d’une région entre 1960 et 2000 a permis de construire le tableau suivant : Année X 1960 1970 1980 1990 2000 Population en millions Y 2,5 3 3,6 4,4 5,2 x 1900 X 1900 On pose Z ; c'est-à-dire zi i ou zi désigne le numéro des années (zi N). 10 10 1. Construire à l’aide des données, le nuage des points de coordonnées ( zi , yi ) ; ainsi que le point moyen. 2. Déterminer l'équation de la droite d’ajustement obtenue par la méthode des moindres carrés. 3. Quelle prévision ferait-on avec cette approximation pour la population de la région de l’an 2010 ? 4. En quelle année la population de cette région dépassera-elle 15 millions d’habitants ? Exercice n°4 : Considérons les données suivantes sur le prix et les quantités vendues d’un certain bien. Quantités Y 104 58 37 22 12 9 Prix X 95 130 148 210 250 330 1. Représenter le nuage de points (x i, y i). 2. Compte tenu de cette représentation, donner la forme de l’ajustement de ce nuage de points et retrouver la relation entre les deux variables. 3. Donner une estimation de la demande lorsque le prix du bien est égal à 50 puis lorsque le prix est égal à 300.
Solution de l’exercice 1 : 1. Le calcul des distributions jointes et marginales en fréquences. La distribution jointe des effectifs est donné par le tableau suivant : Y X 1 2 3 4 Total
[0,50[
[50,100[
[100,200[
Total
40 60 80 220 400
60 90 70 20 240
150 140 60 10 360
250 290 210 250 1000
Donc
2. Le calcul des moyennes et variances de ces distributions marginales.
3. Calculer les distributions conditionnelles de X / Y = 25 et Y / X = 3.
Calculer les moyennes et variances de ces distributions. i) Distributions conditionnelles de X / Y = 25 X / Y = 25
ni /1 = ni1
1 2 3 4 Total
40 60 80 220 400
ii) Distribution conditionnelle de Y / X = 3 Y/X=3 [0,50[ [50,100[ [100,200[
Total
nj /3 = n3 j 80 70 60 210
X / Y = 25
ni1
ni1 xi
ni1 xi2
1 2 3 4 Total
40 60 80 220 N1 = 400
40 120 240 880 1280
40 240 720 3520 4520
Y/X=3
n3j
cj
n3j c j
n3j c j 2
[0,50[ [50,100[ [100,200[
80 70 60 N2 = 210
25 75 150
2000 5250 9000 16250
50000 393750 1350000 1793750
Total i 4
X / Y 25 i 1
ni 1 xi 1280 3, 2 N1 400
j3
n3 j c j
j 1
N2
Y/X 3
V X / Y 25 V Y / X 3
16250 77 ,38 210
2 1 4 4520 2 ni 1 xi2 X / Y 25 3,2 1,06 N1 i 1 400
2 1 3 1793750 2 n3 j c 2j Y / X 3 77,38 2554 N 2 j 1 210
Solution de l’exercice 2 : 1- Calculer la covariance entre la variable Y et la variable Z. Que peut-on déduire sur la relation entre Y et Z.
Total
y
yi
zi
(zi)2
(yi)2
yi .zi
xi
xi .yi
(xi)2
1
80
6400
1
80
1
1
1
3
40
1600
9
120
2
6
4
5
30
900
25
150
3
15
9
8
60
3600
64
480
4
32
16
10
40
1600
100
400
5
50
25
14
10
100
196
140
6
84
36
17
20
400
289
340
7
119
49
20
100
10000
400
2000
8
160
64
78
380
24600
1084
3710
36
467
204
8
1 78 yi 9,75 8 1 8
z
8
1 380 zi 47,5 8 1 8
1 i 8 3710 Cov ( y, z ) yi zi y z 9,75 47,5 463,75 463,125 0,625 8 8 i 1
Comme Cov(y, z) > 0 alors la relation entre Y et Z est positive et les 2 variables varient dans le même sens. 2- Calculer le coefficient de corrélation linéaire ry,z; conclure sur l’intensité de la liaison entre les deux variables Y et Z. r y ,z
Cov ( y , z ) Cov ( y , z ) ( y ) ( z ) V ( y )V ( z )
1 i 8 2 1084 2 V ( y ) yi y 2 9,75 135,5 95,063 40,437 8 8 i 1 1 i 8 2 24600 2 et V ( z ) zi z 2 47,5 3075 2256,25 818,75 8 8 i 1
ry , z
0,625 0,625 0,625 0,003485859 0,003 40,437 818,75 33108,613 181,958
3- La valeur de ry,z est proche de 0 cela traduit qu’il y’a une faible corrélation linéaire positive. 44.1- Construire à l’aide des données, le nuage des points de coordonnées ( xi , yi ) .
8,20
25
7,17 20
6,14
15
3,5 4,8
10
5,10
2,3
1,1 5
0 0
1
2
3
4
5
6
7
8
9
4.2- Déterminer l’équation de la droite des moindres carrés de Y en fonction de X. interpréter la pente de la droite obtenue. La pente de cette droite de régression est obtenue par : i 8
â
x y i 1 i 8
i
x
i 2
i
8 x .y
et la constante de la droite b̂ y âx 8 x
2
i 1
Total
yi
zi
(zi)2
(yi)2
yi .zi
xi
xi .yi
(xi)2
1
80
6400
1
80
1
1
1
3
40
1600
9
120
2
6
4
5
30
900
25
150
3
15
9
8
60
3600
64
480
4
32
16
10
40
1600
100
400
5
50
25
14
10
100
196
140
6
84
36
17
20
400
289
340
7
119
49
20
100
10000
400
2000
8
160
64
78
380
24600
1084
3710
36
467
204
x aˆ
1 8 36 xi 4,5 8 1 8
467 8 4,5 9,75 467 351 116 2,762 2 204 162 42 204 8 4,5
bˆ 9,75 2,762 4,5 2,679
Donc L'équation s'écrit : y 2,762x 2,679
y
1 8 78 yi 9,75 8 1 8
- Interprétation de la pente â = 2,762 :
La consommation du produit dans A augmente de â = 2,762 par an. 4.3- Déduire la consommation du produit dans A en 2015. C'est-à-dire x 15 y 2 ,762 15 2 ,679 41,43 2 ,679 38,751. Donc en 2015 la consommation du produit dans A atteindra 38,751 kg par habitant. 4.4- Calculer le coefficient de corrélation linéaire rx,y ; conclure sur le sens et l'intensité de la liaison entre la variable X (rang de l’année) et la consommation du produit dans A. 1 i 8 467 Cov ( x, y ) xi yi x y 4,5 9,75 58,375 43,875 14,5 8 8 i 1 Cov ( x, y ) Cov ( x, y ) rx , y ( x ) ( y ) V ( x )V ( y ) 1 i 8 2 204 2 V ( x ) xi x 2 4,5 25,5 20,25 5,25 8 8 i 1
14,5 14,5 0,995. 40,437 5,25 14,57 La valeur de rx,y est proche de 1 cela traduit qu’il y’a une forte corrélation linéaire positive. rx , y
4.5- Déterminer l'équation de la droite des moindres carrés de Y en fonction de X si on
est certain que si X = 0 alors Y = 0. C'est-à-dire la constante de la droite est b 0 Donc les couples (xi , yi) vérifient : yi axi i i 1, ,8 i 8
i 8
i yi axi
i yi axi f a 2
i 1
2
i 1
i 8
La méthode MCO consiste à minimiser i
2
i 1
; et en utilisant la condition de
minimisation de cette fonction f par rapport à a on obtient : i 8 2 i i 8 0 f ' a i 1 2 yi axi x i 0 a i 1 i 8
i 8
i 8
i 1
i 1
yi x i axi xi y i a x i 0 i 1
2
2
a
iN
x y i 1 iN
x i 1
Donc L'équation s'écrit : y 2 ,289x
i
2 i
i
467 2 ,289 204
Solution de l’exercice 3 : 1. Le nuage des points de coordonnées ( zi , yi ). On a : x 1900 , ce qui donne le tableau suivant : zi i 10
xi
zi
yi
zi .yi
(zi)2
1960 1970 1980 1990 2000 Total
6 7 8 9 10 40
2,5 3 3,6 4,4 5,2 18,7
15 21 28,8 39,6 52 156,4
36 49 64 81 100 330
1 5 40 z zi 8 5 1 5 1 5 18,7 y yi 3,74 5 1 5 Donc le point moyen est z , y 8 ; 3,74 Et le nuage des points de coordonnées ( zi , yi ) est :
10;5,2
9;4,4 7;3 6;2,5 8;3,6
z ; y 8;3,74 2. Déterminer l'équation de la droite d’ajustement obtenue par la méthode des moindres carrés.
L’équation de la droite d’ajustement obtenue par la méthode des moindres carrés est :
y aˆz bˆ avec i 5
aˆ
z i 1 i 5
i
yi 5z. y
z i 1
2 i
5 z 2
et la constante de la droite bˆ y aˆz
aˆ
156,4 5 8 3,74 0,68 et 330 5 82
bˆ 3,74 0,68 8 1,7
Donc l’équation de la droite d’ajustement obtenue par la méthode des moindres carrés est :
y 0,68z 1,7 3. Quelle prévision ferait-on avec cette approximation pour la population de la région de l’an 2010 ? L’an 2010 correspond à la décennie :
z
x 1900 10
2010 1900 11 10
La prévision de la valeur de la population de cette région est :
y 0,68z 1,7 0,68 11 1,7 5,78 Millions d’habitants 4. En quelle année la population de cette région dépassera-elle 15 millions d’habitants ? C’est-à-dire :
y 0,68z 1,7 15 z
16,7 24,56 0,68
Comme z N (z désigne le numéro des années), donc z 25 Donc, on peut affirmer que la population de cette région dépassera 15 millions d’habitants en
1900 + 25×10 = 2150.
Solution de l’exercice 4 :
b y a bx a x
b y a bx a ln y ln x x
lnb et a
Avec
En considérant les deux (02) nouvelles variables et en utilisant la méthode des MCO, on peut retrouver et , tels que : i N
ln x ln y N ln x.ln y i 1
i
i
i N
ln x i 1
2
i
N ln x
2
et
ˆ ln y ˆ ln x
yi
lnxi
lnyi
(lnxi)(lnyi)
(lnxi )
95
104
4,554
4,644
21,150
20,738
130
58
4,868
4,060
19,764
23,693
148
37
4,997
3,611
18,045
24,972
210
22
5,347
3,091
16,528
28,592
250
12
5,521
2,485
13,720
30,487
330
9
5,799
2,197
12,742
33,629
31,086
20,089
101,949
162,110
Total Donc :
2
xi
ln x
31,086 5,181 6
ln y
et
101,949 6 5,181 3,348 2 et 2 162,110 6 5,181
20,089 3,348 6
ˆ 3,348 2 5,181 13,71
L’équation de la droite de régression de ln(y) sur ln(x) est de la forme
ln( y ) 2 ln( x ) 13,71 On peut maintenant retrouver la valeur de a et de b
lnb lnb 13,71 b e 13,71 899864
a a 2 Enfin, l’équation de la courbe donnant la relation entre les deux variables est :
y
899864 2 899864 x x2
3. Lorsque le prix du bien est égal à
y
x = 50 alors la demande sera :
899864 899864 360 x2 502
Donc la demande d’élève à 360 unités. Lorsque le prix du bien est égal à x = 300 alors la demande sera :
y
899864 899864 10 2 x2 300
Donc la demande sera 10 unités.