Solution TD3-S1 2021

Page 1

ECOLE NATIONALE POLYTECHNIQUE D’ORAN Département de la Formation Préparatoire en Sciences et Technologies

ANNEE UNIVERSITAIRE 2020-2021 Année pédagogique : 1ère ANNEE

Fiche de TD n°3 probabilité-statistique (1er Semestre) Exercice n°1 : On donne le tableau de répartition suivant : X : nombre de fréquentations hebdomadaires d’un magasin, Y : montant des achats Y X 1. Calculer les distributions jointes et marginales en fréquences. 1 2. Calculer les moyennes et variances de ces distributions marginales. 2 Conclure sur l’indépendance de ces distributions. 3 3. Calculer les distributions conditionnelles de X / Y = 25 et Y / X = 3. 4 Calculer les moyennes et variances de ces distributions.

[0,50[

[50,100[

[100,200[

40 60 80 220

60 90 70 20

150 140 60 10

Exercice 2 : L’évolution de la consommation (Kg par habitant) d’un produit dans deux pays A et B en fonction des années a permis de construire le tableau suivant. Y : la consommation du produit dans A, Z : la consommation du produit dans B. Année 2001 2002 2003 2004 2005 2006 2007 2008 Y 1 3 5 8 10 14 17 20 Z 80 40 30 60 40 10 20 100 1. Calculer la covariance entre la variable Y et la variable Z. Que peut-on déduire sur la relation entre Y et Z. 2. Calculer le coefficient de corrélation linéaire ry,z . 3. Conclure sur l’intensité de la liaison entre les deux variables Y et Z. 4. On note X la variable donnant le rang de l’année, et on veut étudier la consommation dans A (Y ) en fonction du rang de l’année (X) ; voir le tableau suivant : Année 2001 2002 2003 2004 2005 2006 2007 2008 X 1 2 3 4 5 6 7 8 Y 1 3 5 8 10 14 17 20 4.1. Construire à l’aide des données, le nuage des points de coordonnées ( xi , yi ). 4.2. Déterminer l’équation de la droite des moindres carrés de Y en fonction de X. Interpréter la pente de la droite obtenue. 4.3. Déduire la consommation (Kg par habitant) du produit dans A en 2015. 4.4. Calculer le coefficient de corrélation linéaire rx,y ; conclure sur le sens et l'intensité de la liaison entre la variable X (rang de l’année) et la consommation du produit dans A. 4.5. Déterminer l'équation de la droite des moindres carrés de Y en fonction de X si on est certain que : si X = 0 alors Y = 0. Remarque : Pour l’exercice 2, il est indispensable de faire les calculs 3 chiffres après la virgule avec arrondissement.

Exercice n°3 : L’évolution de la population d’une région entre 1960 et 2000 a permis de construire le tableau suivant : Année X 1960 1970 1980 1990 2000 Population en millions Y 2,5 3 3,6 4,4 5,2 x  1900 X  1900 On pose Z  ; c'est-à-dire zi  i ou zi désigne le numéro des années (zi  N). 10 10 1. Construire à l’aide des données, le nuage des points de coordonnées ( zi , yi ) ; ainsi que le point moyen. 2. Déterminer l'équation de la droite d’ajustement obtenue par la méthode des moindres carrés. 3. Quelle prévision ferait-on avec cette approximation pour la population de la région de l’an 2010 ? 4. En quelle année la population de cette région dépassera-elle 15 millions d’habitants ? Exercice n°4 : Considérons les données suivantes sur le prix et les quantités vendues d’un certain bien. Quantités Y 104 58 37 22 12 9 Prix X 95 130 148 210 250 330 1. Représenter le nuage de points (x i, y i). 2. Compte tenu de cette représentation, donner la forme de l’ajustement de ce nuage de points et retrouver la relation entre les deux variables. 3. Donner une estimation de la demande lorsque le prix du bien est égal à 50 puis lorsque le prix est égal à 300.


Solution de l’exercice 1 : 1. Le calcul des distributions jointes et marginales en fréquences. La distribution jointe des effectifs est donné par le tableau suivant : Y X 1 2 3 4 Total

[0,50[

[50,100[

[100,200[

Total

40 60 80 220 400

60 90 70 20 240

150 140 60 10 360

250 290 210 250 1000

Donc

2. Le calcul des moyennes et variances de ces distributions marginales.


3. Calculer les distributions conditionnelles de X / Y = 25 et Y / X = 3.

Calculer les moyennes et variances de ces distributions. i) Distributions conditionnelles de X / Y = 25 X / Y = 25

ni /1 = ni1

1 2 3 4 Total

40 60 80 220 400

ii) Distribution conditionnelle de Y / X = 3 Y/X=3 [0,50[ [50,100[ [100,200[

Total

nj /3 = n3 j 80 70 60 210

X / Y = 25

ni1

ni1 xi

ni1 xi2

1 2 3 4 Total

40 60 80 220 N1 = 400

40 120 240 880 1280

40 240 720 3520 4520


Y/X=3

n3j

cj

n3j c j

n3j c j 2

[0,50[ [50,100[ [100,200[

80 70 60 N2 = 210

25 75 150

2000 5250 9000 16250

50000 393750 1350000 1793750

Total i 4

X / Y  25   i 1

ni 1 xi 1280   3, 2 N1 400

j3

n3 j c j

j 1

N2

Y/X 3

V  X / Y  25  V Y / X  3 

16250  77 ,38 210

2  1  4 4520 2   ni 1 xi2   X / Y  25   3,2   1,06 N1  i 1 400 

 2 1  3 1793750 2   n3 j c 2j   Y / X  3   77,38  2554   N 2  j 1 210 

Solution de l’exercice 2 : 1- Calculer la covariance entre la variable Y et la variable Z. Que peut-on déduire sur la relation entre Y et Z.

Total

y

yi

zi

(zi)2

(yi)2

yi .zi

xi

xi .yi

(xi)2

1

80

6400

1

80

1

1

1

3

40

1600

9

120

2

6

4

5

30

900

25

150

3

15

9

8

60

3600

64

480

4

32

16

10

40

1600

100

400

5

50

25

14

10

100

196

140

6

84

36

17

20

400

289

340

7

119

49

20

100

10000

400

2000

8

160

64

78

380

24600

1084

3710

36

467

204

8

1 78 yi   9,75  8 1 8

z

8

1 380 zi   47,5  8 1 8

 1 i 8  3710 Cov ( y, z )    yi zi    y  z    9,75  47,5  463,75  463,125  0,625 8  8 i 1 

Comme Cov(y, z) > 0 alors la relation entre Y et Z est positive et les 2 variables varient dans le même sens. 2- Calculer le coefficient de corrélation linéaire ry,z; conclure sur l’intensité de la liaison entre les deux variables Y et Z. r y ,z 

Cov ( y , z ) Cov ( y , z )   ( y ) ( z ) V ( y )V ( z )

 1 i 8 2  1084 2 V ( y )    yi   y 2   9,75  135,5  95,063  40,437 8 8  i 1   1 i 8 2  24600 2 et V ( z )    zi   z 2   47,5  3075  2256,25  818,75 8 8  i 1 

ry , z 

0,625 0,625 0,625    0,003485859 0,003 40,437 818,75 33108,613 181,958


3- La valeur de ry,z est proche de 0 cela traduit qu’il y’a une faible corrélation linéaire positive. 44.1- Construire à l’aide des données, le nuage des points de coordonnées ( xi , yi ) .

8,20

25

7,17 20

6,14

15

3,5 4,8

10

5,10

2,3

1,1 5

0 0

1

2

3

4

5

6

7

8

9

4.2- Déterminer l’équation de la droite des moindres carrés de Y en fonction de X. interpréter la pente de la droite obtenue. La pente de cette droite de régression est obtenue par : i 8

â 

x y i 1 i 8

i

x

i 2

i

 8 x .y

et la constante de la droite b̂  y  âx 8 x

2

i 1

Total

yi

zi

(zi)2

(yi)2

yi .zi

xi

xi .yi

(xi)2

1

80

6400

1

80

1

1

1

3

40

1600

9

120

2

6

4

5

30

900

25

150

3

15

9

8

60

3600

64

480

4

32

16

10

40

1600

100

400

5

50

25

14

10

100

196

140

6

84

36

17

20

400

289

340

7

119

49

20

100

10000

400

2000

8

160

64

78

380

24600

1084

3710

36

467

204

x  aˆ 

1 8 36 xi   4,5  8 1 8

467  8  4,5  9,75 467  351 116    2,762 2 204  162 42 204  8  4,5

 bˆ  9,75  2,762 4,5  2,679

Donc L'équation s'écrit : y  2,762x  2,679

y

1 8 78 yi   9,75  8 1 8


- Interprétation de la pente â = 2,762 :

La consommation du produit dans A augmente de â = 2,762 par an. 4.3- Déduire la consommation du produit dans A en 2015. C'est-à-dire x  15  y  2 ,762  15  2 ,679  41,43  2 ,679  38,751. Donc en 2015 la consommation du produit dans A atteindra 38,751 kg par habitant. 4.4- Calculer le coefficient de corrélation linéaire rx,y ; conclure sur le sens et l'intensité de la liaison entre la variable X (rang de l’année) et la consommation du produit dans A.  1 i 8  467 Cov ( x, y )    xi yi    x  y    4,5  9,75  58,375  43,875  14,5 8  8 i 1  Cov ( x, y ) Cov ( x, y ) rx , y    ( x ) ( y ) V ( x )V ( y )  1 i 8 2  204 2 V ( x )    xi   x 2   4,5  25,5  20,25  5,25 8  8 i 1 

14,5 14,5   0,995. 40,437  5,25 14,57 La valeur de rx,y est proche de 1 cela traduit qu’il y’a une forte corrélation linéaire positive. rx , y 

4.5- Déterminer l'équation de la droite des moindres carrés de Y en fonction de X si on

est certain que si X = 0 alors Y = 0. C'est-à-dire la constante de la droite est b  0 Donc les couples (xi , yi) vérifient : yi  axi   i i  1, ,8 i 8

i 8

  i  yi  axi

   i    yi  axi   f a  2

i 1

2

i 1

i 8

La méthode MCO consiste à minimiser   i

2

i 1

; et en utilisant la condition de

minimisation de cette fonction f par rapport à a on obtient :  i 8 2      i  i 8  0 f ' a    i 1  2  yi  axi  x i   0 a i 1 i 8

i 8

i 8

i 1

i 1

  yi x i axi   xi y i  a  x i  0 i 1

2

2

a

iN

x y i 1 iN

x i 1

Donc L'équation s'écrit : y  2 ,289x

i

2 i

i

467  2 ,289 204


Solution de l’exercice 3 : 1. Le nuage des points de coordonnées ( zi , yi ). On a : x  1900 , ce qui donne le tableau suivant : zi  i 10

xi

zi

yi

zi .yi

(zi)2

1960 1970 1980 1990 2000 Total

6 7 8 9 10 40

2,5 3 3,6 4,4 5,2 18,7

15 21 28,8 39,6 52 156,4

36 49 64 81 100 330

1 5 40 z   zi  8 5 1 5 1 5 18,7 y   yi   3,74 5 1 5 Donc le point moyen est z , y   8 ; 3,74 Et le nuage des points de coordonnées ( zi , yi ) est :

10;5,2

9;4,4 7;3 6;2,5 8;3,6

z ; y   8;3,74 2. Déterminer l'équation de la droite d’ajustement obtenue par la méthode des moindres carrés.

L’équation de la droite d’ajustement obtenue par la méthode des moindres carrés est :

y  aˆz  bˆ avec i 5

aˆ 

z i 1 i 5

i

yi  5z. y

z i 1

2 i

5 z 2

et la constante de la droite bˆ  y  aˆz


 aˆ 

156,4  5  8  3,74  0,68 et 330  5  82

bˆ  3,74  0,68  8  1,7

Donc l’équation de la droite d’ajustement obtenue par la méthode des moindres carrés est :

y  0,68z  1,7 3. Quelle prévision ferait-on avec cette approximation pour la population de la région de l’an 2010 ? L’an 2010 correspond à la décennie :

z 

x  1900 10

2010  1900  11 10

La prévision de la valeur de la population de cette région est :

y  0,68z  1,7  0,68  11  1,7  5,78 Millions d’habitants 4. En quelle année la population de cette région dépassera-elle 15 millions d’habitants ? C’est-à-dire :

y  0,68z  1,7  15  z 

16,7  24,56 0,68

Comme z  N (z désigne le numéro des années), donc z  25 Donc, on peut affirmer que la population de cette région dépassera 15 millions d’habitants en

1900 + 25×10 = 2150.


Solution de l’exercice 4 :

b y  a  bx  a x

b y  a  bx  a  ln y   ln x   x

  lnb et   a

Avec

En considérant les deux (02) nouvelles variables et en utilisant la méthode des MCO, on peut retrouver  et  , tels que : i N



 ln x ln y   N ln x.ln y i 1

i

i

i N

 ln x  i 1

2

i

 N ln x

2

et

ˆ  ln y  ˆ ln x


yi

lnxi

lnyi

(lnxi)(lnyi)

(lnxi )

95

104

4,554

4,644

21,150

20,738

130

58

4,868

4,060

19,764

23,693

148

37

4,997

3,611

18,045

24,972

210

22

5,347

3,091

16,528

28,592

250

12

5,521

2,485

13,720

30,487

330

9

5,799

2,197

12,742

33,629

31,086

20,089

101,949

162,110

Total Donc :



2

xi

ln x 

31,086  5,181 6

ln y 

et

101,949  6  5,181 3,348  2 et 2 162,110  6  5,181

20,089  3,348 6

ˆ  3,348   2 5,181  13,71

L’équation de la droite de régression de ln(y) sur ln(x) est de la forme

 ln( y )  2 ln( x )  13,71 On peut maintenant retrouver la valeur de a et de b

  lnb  lnb  13,71  b  e 13,71  899864

  a  a    2 Enfin, l’équation de la courbe donnant la relation entre les deux variables est :

y

899864 2  899864 x x2

3. Lorsque le prix du bien est égal à

y

x = 50 alors la demande sera :

899864 899864   360 x2 502

Donc la demande d’élève à 360 unités. Lorsque le prix du bien est égal à x = 300 alors la demande sera :

y

899864 899864   10 2 x2 300

Donc la demande sera 10 unités.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.