1btxsol12

Page 1

917221Unidad12.qxd

12

19/1/09

11:11

Página 536

Estadística bidimensional

LITERATURA I MATEMÀTIQUES

La caverna Bona tarda, senyor Algor, Bona tarda, senyor, Suposo que imagina per quina raó li truco avui, Suposa bé, senyor, digui’m, Tinc davant meu els resultats i les conclusions del sondeig sobre els seus articles, [...] I aquests resultats quins són, senyor, preguntà Cipriano Algor, Lamento informar-lo que no van ser tan bons com desitjaríem, Si és així ningú no ho lamentarà més que jo, Temo que la seva participació a la vida del nostre Centre ha arribat al final, [...] Vagi prenent nota dels resultats, Digui-me’ls, L’univers dels clients sobre el qual incidiria el sondeig quedà definit des del principi per l’exclusió de les persones que per edat, posició social, educació i cultura, i també pels seus hàbits coneguts de consum, fossin previsiblement i radicalment contràries a l’adquisició d’articles d’aquesta mena, és bo que sàpiga que si vam prendre aquesta decisió, senyor Algor, va ser per no perjudicar-lo d’entrada, Moltes gràcies, senyor, Li poso un exemple, si haguéssim seleccionat cinquanta joves moderns, cinquanta nois i noies del nostre temps, pot tenir la certesa, senyor Algor, que cap voldria endur-se a casa un dels seus ninots, o si se l’endugués seria per emprar-lo en alguna cosa així com el tir al blanc, Ho entenc, Escollírem vint-i-cinc persones de cada sexe, de professions i ingressos mitjans, persones amb antecedents familiars modestos, encara aferrades a gustos tradicionals, a les cases dels quals la rusticitat del producte no desentonaria massa, I fins i tot així, És veritat, senyor Algor, fins i tot així els resultats foren dolents, Què hi farem, seyor, Vint homes i deu dones respongueren que no els agradaven els ninots de fang, quatre dones digueren que potser els comprarien si fossin més grans, tres podrien comprar-los si fossin més petits, dels cinc homes que quedaven, quatre digueren que ja no tenien edat de jugar i un altre protestà pel fet que tres de les figuretes representessin estrangers, a sobre exòtics, i pel que fa a les vuit dones que encara no hem esmentat, dues es declararen al·lèrgiques al fang, quatre tenien mals records d’aquesta classe d’objectes, i només les dues últimes respongueren agraint molt la possibilitat que els havia estat proporcionada de decorar gratuïtament casa seva amb uns ninotets tan simpàtics, hem d’afegir que es tracta de persones grans que viuen soles, M’agradaria saber els noms i les adreces d’aquestes senyores per donar-los les gràcies, digué Cipriano Algor, Ho lamento, però no estic autoritzat a revelar dades personals dels enquestats, és una condició estricta de qualsevol sondeig d’aquest tipus, respectar l’anonimat de les respostes. [...] Bona tarda, Bona tarda. JOSÉ SARAMAGO (text adaptat)

Resumeix les dades en una taula de freqüències i representa-les en un gràfic estadístic. Pots calcular alguna mesura de centralització?

S’ha triat una mostra de 50 persones amb característiques personals i professionals semblants. No els agraden els ninots (1)

fi

Y

30

Els comprarien si fossin més grans (2)

4

Els comprarien si fossin més petits (3)

3

No tenen edat per jugar (4)

4

Protesten per figuretes d’estrangers (5)

1

Al·lèrgiques al fang (6)

2

Mals records (7)

4

Agraïdes perquè siguin gratuïtes (8)

2

Freqüències

Respostes

25

5 (1)

(2)

(3)

(4) (5) (6) Respostes

(7)

(8)

No és possible calcular cap mesura de centralització perquè la variable no és quantitativa.

536

X


917221Unidad12.qxd

19/1/09

11:11

Página 537

SOLUCIONARI

12

ABANS DE COMENÇAR... RECORDA 001

En una revista llegim que el pastor alemany té una alçada mitjana de 55 cm. Creus que han mesurat tots els pastors alemanys del planeta? Explica com creus que han arribat a aquesta conclusió. No els han mesurat. Es tria una mostra representativa de la població de pastors alemanys i s’estudia el valor de la mitjana en aquesta mostra.

002

Indica el tipus de variable estadística que estudiem. a) El programa preferit de la teva família. b) El nombre de peu dels alumnes d’un IES. c) La temperatura mitjana diària de la teva província. d) L’edat dels habitants d’un país. e) El sexe dels habitants d’un poble. f ) Els diners que gasten setmanalment els teus amics. g) Els efectes en l’ésser humà d’un nou medicament. h) El color del cabell dels teus companys de classe. a) b) c) d) e) f) g) h)

003

Qualitativa. Quantitativa discreta. Quantitativa contínua. Quantitativa discreta. Qualitativa. Quantitativa discreta. Qualitativa. Qualitativa.

El nombre d’hores diàries d’estudi de 30 alumnes és: 3 4 3 5 5 1 1 1 1 2 3 4 5 0 2 0 3 2 2 1 2 1 3 2 0 1 2 1 4 3 a) Organitza els resultats en una taula de freqüències. b) Què signifiquen les freqüències acumulades? a)

Hores

fi

hi

Fi

Hi

0

3

0,1

3

0,1

1

8

0,27

11

0,37

2

7

0,23

18

0,6

3

6

0,2

24

0,8

4

3

0,1

27

0,9

5

3

0,1

30

1

N = 30

∑ hi = 1

b) Les freqüències acumulades indiquen el nombre d’alumnes que estudien com a màxim el nombre d’hores corresponent. Per exemple, la freqüència acumulada per al valor 2 és 18, és a dir, hi ha 18 alumnes que estudien 0, 1 o 2 hores.

537


917221Unidad12.qxd

19/1/09

11:11

Página 538

Estadística bidimensional 004

Dels 30 assistents a un sopar, el 20% va menjar vedella, el 40% xai i la resta va demanar peix. Indica la variable estadística i organitza els resultats en una taula de freqüències; després, representa les dades en un diagrama de sectors. La variable estadística és el plat triat al sopar. Vedella

Plat

fi

hi

Fi

Hi

Vedella

6

0,2

6

0,2

Xai

12

0,4

18

0,6

Peix

12

0,4

30

1

Peix

N = 30 ∑ h i = 1 Xai

ACTIVITATS 001

Posa dos exemples de variables estadístiques unidimensionals. Resposta oberta. Per exemple: la qualificació dels alumnes d’una classe en un examen i l’alçada dels membres d’un equip de bàsquet.

002

Organitza aquestes dades en una taula de freqüències absolutes i relatives. 0 0 1 3

003

5 6 4 6

1 2 7 8

1 2 1 2

4 3 7 8

4 6 5 6

xi

fi

hi

Fi

Hi

0

2

0,08

2

0,08

1

4

0,17

6

0,25

2

3

0,13

9

0,38

3

2

0,08

11

0,46

4

3

0,13

14

0,59

5

2

0,08

16

0,67

6

4

0,17

20

0,84

7

2

0,08

22

0,92

8

2

0,08

24

1,92

N = 24

∑ hi = 1

La taula mostra l’alçada, en centímetres, d’un grup de persones. Alçada (cm) Nre. de persones

[165, 175)

[175, 185)

[185, 195)

40

85

25

a) Elabora una taula de freqüències. b) Quin percentatge de persones mesuren entre 165 cm i 175 cm? I menys de 185 cm?

538


917221Unidad12.qxd

19/1/09

11:11

Página 539

SOLUCIONARI

a)

Alçada

xi

fi

hi

Fi

Hi

[165, 175)

170

40

[175, 185)

180

85

0,27

40

0,27

0,57

125

0,83

[185, 195)

190

25

0,17

150

1

N = 150

∑ hi = 1

12

b) El percentatge de persones que mesuren entre 165 cm i 175 cm és del 27 %. I el percentatge de persones que mesuren menys de 185 cm és del 83 %.

004

A partir de les dades, elabora la taula de freqüències, i calcula les mesures de centralització. 23 10 25 12

13 24 17 22

16 20 26 23

22 13 21 18

16 19 14 17

11 17 15 26

xi

fi

hi

Fi

Hi

10

1

0,04

1

0,04

11

1

0,04

2

0,08

12

1

0,04

3

0,13

13

2

0,08

5

0,21

14

1

0,04

6

0,25

15

1

0,04

7

0,29

16

2

0,08

9

0,38

17

3

0,13

12

0,5

18

1

0,04

13

0,54

19

1

0,04

14

0,58

20

1

0,04

15

0,63

21

1

0,04

16

0,67

22

2

0,08

18

0,75

23

2

0,08

20

0,83

24

1

0,04

21

0,88

25

1

0,04

22

0,92

26

2

0,08

24

1

N = 24

∑ hi = 1

៮ x =

440 = 18,33 → El valor mitjà és 18,33. 24

Mo = 17 → El valor més freqüent és 17. Me =

17 + 18 = 17,5 2

Hi ha tants valors més petits que 17,5 com més grans.

539


917221Unidad12.qxd

19/1/09

11:11

Página 540

Estadística bidimensional 005

Troba i interpreta les mesures de centralització corresponents a les dades d’aquesta taula. Pes (kg)

[50, 65)

[65, 80)

[80, 95)

75

140

80

Nre. de persones Pes

xi

fi

hi

[50, 65)

57,5

75

75

[65, 80)

72,5

140

215

[80, 95)

87,5

80

295

N = 295

៮ x =

21.462, 5 = 72,75 295

El pes mitjà és de 72,75 kg. L’interval modal és [65, 80); la seva marca de classe: 72,5 és la moda. El més freqüent és que el pes estigui comprès entre 65 kg i 80 kg. L’interval mitjà és [65, 80); la seva marca de classe: 72,5 és la mitjana. Hi ha tantes persones que pesen menys de 72,5 kg com persones que pesen més. 006

Calcula les mesures de dispersió per a aquestes dades. Classes

[5, 15)

[15, 25)

[25, 35)

[35, 45)

35

15

25

45

Freqüències Classes

xi

fi

| xi − ៮ x|

(xi − ៮ x )2

[5, 15)

10

35

16,67

277,89

[15, 25)

20

15

6,67

44,49

[25, 35)

30

25

3,33

11,09

[35, 45)

40

45

13,33

177,69

N = 120

៮ x =

3.200 = 26,67 120

Rang: R = 45 − 5 = 40 Desviació mitjana: DM = Variància: σ2 =

1.366, 6 = 11,39 120

18.666, 8 = 155,56 120

Desviació típica: σ = 12,47 Coeficient de variació: CV =

540

12, 47 = 0,47 26, 67


917221Unidad12.qxd

19/1/09

11:11

Página 541

SOLUCIONARI

007

12

Compara les edats, en anys, dels jugadors d’aquests equips de bàsquet, utilitzant les mesures estadístiques. A: 18

26

20

26

22

26

23

27

25

25

B: 20

21

20

21

22

23

23

24

25

25

x៮A =

238 = 23,8 10

σA =

79, 6 = 7,96 10

σA = 2,82

x៮B =

224 = 22,4 10

σB2 =

32, 4 = 3,24 10

σB = 1,8

2, 82 = 0,12 23, 8 1, 8 CVB = = 0,08 22, 4

CVA =

La mitjana de les edats de l’equip A és superior, però també és més gran el coeficient de variació d’aquest equip, i per tant hi ha més diferències entre els seus jugadors.

008

Considera aquestes variables bidimensionals, i escriu-ne les variables unidimensionals corresponents i tres parells de valors que les determinen. a) Edat i sexe dels assistentes a un concert. b) Mida d’un arxiu informàtic i temps que es triga a copiar-lo. a) X → Edat, en anys, dels assistents al concert Y → Sexe dels assistents (20, dona)

(25, home)

(28, dona)

b) X → Mida, en kb, de l’arxiu informàtic Y → Temps, en s, que es tarda a copiar-lo (220, 35)

009

(158, 24)

(285, 42)

Ordena aquestes dades en una taula de doble entrada.

X

X

Y

X

Y

0

18

1

14

0

12

2

23

2

8

1

17

0

1

2

Total

8

0

0

1

1

12

1

0

0

1

14

0

1

0

1

17

0

1

0

1

18

1

0

0

1

23

0

0

1

1

Total

2

2

2

6

Y

541


917221Unidad12.qxd

19/1/09

11:11

Página 542

Estadística bidimensional 010

Construeix la taula de doble entrada i les taules marginals corresponents. X

16

17

18

16

14

17

14

13

14

15

Y

5

4

6

6

8

3

5

4

8

8

X

13

Y

14

15

16

17

18

Total

3

0

0

0

0

1

0

1

4

1

0

0

0

1

0

2

5

0

1

0

1

0

0

2

6

0

0

0

1

0

1

2

8

0

2

1

0

0

0

3

Total

1

3

1

2

2

1

10

Taula de freqüències marginals de X

011

Taula de freqüències marginals de Y

xi

fi

yi

fi

13

1

3

1

14

3

4

2

15

1

5

2

16

2

6

2

17

2

8

3

18

1

Total

10

Total

10

Determina la covariància per a les dades de la taula següent. X

8

10

11

9

13

12

9

14

Y

20

18

16

22

10

10

21

9

86 = 10,75 8 126 ៮ = 15,75 y = 8 1.279 − 10,75 ⋅ 15,75 = −9,44 σXY = 8

៮ x =

012

542

Representa el núvol de punts corresponent a aquesta variable estadística bidimensional. X

1

1

3

5

2

4

5

2

5

2

4

3

2

1

1

Y

4

5

2

5

5

4

5

3

6

5

1

2

8

6

3


917221Unidad12.qxd

19/1/09

11:11

Página 543

SOLUCIONARI

12

Y

1 X

1

013

Indica la dependència entre aquestes variables. Y

X

Dependència lineal dèbil i positiva. 014

Descriu el grau de correlació entre les dues variables representades.

Y

La correlació lineal és dèbil i negativa. 015

X

Si el signe de la covariància entre dues variables és negativa, què podem dir del signe del coeficient de correlació? I si la covariància és positiva? Si la covariància és negativa, el coeficient de correlació és negatiu. I si la covariància és positiva, el coeficient de correlació també és positiu.

016

Representa el diagrama de dispersió i troba el coeficient de correlació d’aquesta variable. Y X

39 43 40 40 42 41 42 38 39 44

195

Y 167 184 177 168 185 173 180 164 170 194 185

Quina relació hi pots descriure?

175

408 ៮ = 40,8 x = 10

1.762 ៮ y = = 176,2 10

σX =

3, 36 = 1,83

σY =

σXY =

72.046 13, 6 − 40,8 ⋅ 176,25 = 13,6 rXY = = 0,82 10 1, 83 · 9, 05

81, 96 = 9,05

165 38

40

42

44

46

48

X

543


917221Unidad12.qxd

19/1/09

11:11

Página 544

Estadística bidimensional 017

Raona quin valor tindrà el coeficient de correlació. a)

b)

Y

Y

X

X

a) El coeficient de correlació prendrà un valor relativament pròxim a −1, perquè el núvol de punts s’aproxima bastant a una recta amb pendent negatiu i la correlació és forta. b) El coeficient de correlació és 1, ja que el núvol de punts coincideix amb una recta de pendent positiu.

018

Troba la recta de regressió de Y sobre X.

30 =6 5 30 =6 σX2 = 5

X

2

5

6

8

9

Y

4

13

16

22

25

80 = 16 5 570 σXY = − 6 ⋅ 16 = 18 5

៮ x =

៮ y =

Recta de regressió de Y sobre X: y − 16 =

019

18 (x − 6) → y = 3x − 2 6

Determina la recta de regressió corresponent. X

39

40

40

42

43

Y

167 168 180 164 177 154 185 195 183 172

407 = 40,7 10 16.599 − 40,72 = 3,41 σX2 = 10

38

42

40

៮ y =

Recta de regressió de Y sobre X: y − 174,5 =

12, 35 (x − 40,7) → y = 3,62x + 27,17 3, 41

Determina les dues rectes de regressió i indica la relació que hi ha entre les variables. a)

b)

544

44

1.745 = 174,5 10 71.145 σXY = − 40,7 ⋅ 174,5 = 12,35 10

៮ x =

020

39

X

10

10

13

15

12

Y

6

5

2

3

5

X

8

10

11

12

16

13

12

17

13

13

Y

15

10

15

10

20

15

10

25

10

15


917221Unidad12.qxd

19/1/09

11:11

Página 545

SOLUCIONARI

a) ៮ x = σX2 =

60 = 12 5

៮ y =

738 − 122 = 3,6 5

σXY =

21 = 4,2 5

Recta de regressió de Y sobre X: y − 4,2 = − σX2 =

σX = 3, 6 = 1,89 rXY = −

σX2 =

σY =

125 = 12,5 10

៮ y =

1.625 − 12,52 = 6,25 10

σXY =

145 = 14,5 10 1.890 − 12,5 ⋅ 14,5 = 7,75 10

7, 75 (x − 12,5) → y = 1,24x − 1 6, 25

2.325 − 14,52 = 22,25 10

σX = 6, 25 = 2,5

021

2,16 = 1,47

2, 2 = −0,79 → La dependència és dèbil i negativa. 1, 89 · 1, 47

Recta de regressió de X sobre Y: x − 12,5 =

rXY =

2, 2 (x − 12) → y = −0,61x + 11,52 3, 6

2, 2 (y − 4,2) → x = −1,02y + 16,28 2,16

Recta de regressió de Y sobre X: y − 14,5 = σX2 =

241 − 12 ⋅ 4,2 = −2,2 5

99 − 4,22 = 2,16 5

Recta de regressió de X sobre Y: x − 12 = −

x = b) ៮

12

7, 75 (y − 14,5) → x = 0,35y + 7,43 22, 25

σY =

22, 25 = 4,72

7, 75 = 0,66 → La dependència és dèbil i positiva. 2, 5 · 4, 72

Raona quin és el grau de dependència entre les variables en cada cas. a)

b)

Y

Y

X

X

a) La dependència és forta i negativa. b) La dependència és dèbil i negativa.

545


917221Unidad12.qxd

19/1/09

11:11

Página 546

Estadística bidimensional 022

En un estudi sobre els ingressos mensuals, X, i la superfície dels habitatges, Y, resulta: y = 0,02x + 47,96. a) Troba l’estimació de la superfície de l’habitatge d’una família amb uns ingressos mensuals de 3.200 €. b) Si una família viu en una casa de 90 m2, quins ingressos mensuals tindrà? a) y = 0,02 ⋅ 3.200 + 47,96 = 111,96 m2 b) 0,02x + 47,96 = 90 → x = 2.102 €

023

En un estudi estadístic, el coeficient de correlació entre dues variables X i Y és −0,8. Se sap que ៮ x = 20; σX = 4; ៮ y = 8 i σY = 1. a) Determina les dues rectes de regressió, representa-les i analitza la correlació que hi ha entre les variables. b) Si x = 30, quina és l’estimació de y? σ XY → σXY = −3,2 4 ⋅1 3, 2 (x − 20) → y = −0,2x + 12 Recta de regressió de Y sobre X: y − 8 = − 16 3, 2 Recta de regressió de X sobre Y: x − 20 = − (y − 8) → x = −3,2y + 45,6 1

a) −0,8 =

Y

2 X

2

La dependència és forta i negativa. b) y = −0,2 ⋅ 30 + 12 = 6 024

Utilitza la calculadora per determinar totes les mesures estadístiques. a)

b)

X

2

4

2

3

5

1

4

5

1

3

4

2

1

3

4

Y

5

8

8

7

6

5

9

6

7

7

8

9

5

6

5

X 24 27 22 23 24 26 27 28 22 23 Y

2

1

2

4

a) ៮ x = 2,93 σX2 = 1,82 σX = 1,35 σXY = 0,35 rXY = 0,19

546

5

2

3

4

1

៮ y = 6,73 σY2 = 1,97 σY = 1,4

2

x = 24,6 b) ៮ σX2 = 4,44 σX = 2,11 σXY = 0,44 rXY = 0,16

៮ y = 2,6 σY2 = 1,64 σY = 1,28


917221Unidad12.qxd

19/1/09

11:11

Página 547

SOLUCIONARI

025

12

Estudia la correlació entre aquestes variables, i utilitza la calculadora per efectuar les operacions. X

14 16 17 14 15 12 13 13 14 16

Y

32 34 36 34 32 34 31 36 38 32

Determina la recta de regressió i raona si té sentit estimar el valor de Y si la variable X pren el valor 18. ៮ x = 14,4 σX2 = 2,24 σX = 2,11 σXY = 0,14 rXY = 0,03

៮ y = 33,9 σY2 = 4,49 σY = 2,12

Recta de regressió de Y sobre X: y − 33,9 =

0,14 (x − 14,4) → y = 0,06x + 33 2, 24

Com que la correlació és quasi nul·la, no té sentit fer l’estimació del valor de y per a x = 18. 026

Representa el núvol de punts associat a les distribucions bidimensionals següents. a) (2, 2)

(3, 6)

(5, 10)

(6, 14)

(8, 19)

(9, 23)

(10, 25)

b) (5, 2)

(6, 0)

(8, −2)

(10, −7)

(11, −9)

(13, −13)

(15, −17)

c) (120, 60)

(122, 75)

(126, 60) (128, 90)

(130, 50)

(132, 100) (136, 70)

d) (7, 3)

(8, 9)

(9, 2)

(11, 5)

(12, 1)

(10, 8)

(13, 7)

Decideix si hi ha dependència entre les variables i de quin tipus és. a)

c)

Y

20

100

4

20 1

b)

Y

10

X

120

d)

Y

130

160 X

Y

2 2

X

1 6

X

547


917221Unidad12.qxd

19/1/09

11:11

Página 548

Estadística bidimensional 027

Representa el núvol de punts associat a aquestes variables bidimensionals, i decideix si hi ha dependència entre les variables que les formen. En cas afirmatiu, digues de quina classe és. a)

b)

A

6

8

9

B

8

13 13 16 21 26 28 33

C

1

3

D

25 21 18 20 12 15

6

11 13 15 16 18

7

10 13 17 18 8

c)

E 110 112 115 116 118 120 121 124

d)

6

a) La dependència és forta i positiva.

F

40 45 35 40 60 70 45 33

G

26 24 23 22 18 15 14 12

H

8

12 14

7

10 11

9

B 25

5

b) La dependència és forta i negativa.

2

10

20

A

2

10

20

C

D 25

5

c) No s’aprecia dependència entre les variables E i F.

F

50

10

d) No s’aprecia dependència entre les variables G i H.

110

120

E

10

20

G

H

12

6

548

13


917221Unidad12.qxd

19/1/09

11:11

Página 549

SOLUCIONARI

028

12

A partir dels diagrames de dispersió, decideix si hi ha o no dependència lineal i, si n’hi ha, si és forta o dèbil, i si és positiva o negativa. a)

c)

Y

Y

X

b)

X

Y

Y

d)

X

X

a) No hi ha dependència lineal. b) La dependència lineal és forta i negativa. c) La dependència lineal és dèbil i positiva. d) La dependència lineal és forta i positiva.

029

Representa els núvols de punts corresponents a les variables bidimensionals definides per aquestes fórmules. a) y = 2x + 5 b) y = x2 + 3x Quin tipus de dependència presenten? a)

b)

Y

2

Y

2 2

La dependència és lineal.

X

2

X

La dependència és funcional.

549


917221Unidad12.qxd

19/1/09

11:11

Página 550

Estadística bidimensional 030

A la taula hi ha el nombre de quadres que han pintat els alumnes d’un taller sobre paisatges i natures mortes. Paisatges

4

5

6

7

8

4

2

1

0

0

0

5

4

4

3

0

1

6

2

5

4

2

0

8

0

0

3

2

1

Natures mortes

a) Determina les taules de freqüències marginals de paisatges i natures mortes. b) Calcula les mitjanes i les desviacions típiques de cada una de les variables. c) A partir del coeficient de variació, decideix quina de les dues variables és més dispersa. d) Fes el diagrama de dispersió corresponent a la variable bidimensional. a) Taula de freqüències marginals dels paisatges

Taula de freqüències marginals de les natures mortes

xi

fi

yi

fi

4

8

4

3

5

10

5

12

6

10

6

13

7

4

8

6

8

2

Total

34

Total

34

b) ៮ x = 5,47 σX = 1,15

៮ y = 5,82 σY = 1,19

c) CVX = 0,21 CVY = 0,204 La variable dels paisatges és una mica més dispersa que la de les natures mortes. d)

Y

1 1

550

X


917221Unidad12.qxd

19/1/09

11:11

Página 551

SOLUCIONARI

031

12

Y

Construeix la taula de doble entrada que correspon a aquesta variable bidimensional, representada mitjançant un diagrama de dispersió.

1 1

X

2

3

4

5

6

7

8

9

10

12

Total

1

0

0

0

0

0

0

0

0

1

0

1

3

0

0

0

0

0

0

1

0

0

0

1

4

0

0

0

0

0

1

0

1

1

1

4

5

0

0

0

1

0

0

1

0

0

0

2

6

0

1

0

0

1

0

0

1

0

0

3

7

0

0

0

1

0

0

0

0

0

0

1

8

1

0

1

0

0

0

0

0

0

0

2

9

1

0

0

0

0

0

0

0

0

0

1

Total

2

1

1

2

1

1

2

2

2

1

15

Y

032

X

A partir d’aquest diagrama de dispersió, elabora la taula de doble entrada corresponent.

Y

1

1

X

3

4

5

6

7

8

9

10

Total

1

0

1

0

0

0

0

0

0

1

3

0

0

0

1

0

0

0

0

1

4

0

0

0

0

1

0

0

0

1

5

0

0

1

1

0

1

0

0

3

6

1

0

0

1

0

0

1

0

3

7

0

0

1

0

0

1

1

1

4

9

0

0

0

0

0

0

1

0

1

10

0

0

0

0

0

0

0

1

1

Total

1

1

2

3

1

2

3

2

15

Y

X

551


917221Unidad12.qxd

19/1/09

11:11

Página 552

Estadística bidimensional 033

Construeix la taula de doble entrada corresponent, a partir del diagrama de dispersió, tenint en compte la freqüència de les dades que hi ha entre parèntesis. Y 8

X

1

2

3

4

5

Total

2

0

9

0

6

0

15

4

9

0

3

0

0

12

6

0

0

3

0

0

3

7

0

0

0

0

12

12

Total

9

9

6

6

12

42

Y (3)

6 4

(12)

(3) (9)

2

(6)

(9) 1

034

2

5

X

P

0

1

2

3

4

5

6

7

Q

20

18

17

15

12

10

7

4

R

90

80

70

60

50

40

30

S

−5

−7

−8

−11

−13

−16

−17

rPQ = −0,11

σRS = 84,29

rRS = 0,99

Troba la covariància i el coeficient de correlació corresponents a aquestes variables estadístiques. T

−12

−14

−15

−16

−18

−20

−22

U

8

5

3

12

20

10

6

V

2,4

2,8

3,2

3,6

4

4,4

4,8

5,2

W

100

150

220

270

340

400

460

520

σTU = −3,69 036

4

Calcula la covariància i el coeficient de correlació per a les variables bidimensionals indicades a les taules següents.

σPQ = −7,22 035

3

rTU = −0,22

σVW = 127,5

rVW = 0,99

Representa la variable bidimensional els parells de valors dels quals són: (8, 2)

(12, 6)

(10, 4)

(12, 2)

(8, 6)

a) Calcula’n la covariància i raona el resultat. b) Elimina un punt de manera que la correlació es mantingui. a) σXY = 0 No hi ha dependència entre les variables, per tant, la covariància és nul·la. b) Quan s’elimina el punt (10, 4), la correlació no varia.

Y

1 6

552

X


917221Unidad12.qxd

19/1/09

11:11

Página 553

SOLUCIONARI

037

12

Dibuixa el diagrama de dispersió corresponent a la variable bidimensional determinada pels parells de dades: (10, 20)

(16, 30)

(10, 30)

(16, 20)

a) Calcula’n la covariància i explica a què és degut aquest resultat. b) Afegeix un punt de manera Y que la correlació es mantingui. a) σXY = 0 No hi ha dependència entre les variables, per tant, la covariància és nul·la.

25

5

b) Quan s’hi afegeix el punt (13, 15), la correlació no varia. 038

2

20

10

X

A la taula es presenten dades climatològiques referides a una ciutat: la temperatura, en °C; la humitat relativa de l’aire, en %, i la velocitat del vent, en km/h. Dies

Dl.

Dt.

Dc.

Dj.

Dv.

Ds.

Dg.

Temperatura

22

24

25

24

23

21

20

Humitat

78

90

80

92

88

74

80

Velocitat del vent

1

3

6

4

4

1

0

Determina la covariància i el coeficient de correlació de les variables bidimensionals següents: a) Temperatura–Humitat. b) Temperatura–Velocitat del vent. c) Humitat–Velocitat del vent. a) σTH = 6,46 b) σTV = 3,17 c) σHV = 6,404 039

rTH = 0,59 rTV = 0,93 rHV = 0,507

S’ha fet una enquesta a persones que han tingut un accident de tràfic, i se’ls ha preguntat el nombre de mesos transcorreguts i l’edat. Les respostes han estat: Carme, 35: [60, 70) Teresa, 15: [50, 60) Pilar, 12: [50, 60) Maria, 6: [20, 30) Joan, 8: [40, 50) Jordi, 15: [30, 40)

Jaume, 24: [50, 60) Marta, 12: [30, 40) Josep, 28: [40, 50) Andreu, 3: [20, 30) Montserrat, 20: [40, 50) Núria, 16: [30, 40)

a) Elabora la taula corresponent a la variable bidimensional. b) Representa el diagrama de dispersió. c) Estudia si hi ha correlació entre les dues variables, i determina’n el coeficient de correlació lineal.

553


917221Unidad12.qxd

19/1/09

11:11

Página 554

Estadística bidimensional a)

X Y [20, 30)

3

6

8

12

15

16

20

24

28

35

Total

1

1

0

0

0

0

0

0

0

0

2

[30, 40)

0

0

0

1

1

1

0

0

0

0

3

[40, 50)

0

0

1

0

0

0

1

0

1

0

3

[50, 60)

0

0

0

1

1

0

0

1

0

0

3

[60, 70)

0

0

0

0

0

0

0

0

0

1

1

Total

1

1

1

2

2

1

1

1

1

1

12

c) σXY = 89,5 rXY = 0,73

b) La correlació és dèbil i positiva. Y 50

10 3

040

X

30

15

A la taula següent s’han perdut dues dades. x1

23

24

25

27

28

29

33

34

36

2

4

3

5

y5

6

7

9

6

8

Se sap que la mitjana de la primera variable és 28 i que la mitjana de la segona variable és 5,8. Completa la taula i determina el coeficient de correlació. ៮ x = 28 → rXY = 0,802 041

x1 + 259 = 28 → x1 = 21 10

៮ y = 5,8 →

y 5 + 50 = 5,8 → y5 = 8 10

S’està estudiant imposar un impost a les empreses químiques que sigui proporcional a les seves emissions de sofre a l’atmosfera. S’ha experimentat amb diversos procediments per mesurar les emissions, però no se n’ha trobat cap de fiable. Finalment, s’ha decidit investigar algun mètode indirecte. Es creu que l’emissió de sofre pot estar relacionada amb el consum elèctric, amb el consum d’aigua o amb el volum de les xemeneies de les fàbriques. Per valorar-ho s’ha dut a terme un estudi en un medi controlat. Els resultats es poden veure a la taula. Quantitat de sofre (t)

2,3

Consum elèctric (kWh)

1,8

1

0,4

0,6

3

0,5

1.400 1.250 1.850 600 300 3.400 400

Consum d’aigua (l) 3

Volum de les xemeneies (m )

100

230

45

50

10

540

22

18

16

12

5

6

21

4

Quina de les mesures estadístiques es relaciona de manera més evident amb les emissions de sofre? Justifica la resposta.

554


917221Unidad12.qxd

19/1/09

11:11

Página 555

SOLUCIONARI

12

El volum de les xemeneies és la variable que es relaciona més amb la quantitat d’emissions de sofre. Y

Y

Y

2.500

500

500

100

100

1.500 500 1

042

2

3

X

1

2

3

X

1

3

X

Traça a mà alçada, i sense fer càlculs, la recta de regressió de les variables bidimensionals següents. a)

b)

Y

Y

X

a)

X

b)

Y

Y

X

043

2

X

Representa, sense trobar-ne l’equació, la recta de regressió corresponent a aquestes variables. a)

b)

Y

X

Y

X

555


917221Unidad12.qxd

19/1/09

11:11

Página 556

Estadística bidimensional a)

b)

Y

X

044

X

Per a les variables bidimensionals representades a continuació, hem ajustat diferents rectes de regressió als núvols de punts corresponents. Estima el valor que tindrà y en cada una de les rectes per a un valor de x = 12. a)

Y y = 1,99x − 0,04

5 X

5

b)

Y y = −1,33x + 29,25

5 X

5

c)

Y

y = 0,35x + 13,67

5 5

X

Quina de les estimacions et sembla més fiable? a) y = 1,99 ⋅ 12 − 0,04 = 23,84 b) y = −1,83 ⋅ 12 + 29,25 = 7,29 c) y = 0,35 ⋅ 12 + 13,67 = 17,87 L’estimació més fiable és la de l’apartat a).

556

Y


917221Unidad12.qxd

19/1/09

11:11

Página 557

SOLUCIONARI

045

12

Determina la recta de regressió de Y sobre X i la recta de regressió de X sobre Y corresponents a aquestes taules. a) X 10 11 12 13 14 15 16 17 b)

c)

d)

Y

20

24

28

30

36

32

42

X

60

70

80

90

100

110

120

Y

−5

−8

−12

−15

−16

−24

−20

X

−3

−4

−5

−6

−9

−10

−13

Y

80

92

100

88

76

70

60

X

0,2

0,4

0,5

0,7

0,8

0,9

1

1,2

Y

40

50

120

70

40

40

60

50

a) ៮ x = 13,5 σX2 = 5,25

៮ y = 31,5 σY2 = 50,75

40

σXY = 15,5

Recta de regressió de Y sobre X: 15, 5 y − 31,5 = (x − 13,5) → y = 2,95x − 8,33 5, 25 Recta de regressió de X sobre Y: 15, 5 x − 13,5 = (y − 31,5) → x = 0,31y + 3,74 50, 75 ៮ b) ៮ y = −14,29 σXY = −115,33 x = 90 σX2 = 400 σY2 = 37,22 Recta de regressió de Y sobre X: 115, 33 y + 14,29 = − (x − 90) → y = −0,29x + 11,81 400 Recta de regressió de X sobre Y: 115, 33 x − 90 = − (y + 14,29) → x = −3,099y + 45,72 37, 22 ៮ c) ៮ x = −7,14 y = 80,86 σXY = 34,48 2 σX = 11,31 σY2 = 159,37 Recta de regressió de Y sobre X: 34, 48 y − 80,86 = (x + 7,14) → y = 3,049x + 102,63 11, 31 Recta de regressió de X sobre Y: 34, 48 x + 7,14 = (y − 80,86) → x = 0,22y − 24,93 159, 37 ៮ d) ៮ y = 58,75 σXY = −1,088 x = 0,71 σY2 = 635,94 σX2 = 0,099 Recta de regressió de Y sobre X: 1, 088 y − 58,75 = − (x − 0,71) → y = −10,99x + 66,55 0, 099 Recta de regressió de X sobre Y: 1, 088 x − 0,71 = − (y − 58,75) → x = −0,0017y + 0,81 635, 94

557


917221Unidad12.qxd

19/1/09

11:11

Página 558

Estadística bidimensional 046

Troba cinc punts que pertanyin a la recta y = 4x + 6. a) Calcula el coeficient de correlació corresponent i explica el resultat. b) Troba les dues rectes de regressió. Resposta oberta. x

−2

−1

0

1

2

y

−2

2

6

10

14

a) ៮ x =0

៮ y =6

σX =

2 = 1,41

σY =

32 = 5,66

σXY = 8

rXY = 1 → La dependència és lineal. b) Recta de regressió de Y sobre X: y−6=

8 (x − 0) → y = 4x + 6 2

Recta de regressió de X sobre Y: x−0=

047

8 1 3 (y − 6) → x = y − 32 4 2

Troba cinc punts que pertanyin a la recta. y = −20x + 10 a) Calcula el coeficient de correlació i explica el resultat. b) Troba les dues rectes de regressió. Raona els resultats obtinguts. Resposta oberta. x

−2

−1

0

1

2

y

50

30

10

−10

−30

x =0 a) ៮

៮ y = 10

σX =

2 = 1,41

σY =

rXY = −1 → La dependència és lineal. b) Recta de regressió de Y sobre X: y − 10 = −

40 (x − 0) → y = −20x + 10 2

Recta de regressió de X sobre Y: x−0=−

558

40 1 1 (y − 10) → x = − y + 800 20 2

800 = 28,28

σXY = −40


917221Unidad12.qxd

19/1/09

11:11

Página 559

SOLUCIONARI

048

12

Es creu que el nombre de guineus en una finca està relacionat amb el nombre de conills. En els últims anys s’han fet vuit censos de tots dos animals, i n’han resultat aquestes dades: Nre. de guineus

20

32

16

18

25

30

14

15

Nre. de conills

320 500 260 300 400 470 210 240

Si la correlació és forta: a) b) c) d)

Determina les dues rectes de regressió. Estima la quantitat de conills que hi hauria si hi hagués 10 guineus. Quantes guineus hi hauria si haguéssim comptat 350 conills? Quina de les dues estimacions és més fiable? a) ៮ x = 21,25 σXY = 653,13

៮ y = 337,5

σX =

42,19 = 6,5

σY = 10.168, 75 = 100,84

rXY = 0,99 → La dependència és forta i positiva.

Recta de regressió de Y sobre X: 653,13 y − 337,5 = (x − 21,25) → y = 15,48x + 8,55 42,19 Recta de regressió de X sobre Y: 653,13 x − 21,25 = (y − 337,5) → x = 0,064y − 0,35 10.168, 75 b) x = 10 → y = 15,48 ⋅ 10 + 8,55 = 163,35 En aquest cas hi hauria 163 conills. c) y = 350 → x = 0,064 ⋅ 350 − 0,35 = 22,05 En aquest cas serien 22 guineus. d) Com que el coeficient de correlació és molt pròxim a 1, les dues estimacions són força fiables. 049

Al llarg d’un dia s’ha mesurat la tensió i el pols cardíac d’una persona, per mirar de decidir si les dues variables tenen alguna relació. Les dades obtingudes es reflecteixen a la taula: Nivell mínim de tensió

6

5

9

4

10

8

6

9

Nre. de pulsacions per minut

60

55

80

40

95

75

55

90

a) Calcula la covariància, el coeficient de correlació i les dues rectes de regressió. b) Si la correlació és forta, estima les pulsacions que tindrà la persona quan tingui un nivell mínim de tensió de 15. c) Quin nivell mínim de tensió s’estima quan les pulsacions cardíaques per minut són 70? d) Quina de les dues estimacions és més fiable? e) Dibuixa el núvol de punts i la recta de regressió corresponents.

559


917221Unidad12.qxd

19/1/09

11:11

Página 560

Estadística bidimensional a) ៮ x = 7,13 σXY = 35,44

៮ y = 68,75

σX =

4, 04 = 2,01

σY =

323, 44 = 17,98

rXY = 0,98 → La dependència és forta i positiva.

Recta de regressió de Y sobre X: 35, 44 y − 68,75 = (x − 7,13) → y = 8,77x + 6,22 4, 04 Recta de regressió de X sobre Y: 35, 44 x − 7,13 = (y − 68,75) → x = 0,11y − 0,43 323, 44 b) x = 15 → y = 8,77 ⋅ 15 + 6,22 = 137,77 En aquest cas tindria 138 pulsacions per minut. c) y = 70 → x = 0,11 ⋅ 70 − 0,43 = 7,27 S’estima que tindria un nivell mínim de 7. d) Les dues estimacions són molt fiables, perquè el coeficient de correlació és força pròxim a 1. Y e) 90

60

30 1

050

10

5

X

Tenim dues variables bidimensionals representades per aquests núvols de punts. (I)

Y

(II)

Y

5 2 5

X

5

X

a) Escull els coeficients de correlació de totes dues i raona-ho. −0,92 0,6 0,95 −0,65 b) Ara, decideix quines són les equacions de les dues rectes de regressió corresponents. y = −2x + 12,6 y = 3x + 0,2 y = 1,3x + 0,9 y = −0,6x + 10 Justifica la resposta. a) El coeficient de correlació de les variables representades en el gràfic I és 0,95, perquè el núvol de punts mostra una dependència entre les variables forta i positiva. El coeficient de correlació de les variables representades en el gràfic II és −0,65, perquè la dependència entre les variables és dèbil i negativa. b) La recta de regressió del gràfic I és y = 1,3x + 0,9; ja que el pendent de la recta dibuixada és un valor pròxim a 1. La recta de regressió del gràfic II és y = −0,6x + 10, perquè el valor de l’ordenada de la recta representada és 10.

560


917221Unidad12.qxd

19/1/09

11:11

Página 561

SOLUCIONARI

051

12

Una empresa ha investigat la relació entre les despeses que té en publicitat i els beneficis que obté (en milions d’euros). Aquest és un resum de l’estudi. Any

98

99

00

01

02

03

04

06

07

Despeses

2

2,4

2

2,8

3

3,2 3,2 3,3 3,5

4

Beneficis

12

15

13

15

18

19

22

19

05 20

20

a) Comprova si hi ha relació entre les magnituds i, si és possible, estima els beneficis que s’obtindran l’any 2008, si s’invertiran 4,2 milions d’euros en publicitat. b) Quina inversió caldria per assolir 30 milions d’euros de beneficis? a) ៮ x = 2,94

៮ y = 17,3

σX =

0, 38 = 0,61

σY = 10, 01 = 3,16

σXY = 1,89

rXY = 0,98 → La dependència és forta i positiva. Recta de regressió de Y sobre X: 1, 89 y − 17,3 = (x − 2,94) → y = 4,97x + 2,69 0, 38 x = 4,2 → y = 4,97 ⋅ 4,2 + 2,69 = 23,56 Els beneficis serien de 23,56 milions d’euros. b) Recta de regressió de X sobre Y: 1, 89 x − 2,94 = (y − 17,3) → x = 0,19y − 0,35 10, 01 y = 30 → y = 0,19 ⋅ 30 − 0,35 = 5,35 La inversió hauria de ser de 5,35 milions d’euros. 052

La Maria i en Jaume viuen al mateix carrer, però en voreres oposades. Els dos tenen un termòmetre al balcó i, com que la Maria creu que el seu s’ha fet malbé, decideixen anotar la temperatura exterior, en °C, durant una setmana i a la mateixa hora del dia. Han anotat els resultats en una taula. Jaume

22

24

25

27

18

20

21

Maria

18

20

18

17

20

21

16

a) Creus que les dues variables estan relacionades? Creus que haurien d’estar-ho? b) Raona si amb aquestes dades es pot obtenir alguna conclusió sobre el termòmetre de la Maria. y = 18,57 σX = 2,86 σY = 1,69 a) ៮ x = 22,43 ៮ rXY = −0,43 → La dependència és dèbil i negativa.

σXY = −2,097

Les dues variables estan poc relacionades, ja que els termòmetres estan en costats oposats de la vorera reben una exposició solar diferent. b) Com que la dependència és dèbil no es pot concloure res sobre el termòmetre de la Maria.

561


917221Unidad12.qxd

19/1/09

11:11

Página 562

Estadística bidimensional 053

S’ha mesurat el pes, X, i l’alçada, Y, dels alumnes d’una classe. El pes mitjà és de 56 kg, amb una desviació típica de 2,5 kg. L’equació de la recta de regressió que relaciona l’alçada i el pes és: y = 1,8x + 62 a) b) c) d)

Quina alçada pot estimar-se per a un alumne que pesa 64 kg? I si un alumne pesés 44 kg, quina alçada tindria? Quina és l’alçada mitjana dels alumnes d’aquesta classe? El pendent d’aquesta recta és positiu. Què vol dir això? a) x = 64 → y = 1,8 ⋅ 64 + 62 = 177,2 L’alumne deu fer 1,77 m d’alçada. b) x = 44 → y = 1,8 ⋅ 44 + 62 = 141,2 En aquest cas tindria una alçada d’1,41 m. c) y = 1,8 ⋅ 56 + 62 = 162,8 L’alçada mitjana és 1,63 m d) Si el pendent és positiu, llavors la correlació entre les variables també és positiva, és a dir, quan els valors d’una variable augmenten, els valors de l’altra variable també ho fan.

054

En Pere afirma que si un núvol de punts és d’una recta, el coeficient de correlació sempre val 1 o −1. Com que l’Eva no hi està d’acord, en Pere ho prova amb els punts de la recta d’equació y = −5x + 20, i l’Eva ho fa amb els punts de y = 2x −x2. Qui té raó? Per què? Si y = −5x + 20, alguns dels punts són: X

−2

−1

0

1

2

Y

30

25

20

15

10

៮ y = 20 σX = 1,41 σY = 7,07 x =0 ៮ rXY = −1 → La dependència és lineal.

σXY = −10

Si y = 2x − x2, no és una recta, i alguns dels punts són: X

−2

−1

0

1

2

Y

−8

−3

0

1

0

៮ y = −2 σX = 1,41 σY = 3,29 σXY = 4 x =0 ៮ rXY = 0,86 → La dependència és dèbil; per tant, l’Eva no té raó. 055

Un equip d’alpinistes que va escalar una muntanya, va mesurar l’altitud i la temperatura cada 200 metres d’ascensió. Després va anotar les dades en aquestes taules. Altitud (m)

800

Temperatura (°C)

22

Altitud (m) Temperatura (°C)

562

1.000 1.200 1.400 1.600 1.800 2.000 20

17

15

11

9

2.200 2.400 2.600 2.800 3.000 3.200 5

3

2

2

2

1

8


917221Unidad12.qxd

19/1/09

11:11

Página 563

SOLUCIONARI

12

a) Agafa les deu primeres mesures i, si la correlació és forta, calcula la recta de regressió de la temperatura sobre l’altitud. b) Estima la temperatura que hi haurà als 1.900 metres d’altitud. c) Quina temperatura s’estima als 3.200 metres? Com expliques les diferències? y = 11,2 σX = 574,46 σY = 6,69 a) ៮ x = 1.700 ៮ rXY = −0,99 → La dependència és forta i negativa.

σXY = −3.820

Recta de regressió de Y sobre X: 3.820 (x − 1.700) → y = −0,012x + 31,6 330.000 b) x = 1.900 → y = −0,012 ⋅ 1.900 + 31,6 = 8,8 La temperatura estimada és de 8,8 °C. y − 11,2 = −

c) x = 3.200 → y = −0,012 ⋅ 3.200 + 31,6 = −6,8 La diferència es deu al fet que el valor no està inclòs en l’interval [800, 2.600], format per les dades que s’han utilitzat per calcular la recta de regressió.

056

L’alcalde d’un poble ha constatat una reducció del nombre de naixements de nens, i ha encarregat un estudi. Any

86

89

92

95

98

01

04

07

Naixements

50

54

40

33

34

23

21

17

a) Pot establir-se, de manera fiable, una fórmula que relacioni l’any amb el nombre de naixements? b) Quants naixements poden estimar-se per al 2008? I per al 2010? Què pot estimar-se per al 2050? c) Aquesta última estimació és fiable? Raona la resposta. a)

X

0

3

6

9

12

15

18

21

Y

50

54

40

33

34

23

21

17

៮ x = 10,5

៮ y = 34

σX = 6,87

σY = 12,61

σXY = −83,63

rXY = −0,97 → La dependència és forta i negativa, i per tant es pot utilitzar la recta de regressió per relacionar les dues variables. b) Recta de regressió de Y sobre X: y − 34 = −

83, 63 (x − 10,5) → y = −1,77x + 52,59 47, 25

Per a l’any 2008 s’estimen: x = 22 → y = −1,77 ⋅ 22 + 52,59 = 13,65 naixements Per a l’any 2010 s’estimen: x = 64 → y = −1,77 ⋅ 64 + 52,59 = −60,69 naixements Per a l’any 2050 s’estimen −60 naixements. c) No és fiable, ja que l’any 2050 està molt allunyat del rang d’anys estudiats en la regressió.

563


917221Unidad12.qxd

19/1/09

11:11

Página 564

Estadística bidimensional 057

Una empresa estudia el nombre de dies de baixa per malaltia, Y, de cada un dels seus treballadors durant l’últim any. Per comparar-ho amb l’antiguitat, X, dels treballadors, han elaborat la taula següent. X

1

2

3

4

5

0

6

12

8

3

0

2

4

5

3

2

1

3

0

1

3

2

0

5

0

0

2

2

1

9

0

0

0

0

1

Y

a) Calcula les mitjanes i les desviacions típiques de les distribucions marginals. b) Determina la covariància i el coeficient de correlació. c) Troba la recta de regressió de Y sobre X i estima, si és fiable, el nombre de dies de baixa que poden esperar en un treballador amb 6 anys d’antiguitat a l’empresa. a) Taula de freqüències marginals dels anys d’antiguitat

Taula de freqüències marginals dels dies de baixa

xi

fi

yi

fi

1

10

0

29

2

18

2

15

3

16

3

6

4

9

5

5

5

3

9

1

Total

56

Total

56

៮ x = 2,59 σX = 1,11 b) σXY = 1,02

៮ y = 1,46 σY = 1,89 rXY = 0,49

1, 02 (x − 2,59) → y = 0,83x − 0,69 1, 23 La dependència és dèbil, i per tant l’estimació no és fiable.

c) Recta de regressió de Y sobre X: y − 1,46 =

058

Un inversor borsari vol predir l’evolució que tindrà l’Índex de la Borsa Espanyola (IBEX). Ha arribat a la conclusió que allò que passa amb l’IBEX un dia és el que passa a la cotització de l’empresa AW&B el dia anterior. Esbrina si això és correcte, a partir de les cotitzacions durant una setmana i els valors assolits per l’IBEX al dia següent. Dia AW&B Dia IBEX

564

1r

2n

3r

4t

21,8

23,4

19,6

19,4

18,4

19,9

19,2

2n

3r

4t

12.560 12.720 11.580 11.420 10.930 11.450 11.480


917221Unidad12.qxd

19/1/09

11:11

Página 565

SOLUCIONARI

12

a) Quina cotització tindrà AW&B el dia anterior al dia en què l’IBEX assoleixi els 14.000 punts? b) Si un dia AW&B té una cotització de 24 euros, quin valor podem esperar que assoleixi l’IBEX el dia següent? ៮ x = 20,24 σX = 2, 77 = 1,66

៮ y = 11.734,29 σY = 366.809, 62 = 605,65

σXY = 977,26 rXY = 0,97 → La dependència és forta i positiva. a) Recta de regressió de X sobre Y: x − 20,24 =

977, 26 (y − 11.734,29) → x = 0,0027y − 11,44 366.809, 62

y = 14.000 → x = 0,0027 ⋅ 14.000 − 11,44 = 26,36 b) Recta de regressió de Y sobre X: y − 11.734,29 =

977, 26 (x − 20,24) → y = 352,8x − 4.593,62 2, 77

x = 24 → y = 352,8 ⋅ 24 − 4.593,62 = 3.873,58

059

Troba el coeficient de correlació de la variable bidimensional les rectes de regressió de la qual són: • Recta de Y sobre X: 2x −y −1 = 0 • Recta de X sobre Y: 9x −4y −9 = 0 a) Troba la mitjana aritmètica de cada una de les variables. b) Pots calcular la desviació típica de y si saps que la de la variable X és 2 ? 2x − y − 1 = 0 → y = 2x − 1 → 9x − 4y − 9 = 0 → x = rXY =

σ XY σ XY 3 σ XY · 2 2

=

σ XY = 2 → σX = σX 2

σ XY 2

4 σ 4 3 σ XY y + 1 → XY2 = → σY = 9 σY 9 2 2 2 = 0, 94 3

a) Les rectes de regressió es tallen en el punt (x៮, ៮ y ). 2x − y − 1 = 0 ⎫ ⎪ ⎬ → x = 5, y = 9 9x − 4y − 9 = 0⎪ ⎪ ⎭ Llavors, resulta que: ៮ x = 5, ៮ y =9 b) σ X =

2 →

σ XY 3·2 = 2 → σ XY = 4 → σY = =3 2 2

565


917221Unidad12.qxd

19/1/09

11:11

Página 566

Estadística bidimensional 060

Sigui la variable bidimensional següent: X

3

5

8

9

10

12

15

Y

2

3

7

4

8

5

8

Investiga què succeeix amb la covariància i el coeficient de correlació en cada cas. a) b) c) d)

Sumem 10 a tots els valors de la variable X. Sumem 10 a tots els valors de la variable X i de la variable Y. Multipliquem per 4 tots els valors de la variable X. Multipliquem per 4 tots els valors de la variable X i de la variable Y. ៮ x = 8,86

៮ y = 5,29

σXY = 6,42

σX = 14, 07 = 3,75

σY = 5, 02 = 2,24

rXY = 0,76

a)

X

13

15

18

19

20

22

25

Y

2

3

7

4

8

5

8

៮ x = 8,86 + 10 = 18,86 σX = 3,75 b)

σXY = 6,42 rXY = 0,76

X

13

15

18

19

20

22

25

Y

12

13

17

14

18

15

18

៮ y = 5,29 + 10 = 15,29 σY = 2,24 c)

σXY = 6,42 rXY = 0,76

X

12

20

32

36

40

48

60

Y

2

3

7

4

8

5

8

៮ x = 8,86 ⋅ 4 = 35,44 σX = 3,75 ⋅ 4 = 15 d)

X

12

20

32

36

40

48

60

Y

8

12

28

16

32

20

32

៮ y = 5,29 ⋅ 4 = 21,16 σY = 2,24 ⋅ 4 = 8,96 061

σXY = 6,42 ⋅ 4 = 25,68 rXY = 0,76

σXY = 6,42 ⋅ 16 = 102,72 rXY = 0,76

Respon aquestes qüestions. a) És cert que el signe dels pendents de les dues rectes de regressió d’una variable bidimensional és sempre igual? b) Què passa si les dues rectes de regressió tenen el mateix pendent? Com és la correlació? a) És cert, perquè el signe dels pendents de les rectes de regressió coincideix amb el signe de la covariància en totes dues. b) Com que les dues rectes passen pel punt (x៮, ៮ y ), si tenen el mateix pendent, llavors són coincidents. Per tant, la dependència entre les dues variables unidimensionals és lineal. La correlació és igual a 1 o 0.

566


917221Unidad12.qxd

19/1/09

11:11

Página 567

SOLUCIONARI

062

12

L’angle que formen les dues rectes de regressió d’una distribució bidimensional és més gran com més petit sigui el coeficient de correlació. Comprova-ho estudiant les dues magnituds en aquestes distribucions. 10

12

14

16

18

3

8

1

9

2

10

12

14

16

18

3

6

8

6

7

10

12

14

16

18

5

6

6,5

8,5

9

៮ x = 14

៮ y = 4,6

σXY = −0,4

σX = 8 = 2,83

σY = 1, 55 = 1,24

rXY = −0,11

0, 4 (x − 14) → y = −0,05x + 5,3 8 0, 4 Recta de regressió de X sobre Y: x − 14 = − (y − 4,6) → x = −0,26y + 15,2 1, 55 L’angle que formen les rectes és:

Recta de regressió de Y sobre X: y − 4,6 = −

cos α = ៮ y =6

0, 26 + 0, 05 (−1) + 0, 052 · (−0, 26)2 + 12 2

σY =

2, 8 = 1,67

σXY = 3,2

= 0, 29 → α = 72° 33' 48 " rXY = 0,68

3, 2 (x − 14) → y = 0,4x + 0,4 8 3, 2 Recta de regressió de X sobre Y: x − 14 = (y − 6) → x = 1,14y + 7,16 2, 8

Recta de regressió de Y sobre X: y − 6 =

L’angle que formen les rectes és: cos α = ៮ y =7

1,14 − 0, 4 1 + 0, 4 2 · 1,14 2 + (−1)2 2

σY =

2, 4 = 1,55

= 0, 45 → α = 63° 3' 30 "

σXY = 4,2

rXY = 0,96

4, 2 (x − 14) → y = 0,53x − 0,42 8 4, 2 Recta de regressió de X sobre Y: x − 14 = (y − 7) → x = 1,75y + 1,75 2, 4

Recta de regressió de Y sobre X: y − 7 =

L’angle que formen les rectes és: : cos α =

1, 75 + 0, 53 1 + 0, 532 · 1, 752 + 12 2

= 0, 99 → α = 1° 49 ' 16 "

567


917221Unidad12.qxd

19/1/09

11:11

Página 568

Estadística bidimensional 063

S’ha fet un test de memòria, X, i un d’atenció, Y, a diversos alumnes i els resultats s’han reflectit en aquesta taula. X

Y

[0, 10)

[10, 20)

[20, 30)

[30, 40)

Anna

Josep

Marta

Biel

Maria Júlia

Miquel

Marina

Joan Txell

[40, 50)

[0, 10) [10, 20) [20, 30) [30, 40) [40, 50)

Laura

Jaume

a) Calcula la covariància i el coeficient de correlació. b) Determina les dues rectes de regressió. c) Si és factible, estima quina puntuació obtindrà en Jordi en memòria, si té un 33 en atenció. d) Si és factible, estima quina puntuació obtindrà l’Eva en atenció, si té un 27 en memòria. yj

5

15

25

35

45

Total

5

0

0

0

0

0

0

15

1

1

1

0

0

3

25

0

1

2

1

0

4

35

0

0

1

1

1

3

xi

45

0

0

0

1

0

1

Total

1

2

4

3

1

11

a) ៮ x = 25,91 σX = 117, 31 = 10,83

៮ y = 26,82

σXY = 71,0038

σY = 87, 51 = 9,35

rXY = 0,7

b) Recta de regressió de Y sobre X: y − 26,82 =

71, 0038 (x − 25,91) → y = 0,61x + 11,01 117, 31

Recta de regressió de X sobre Y: 71, 0038 x − 25,91 = (y − 26,82) → x = 0,81y + 4,19 87, 51 c) y = 33 → x = 0,81 ⋅ 33 + 4,19 = 30,92 d) x = 27 → y = 0,61 ⋅ 27 + 11,01 = 27,48

568


917221Unidad12.qxd

19/1/09

11:11

Página 569

SOLUCIONARI

12

PER ACABAR... 064

Troba la relació existent entre el coeficient de correlació lineal d’una distribució bidimensional i els pendents de les seves rectes de regressió. Comprova el resultat obtingut per a aquestes dades. X

10

13

16

14

17

18

Y

3

6

7

8

11

11

Y

Els pendents de les rectes de regressió són: ⎧ ⎪ σ ⎪ mX = XY2 → σ X = ⎪ ⎪ σX ⎪⎪ ⎨ ⎪ σ ⎪ ⎪ mY = XY2 → σY = ⎪ ⎪ σY ⎪ ⎩

2

σ XY mY

σ XY = σ X · σY

rXY =

Per tant, resulta que:

2

σ XY mx

σ XY σ XY · mX

X

= mX · mY

σ XY mY

៮ x = 14,67 σX = 7,12 = 2,67

៮ y = 7,67 σXY = 6,98 σY = 7, 84 = 2,8 rXY = 0,93 6, 98 Recta de regressió de Y sobre X: y − 7,67 = (x − 14,67) → mX = 0,98 7,12 6, 98 (y − 7,67) → mY = 0,89 Recta de regressió de X sobre Y: x − 14,67 = 7, 84 mX ⋅ mY = 0,93

065

Discuteix si és possible que la recta de regressió de X sobre Y i la recta de regressió de Y sobre X siguin paral·leles. I perpendiculars? y) No és possible que siguin paral·leles, ja que sempre tenen un punt comú: (x៮, ៮ Són perpendiculars si la correlació és nul·la.

066

Investiga com varia el coeficient de correlació entre dues variables estadístiques quan multipliquem les dades relatives a una de les constants per una quantitat constant, k. I si les multipliquem per la mateixa constant? Què passaria si multipliquessim cada variable per una constant diferent? Quan multipliquem les dades d’una variable per una quantitat constant k, les seves mesures estadístiques verifiquen que: n

n

∑ fi · kx i

i =1

=

N

k · ∑ fi · x i i =1

N

=k· x

n

n

∑ fi · (kx i − kx )2

i =1

=

N

∑ fi · k 2(x i − x )2

i =1

N

n

=

k 2 · ∑ fi · (x i − x )2 i =1

N

= k 2 · σ2X

k · σ = k · σX 2

2 X

569


917221Unidad12.qxd

19/1/09

11:11

Página 570

Estadística bidimensional Llavors la covariància entre les dues variables és: n

∑ fi · kx i · y i

i =1

N

n

− kx · y =

k · ∑ fi · x i · y i i =1

N

⎞⎟ ⎛ n f ·x ·y ⎜⎜ ∑ i i i ⎟⎟ i =1 ⎜ − kx · y = k ⎜⎜ − x · y ⎟⎟⎟ = k · σ XY ⎟⎠ ⎜⎝ N

Així doncs, el coeficient de correlació és: k · σ XY σ XY = = rXY k · σ X · σY σ X · σY Si multipliquem les dades de les dues variables per la mateixa constant k, llavors el coeficient de correlació és: k 2 · σ XY σ XY = = rXY k · σ X · k · σY σ X · σY I si multipliquem la segona variable per una constant m: k · m · σ XY σ XY = = rXY k · σ X · m · σY σ X · σY 067

Demostra que el coeficient de correlació de dues variables estadístiques no varia si a cada valor de les dues variables els sumem o restem un mateix nombre. Utilitza aquesta propietat per calcular el coeficient de correlació de les variables estadístiques següents. X

2.001

2.002

2.003

2.004

2.005

Y

7.390

7.350

7.240

7.210

7.110

Si sumem un valor c a cada valor d’una variable estadística, llavors la mitjana de les dades obtingudes és: n

∑ fi · (x i + c)

i =1

N

=

n

n

i =1

i =1

∑ fi · x i + ∑ fi · c N

n

=

=

∑ fi · x i + c · N

i =1

N

n

n

i =1

i =1

∑ fi · x i + c · ∑ fi N

=

=x+c

La variància d’aquestes dades verifica que: n

n

∑ fi · (x i + c − ( x + c))2

i =1

N

=

∑ fi · (x i − x )2

i =1

N

= σ2X

Per tant, la desviació típica també coincideix. La covariància entre les dues variables és: n

∑ fi · (x i + c) · y i

i =1

N

n

n

− ( x + c) · y =

∑ fi · x i · y i + ∑ fi · c · y i

i =1

i =1

N

n

=

i =1

N

n

=

570

n

∑ fi · x i · y i + c · ∑ fi · y i

i =1

∑ fi · x i · y i

i =1

N

−x · y−c· y = −x · y−c· y =

+ c · y − x · y − c · y = σ XY


917221Unidad12.qxd

19/1/09

11:11

Página 571

SOLUCIONARI

12

Així doncs, el coeficient de correlació és igual que el de les variables inicials. De la mateixa manera, si sumem o restem un mateix nombre a les dues variables el coeficient no varia. 068

En dos estudis realitzats sobre les dades d’una variable bidimensional, les rectes de regressió van ser les següents. En el primer estudi, la recta de regressió de Y sobre X és: 8x −3y −61 = 0 i la recta de X sobre Y és: x −y + 18 = 0. I en l’altre estudi, les rectes de regressió són, respectivament: 5x −2y −10 = 0 8x −5y + 20 = 0 y = 41 i r = 0,8, comprova quin dels estudis és vàlid. x = 23, ៮ Si coneixem ៮ ⎫ 8x − 3y − 61 = 0⎪ ⎪ ⎬ → x = 23, y = 41 x − y + 18 = 0 ⎪ ⎪ ⎭

⎫ 8x − 5y + 20 = 0⎪ ⎪ ⎬ → x = 10, y = 20 5x − 2y − 10 = 0 ⎪ ⎪ ⎭

y ). El primer estudi és el correcte, ja que les rectes es tallen en el punt (x៮, ៮ 069

Siguin dues variables estadístiques X i Y. Sabem que: • La recta de regressió de Y sobre X passa pels punts (1, 3) i (2, 5). • La recta de regressió de X sobre Y té pendent m = 3 i la seva ordenada a l’origen és 2. • La variància de Y és 3. Calcula les mesures estadístiques de cada una de les variables estadístiques i el coeficient de correlació. La recta que passa pels punts (1, 3) i (2, 5) té com a equació: y = 2x + 1 L’equació de l’altra recta és: y = 3x + 2 2x − y + 1 = 0⎫ ⎪ ⎬ → x = − 1, y = − 1 3x − y + 2 = 0⎪ ⎪ ⎭ ⎧ ⎪ x = −1 Llavors, resulta que: ⎪ ⎨ ⎪ ⎪ ⎩ y = −1 El coeficient de correlació és igual a l’arrel quadrada del producte del pendent de la recta de regressió de Y sobre X per la inversa del pendent de la recta de regressió de X sobre Y: r= Per tant, tenim que: r =

m⋅ 2⋅

1 = m'

σ XY σ XY σ XY ⋅ 2 = 2 σX σY σ X ⋅ σY

1 = 0,8164 3

El sistema d’equacions format per les dues rectes de regressió és: ⎫ ⎪ σ XY = 2⎪ ⎪ 2 ⎪ σX σY2 ⎪ → = 2 ⋅ 3 → σY2 = 6σ2X → σY = 6 σ X ⎬ 2 ⎪ σY2 σ X = 3⎪ ⎪ ⎪ σ XY ⎪ ⎪ ⎭ 1 Com que la variància de Y és 3: σ2X = 2

571


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.