917221Unidad12.qxd
12
19/1/09
11:11
Página 536
Estadística bidimensional
LITERATURA I MATEMÀTIQUES
La caverna Bona tarda, senyor Algor, Bona tarda, senyor, Suposo que imagina per quina raó li truco avui, Suposa bé, senyor, digui’m, Tinc davant meu els resultats i les conclusions del sondeig sobre els seus articles, [...] I aquests resultats quins són, senyor, preguntà Cipriano Algor, Lamento informar-lo que no van ser tan bons com desitjaríem, Si és així ningú no ho lamentarà més que jo, Temo que la seva participació a la vida del nostre Centre ha arribat al final, [...] Vagi prenent nota dels resultats, Digui-me’ls, L’univers dels clients sobre el qual incidiria el sondeig quedà definit des del principi per l’exclusió de les persones que per edat, posició social, educació i cultura, i també pels seus hàbits coneguts de consum, fossin previsiblement i radicalment contràries a l’adquisició d’articles d’aquesta mena, és bo que sàpiga que si vam prendre aquesta decisió, senyor Algor, va ser per no perjudicar-lo d’entrada, Moltes gràcies, senyor, Li poso un exemple, si haguéssim seleccionat cinquanta joves moderns, cinquanta nois i noies del nostre temps, pot tenir la certesa, senyor Algor, que cap voldria endur-se a casa un dels seus ninots, o si se l’endugués seria per emprar-lo en alguna cosa així com el tir al blanc, Ho entenc, Escollírem vint-i-cinc persones de cada sexe, de professions i ingressos mitjans, persones amb antecedents familiars modestos, encara aferrades a gustos tradicionals, a les cases dels quals la rusticitat del producte no desentonaria massa, I fins i tot així, És veritat, senyor Algor, fins i tot així els resultats foren dolents, Què hi farem, seyor, Vint homes i deu dones respongueren que no els agradaven els ninots de fang, quatre dones digueren que potser els comprarien si fossin més grans, tres podrien comprar-los si fossin més petits, dels cinc homes que quedaven, quatre digueren que ja no tenien edat de jugar i un altre protestà pel fet que tres de les figuretes representessin estrangers, a sobre exòtics, i pel que fa a les vuit dones que encara no hem esmentat, dues es declararen al·lèrgiques al fang, quatre tenien mals records d’aquesta classe d’objectes, i només les dues últimes respongueren agraint molt la possibilitat que els havia estat proporcionada de decorar gratuïtament casa seva amb uns ninotets tan simpàtics, hem d’afegir que es tracta de persones grans que viuen soles, M’agradaria saber els noms i les adreces d’aquestes senyores per donar-los les gràcies, digué Cipriano Algor, Ho lamento, però no estic autoritzat a revelar dades personals dels enquestats, és una condició estricta de qualsevol sondeig d’aquest tipus, respectar l’anonimat de les respostes. [...] Bona tarda, Bona tarda. JOSÉ SARAMAGO (text adaptat)
Resumeix les dades en una taula de freqüències i representa-les en un gràfic estadístic. Pots calcular alguna mesura de centralització?
S’ha triat una mostra de 50 persones amb característiques personals i professionals semblants. No els agraden els ninots (1)
fi
Y
30
Els comprarien si fossin més grans (2)
4
Els comprarien si fossin més petits (3)
3
No tenen edat per jugar (4)
4
Protesten per figuretes d’estrangers (5)
1
Al·lèrgiques al fang (6)
2
Mals records (7)
4
Agraïdes perquè siguin gratuïtes (8)
2
Freqüències
Respostes
25
5 (1)
(2)
(3)
(4) (5) (6) Respostes
(7)
(8)
No és possible calcular cap mesura de centralització perquè la variable no és quantitativa.
536
X
917221Unidad12.qxd
19/1/09
11:11
Página 537
SOLUCIONARI
12
ABANS DE COMENÇAR... RECORDA 001
En una revista llegim que el pastor alemany té una alçada mitjana de 55 cm. Creus que han mesurat tots els pastors alemanys del planeta? Explica com creus que han arribat a aquesta conclusió. No els han mesurat. Es tria una mostra representativa de la població de pastors alemanys i s’estudia el valor de la mitjana en aquesta mostra.
002
Indica el tipus de variable estadística que estudiem. a) El programa preferit de la teva família. b) El nombre de peu dels alumnes d’un IES. c) La temperatura mitjana diària de la teva província. d) L’edat dels habitants d’un país. e) El sexe dels habitants d’un poble. f ) Els diners que gasten setmanalment els teus amics. g) Els efectes en l’ésser humà d’un nou medicament. h) El color del cabell dels teus companys de classe. a) b) c) d) e) f) g) h)
003
Qualitativa. Quantitativa discreta. Quantitativa contínua. Quantitativa discreta. Qualitativa. Quantitativa discreta. Qualitativa. Qualitativa.
El nombre d’hores diàries d’estudi de 30 alumnes és: 3 4 3 5 5 1 1 1 1 2 3 4 5 0 2 0 3 2 2 1 2 1 3 2 0 1 2 1 4 3 a) Organitza els resultats en una taula de freqüències. b) Què signifiquen les freqüències acumulades? a)
Hores
fi
hi
Fi
Hi
0
3
0,1
3
0,1
1
8
0,27
11
0,37
2
7
0,23
18
0,6
3
6
0,2
24
0,8
4
3
0,1
27
0,9
5
3
0,1
30
1
N = 30
∑ hi = 1
b) Les freqüències acumulades indiquen el nombre d’alumnes que estudien com a màxim el nombre d’hores corresponent. Per exemple, la freqüència acumulada per al valor 2 és 18, és a dir, hi ha 18 alumnes que estudien 0, 1 o 2 hores.
537
917221Unidad12.qxd
19/1/09
11:11
Página 538
Estadística bidimensional 004
Dels 30 assistents a un sopar, el 20% va menjar vedella, el 40% xai i la resta va demanar peix. Indica la variable estadística i organitza els resultats en una taula de freqüències; després, representa les dades en un diagrama de sectors. La variable estadística és el plat triat al sopar. Vedella
Plat
fi
hi
Fi
Hi
Vedella
6
0,2
6
0,2
Xai
12
0,4
18
0,6
Peix
12
0,4
30
1
Peix
N = 30 ∑ h i = 1 Xai
ACTIVITATS 001
Posa dos exemples de variables estadístiques unidimensionals. Resposta oberta. Per exemple: la qualificació dels alumnes d’una classe en un examen i l’alçada dels membres d’un equip de bàsquet.
002
Organitza aquestes dades en una taula de freqüències absolutes i relatives. 0 0 1 3
003
5 6 4 6
1 2 7 8
1 2 1 2
4 3 7 8
4 6 5 6
xi
fi
hi
Fi
Hi
0
2
0,08
2
0,08
1
4
0,17
6
0,25
2
3
0,13
9
0,38
3
2
0,08
11
0,46
4
3
0,13
14
0,59
5
2
0,08
16
0,67
6
4
0,17
20
0,84
7
2
0,08
22
0,92
8
2
0,08
24
1,92
N = 24
∑ hi = 1
La taula mostra l’alçada, en centímetres, d’un grup de persones. Alçada (cm) Nre. de persones
[165, 175)
[175, 185)
[185, 195)
40
85
25
a) Elabora una taula de freqüències. b) Quin percentatge de persones mesuren entre 165 cm i 175 cm? I menys de 185 cm?
538
917221Unidad12.qxd
19/1/09
11:11
Página 539
SOLUCIONARI
a)
Alçada
xi
fi
hi
Fi
Hi
[165, 175)
170
40
[175, 185)
180
85
0,27
40
0,27
0,57
125
0,83
[185, 195)
190
25
0,17
150
1
N = 150
∑ hi = 1
12
b) El percentatge de persones que mesuren entre 165 cm i 175 cm és del 27 %. I el percentatge de persones que mesuren menys de 185 cm és del 83 %.
004
A partir de les dades, elabora la taula de freqüències, i calcula les mesures de centralització. 23 10 25 12
13 24 17 22
16 20 26 23
22 13 21 18
16 19 14 17
11 17 15 26
xi
fi
hi
Fi
Hi
10
1
0,04
1
0,04
11
1
0,04
2
0,08
12
1
0,04
3
0,13
13
2
0,08
5
0,21
14
1
0,04
6
0,25
15
1
0,04
7
0,29
16
2
0,08
9
0,38
17
3
0,13
12
0,5
18
1
0,04
13
0,54
19
1
0,04
14
0,58
20
1
0,04
15
0,63
21
1
0,04
16
0,67
22
2
0,08
18
0,75
23
2
0,08
20
0,83
24
1
0,04
21
0,88
25
1
0,04
22
0,92
26
2
0,08
24
1
N = 24
∑ hi = 1
x =
440 = 18,33 → El valor mitjà és 18,33. 24
Mo = 17 → El valor més freqüent és 17. Me =
17 + 18 = 17,5 2
Hi ha tants valors més petits que 17,5 com més grans.
539
917221Unidad12.qxd
19/1/09
11:11
Página 540
Estadística bidimensional 005
Troba i interpreta les mesures de centralització corresponents a les dades d’aquesta taula. Pes (kg)
[50, 65)
[65, 80)
[80, 95)
75
140
80
Nre. de persones Pes
xi
fi
hi
[50, 65)
57,5
75
75
[65, 80)
72,5
140
215
[80, 95)
87,5
80
295
N = 295
x =
21.462, 5 = 72,75 295
El pes mitjà és de 72,75 kg. L’interval modal és [65, 80); la seva marca de classe: 72,5 és la moda. El més freqüent és que el pes estigui comprès entre 65 kg i 80 kg. L’interval mitjà és [65, 80); la seva marca de classe: 72,5 és la mitjana. Hi ha tantes persones que pesen menys de 72,5 kg com persones que pesen més. 006
Calcula les mesures de dispersió per a aquestes dades. Classes
[5, 15)
[15, 25)
[25, 35)
[35, 45)
35
15
25
45
Freqüències Classes
xi
fi
| xi − x|
(xi − x )2
[5, 15)
10
35
16,67
277,89
[15, 25)
20
15
6,67
44,49
[25, 35)
30
25
3,33
11,09
[35, 45)
40
45
13,33
177,69
N = 120
x =
3.200 = 26,67 120
Rang: R = 45 − 5 = 40 Desviació mitjana: DM = Variància: σ2 =
1.366, 6 = 11,39 120
18.666, 8 = 155,56 120
Desviació típica: σ = 12,47 Coeficient de variació: CV =
540
12, 47 = 0,47 26, 67
917221Unidad12.qxd
19/1/09
11:11
Página 541
SOLUCIONARI
007
12
Compara les edats, en anys, dels jugadors d’aquests equips de bàsquet, utilitzant les mesures estadístiques. A: 18
26
20
26
22
26
23
27
25
25
B: 20
21
20
21
22
23
23
24
25
25
xA =
238 = 23,8 10
σA =
79, 6 = 7,96 10
σA = 2,82
xB =
224 = 22,4 10
σB2 =
32, 4 = 3,24 10
σB = 1,8
2, 82 = 0,12 23, 8 1, 8 CVB = = 0,08 22, 4
CVA =
La mitjana de les edats de l’equip A és superior, però també és més gran el coeficient de variació d’aquest equip, i per tant hi ha més diferències entre els seus jugadors.
008
Considera aquestes variables bidimensionals, i escriu-ne les variables unidimensionals corresponents i tres parells de valors que les determinen. a) Edat i sexe dels assistentes a un concert. b) Mida d’un arxiu informàtic i temps que es triga a copiar-lo. a) X → Edat, en anys, dels assistents al concert Y → Sexe dels assistents (20, dona)
(25, home)
(28, dona)
b) X → Mida, en kb, de l’arxiu informàtic Y → Temps, en s, que es tarda a copiar-lo (220, 35)
009
(158, 24)
(285, 42)
Ordena aquestes dades en una taula de doble entrada.
X
X
Y
X
Y
0
18
1
14
0
12
2
23
2
8
1
17
0
1
2
Total
8
0
0
1
1
12
1
0
0
1
14
0
1
0
1
17
0
1
0
1
18
1
0
0
1
23
0
0
1
1
Total
2
2
2
6
Y
541
917221Unidad12.qxd
19/1/09
11:11
Página 542
Estadística bidimensional 010
Construeix la taula de doble entrada i les taules marginals corresponents. X
16
17
18
16
14
17
14
13
14
15
Y
5
4
6
6
8
3
5
4
8
8
X
13
Y
14
15
16
17
18
Total
3
0
0
0
0
1
0
1
4
1
0
0
0
1
0
2
5
0
1
0
1
0
0
2
6
0
0
0
1
0
1
2
8
0
2
1
0
0
0
3
Total
1
3
1
2
2
1
10
Taula de freqüències marginals de X
011
Taula de freqüències marginals de Y
xi
fi
yi
fi
13
1
3
1
14
3
4
2
15
1
5
2
16
2
6
2
17
2
8
3
18
1
Total
10
Total
10
Determina la covariància per a les dades de la taula següent. X
8
10
11
9
13
12
9
14
Y
20
18
16
22
10
10
21
9
86 = 10,75 8 126 = 15,75 y = 8 1.279 − 10,75 ⋅ 15,75 = −9,44 σXY = 8
x =
012
542
Representa el núvol de punts corresponent a aquesta variable estadística bidimensional. X
1
1
3
5
2
4
5
2
5
2
4
3
2
1
1
Y
4
5
2
5
5
4
5
3
6
5
1
2
8
6
3
917221Unidad12.qxd
19/1/09
11:11
Página 543
SOLUCIONARI
12
Y
1 X
1
013
Indica la dependència entre aquestes variables. Y
X
Dependència lineal dèbil i positiva. 014
Descriu el grau de correlació entre les dues variables representades.
Y
La correlació lineal és dèbil i negativa. 015
X
Si el signe de la covariància entre dues variables és negativa, què podem dir del signe del coeficient de correlació? I si la covariància és positiva? Si la covariància és negativa, el coeficient de correlació és negatiu. I si la covariància és positiva, el coeficient de correlació també és positiu.
016
Representa el diagrama de dispersió i troba el coeficient de correlació d’aquesta variable. Y X
39 43 40 40 42 41 42 38 39 44
195
Y 167 184 177 168 185 173 180 164 170 194 185
Quina relació hi pots descriure?
175
408 = 40,8 x = 10
1.762 y = = 176,2 10
σX =
3, 36 = 1,83
σY =
σXY =
72.046 13, 6 − 40,8 ⋅ 176,25 = 13,6 rXY = = 0,82 10 1, 83 · 9, 05
81, 96 = 9,05
165 38
40
42
44
46
48
X
543
917221Unidad12.qxd
19/1/09
11:11
Página 544
Estadística bidimensional 017
Raona quin valor tindrà el coeficient de correlació. a)
b)
Y
Y
X
X
a) El coeficient de correlació prendrà un valor relativament pròxim a −1, perquè el núvol de punts s’aproxima bastant a una recta amb pendent negatiu i la correlació és forta. b) El coeficient de correlació és 1, ja que el núvol de punts coincideix amb una recta de pendent positiu.
018
Troba la recta de regressió de Y sobre X.
30 =6 5 30 =6 σX2 = 5
X
2
5
6
8
9
Y
4
13
16
22
25
80 = 16 5 570 σXY = − 6 ⋅ 16 = 18 5
x =
y =
Recta de regressió de Y sobre X: y − 16 =
019
18 (x − 6) → y = 3x − 2 6
Determina la recta de regressió corresponent. X
39
40
40
42
43
Y
167 168 180 164 177 154 185 195 183 172
407 = 40,7 10 16.599 − 40,72 = 3,41 σX2 = 10
38
42
40
y =
Recta de regressió de Y sobre X: y − 174,5 =
12, 35 (x − 40,7) → y = 3,62x + 27,17 3, 41
Determina les dues rectes de regressió i indica la relació que hi ha entre les variables. a)
b)
544
44
1.745 = 174,5 10 71.145 σXY = − 40,7 ⋅ 174,5 = 12,35 10
x =
020
39
X
10
10
13
15
12
Y
6
5
2
3
5
X
8
10
11
12
16
13
12
17
13
13
Y
15
10
15
10
20
15
10
25
10
15
917221Unidad12.qxd
19/1/09
11:11
Página 545
SOLUCIONARI
a) x = σX2 =
60 = 12 5
y =
738 − 122 = 3,6 5
σXY =
21 = 4,2 5
Recta de regressió de Y sobre X: y − 4,2 = − σX2 =
σX = 3, 6 = 1,89 rXY = −
σX2 =
σY =
125 = 12,5 10
y =
1.625 − 12,52 = 6,25 10
σXY =
145 = 14,5 10 1.890 − 12,5 ⋅ 14,5 = 7,75 10
7, 75 (x − 12,5) → y = 1,24x − 1 6, 25
2.325 − 14,52 = 22,25 10
σX = 6, 25 = 2,5
021
2,16 = 1,47
2, 2 = −0,79 → La dependència és dèbil i negativa. 1, 89 · 1, 47
Recta de regressió de X sobre Y: x − 12,5 =
rXY =
2, 2 (x − 12) → y = −0,61x + 11,52 3, 6
2, 2 (y − 4,2) → x = −1,02y + 16,28 2,16
Recta de regressió de Y sobre X: y − 14,5 = σX2 =
241 − 12 ⋅ 4,2 = −2,2 5
99 − 4,22 = 2,16 5
Recta de regressió de X sobre Y: x − 12 = −
x = b)
12
7, 75 (y − 14,5) → x = 0,35y + 7,43 22, 25
σY =
22, 25 = 4,72
7, 75 = 0,66 → La dependència és dèbil i positiva. 2, 5 · 4, 72
Raona quin és el grau de dependència entre les variables en cada cas. a)
b)
Y
Y
X
X
a) La dependència és forta i negativa. b) La dependència és dèbil i negativa.
545
917221Unidad12.qxd
19/1/09
11:11
Página 546
Estadística bidimensional 022
En un estudi sobre els ingressos mensuals, X, i la superfície dels habitatges, Y, resulta: y = 0,02x + 47,96. a) Troba l’estimació de la superfície de l’habitatge d’una família amb uns ingressos mensuals de 3.200 €. b) Si una família viu en una casa de 90 m2, quins ingressos mensuals tindrà? a) y = 0,02 ⋅ 3.200 + 47,96 = 111,96 m2 b) 0,02x + 47,96 = 90 → x = 2.102 €
023
En un estudi estadístic, el coeficient de correlació entre dues variables X i Y és −0,8. Se sap que x = 20; σX = 4; y = 8 i σY = 1. a) Determina les dues rectes de regressió, representa-les i analitza la correlació que hi ha entre les variables. b) Si x = 30, quina és l’estimació de y? σ XY → σXY = −3,2 4 ⋅1 3, 2 (x − 20) → y = −0,2x + 12 Recta de regressió de Y sobre X: y − 8 = − 16 3, 2 Recta de regressió de X sobre Y: x − 20 = − (y − 8) → x = −3,2y + 45,6 1
a) −0,8 =
Y
2 X
2
La dependència és forta i negativa. b) y = −0,2 ⋅ 30 + 12 = 6 024
Utilitza la calculadora per determinar totes les mesures estadístiques. a)
b)
X
2
4
2
3
5
1
4
5
1
3
4
2
1
3
4
Y
5
8
8
7
6
5
9
6
7
7
8
9
5
6
5
X 24 27 22 23 24 26 27 28 22 23 Y
2
1
2
4
a) x = 2,93 σX2 = 1,82 σX = 1,35 σXY = 0,35 rXY = 0,19
546
5
2
3
4
1
y = 6,73 σY2 = 1,97 σY = 1,4
2
x = 24,6 b) σX2 = 4,44 σX = 2,11 σXY = 0,44 rXY = 0,16
y = 2,6 σY2 = 1,64 σY = 1,28
917221Unidad12.qxd
19/1/09
11:11
Página 547
SOLUCIONARI
025
12
Estudia la correlació entre aquestes variables, i utilitza la calculadora per efectuar les operacions. X
14 16 17 14 15 12 13 13 14 16
Y
32 34 36 34 32 34 31 36 38 32
Determina la recta de regressió i raona si té sentit estimar el valor de Y si la variable X pren el valor 18. x = 14,4 σX2 = 2,24 σX = 2,11 σXY = 0,14 rXY = 0,03
y = 33,9 σY2 = 4,49 σY = 2,12
Recta de regressió de Y sobre X: y − 33,9 =
0,14 (x − 14,4) → y = 0,06x + 33 2, 24
Com que la correlació és quasi nul·la, no té sentit fer l’estimació del valor de y per a x = 18. 026
Representa el núvol de punts associat a les distribucions bidimensionals següents. a) (2, 2)
(3, 6)
(5, 10)
(6, 14)
(8, 19)
(9, 23)
(10, 25)
b) (5, 2)
(6, 0)
(8, −2)
(10, −7)
(11, −9)
(13, −13)
(15, −17)
c) (120, 60)
(122, 75)
(126, 60) (128, 90)
(130, 50)
(132, 100) (136, 70)
d) (7, 3)
(8, 9)
(9, 2)
(11, 5)
(12, 1)
(10, 8)
(13, 7)
Decideix si hi ha dependència entre les variables i de quin tipus és. a)
c)
Y
20
100
4
20 1
b)
Y
10
X
120
d)
Y
130
160 X
Y
2 2
X
1 6
X
547
917221Unidad12.qxd
19/1/09
11:11
Página 548
Estadística bidimensional 027
Representa el núvol de punts associat a aquestes variables bidimensionals, i decideix si hi ha dependència entre les variables que les formen. En cas afirmatiu, digues de quina classe és. a)
b)
A
6
8
9
B
8
13 13 16 21 26 28 33
C
1
3
D
25 21 18 20 12 15
6
11 13 15 16 18
7
10 13 17 18 8
c)
E 110 112 115 116 118 120 121 124
d)
6
a) La dependència és forta i positiva.
F
40 45 35 40 60 70 45 33
G
26 24 23 22 18 15 14 12
H
8
12 14
7
10 11
9
B 25
5
b) La dependència és forta i negativa.
2
10
20
A
2
10
20
C
D 25
5
c) No s’aprecia dependència entre les variables E i F.
F
50
10
d) No s’aprecia dependència entre les variables G i H.
110
120
E
10
20
G
H
12
6
548
13
917221Unidad12.qxd
19/1/09
11:11
Página 549
SOLUCIONARI
028
12
A partir dels diagrames de dispersió, decideix si hi ha o no dependència lineal i, si n’hi ha, si és forta o dèbil, i si és positiva o negativa. a)
c)
Y
Y
X
b)
X
Y
Y
d)
X
X
a) No hi ha dependència lineal. b) La dependència lineal és forta i negativa. c) La dependència lineal és dèbil i positiva. d) La dependència lineal és forta i positiva.
029
Representa els núvols de punts corresponents a les variables bidimensionals definides per aquestes fórmules. a) y = 2x + 5 b) y = x2 + 3x Quin tipus de dependència presenten? a)
b)
Y
2
Y
2 2
La dependència és lineal.
X
2
X
La dependència és funcional.
549
917221Unidad12.qxd
19/1/09
11:11
Página 550
Estadística bidimensional 030
A la taula hi ha el nombre de quadres que han pintat els alumnes d’un taller sobre paisatges i natures mortes. Paisatges
4
5
6
7
8
4
2
1
0
0
0
5
4
4
3
0
1
6
2
5
4
2
0
8
0
0
3
2
1
Natures mortes
a) Determina les taules de freqüències marginals de paisatges i natures mortes. b) Calcula les mitjanes i les desviacions típiques de cada una de les variables. c) A partir del coeficient de variació, decideix quina de les dues variables és més dispersa. d) Fes el diagrama de dispersió corresponent a la variable bidimensional. a) Taula de freqüències marginals dels paisatges
Taula de freqüències marginals de les natures mortes
xi
fi
yi
fi
4
8
4
3
5
10
5
12
6
10
6
13
7
4
8
6
8
2
Total
34
Total
34
b) x = 5,47 σX = 1,15
y = 5,82 σY = 1,19
c) CVX = 0,21 CVY = 0,204 La variable dels paisatges és una mica més dispersa que la de les natures mortes. d)
Y
1 1
550
X
917221Unidad12.qxd
19/1/09
11:11
Página 551
SOLUCIONARI
031
12
Y
Construeix la taula de doble entrada que correspon a aquesta variable bidimensional, representada mitjançant un diagrama de dispersió.
1 1
X
2
3
4
5
6
7
8
9
10
12
Total
1
0
0
0
0
0
0
0
0
1
0
1
3
0
0
0
0
0
0
1
0
0
0
1
4
0
0
0
0
0
1
0
1
1
1
4
5
0
0
0
1
0
0
1
0
0
0
2
6
0
1
0
0
1
0
0
1
0
0
3
7
0
0
0
1
0
0
0
0
0
0
1
8
1
0
1
0
0
0
0
0
0
0
2
9
1
0
0
0
0
0
0
0
0
0
1
Total
2
1
1
2
1
1
2
2
2
1
15
Y
032
X
A partir d’aquest diagrama de dispersió, elabora la taula de doble entrada corresponent.
Y
1
1
X
3
4
5
6
7
8
9
10
Total
1
0
1
0
0
0
0
0
0
1
3
0
0
0
1
0
0
0
0
1
4
0
0
0
0
1
0
0
0
1
5
0
0
1
1
0
1
0
0
3
6
1
0
0
1
0
0
1
0
3
7
0
0
1
0
0
1
1
1
4
9
0
0
0
0
0
0
1
0
1
10
0
0
0
0
0
0
0
1
1
Total
1
1
2
3
1
2
3
2
15
Y
X
551
917221Unidad12.qxd
19/1/09
11:11
Página 552
Estadística bidimensional 033
Construeix la taula de doble entrada corresponent, a partir del diagrama de dispersió, tenint en compte la freqüència de les dades que hi ha entre parèntesis. Y 8
X
1
2
3
4
5
Total
2
0
9
0
6
0
15
4
9
0
3
0
0
12
6
0
0
3
0
0
3
7
0
0
0
0
12
12
Total
9
9
6
6
12
42
Y (3)
6 4
(12)
(3) (9)
2
(6)
(9) 1
034
2
5
X
P
0
1
2
3
4
5
6
7
Q
20
18
17
15
12
10
7
4
R
90
80
70
60
50
40
30
S
−5
−7
−8
−11
−13
−16
−17
rPQ = −0,11
σRS = 84,29
rRS = 0,99
Troba la covariància i el coeficient de correlació corresponents a aquestes variables estadístiques. T
−12
−14
−15
−16
−18
−20
−22
U
8
5
3
12
20
10
6
V
2,4
2,8
3,2
3,6
4
4,4
4,8
5,2
W
100
150
220
270
340
400
460
520
σTU = −3,69 036
4
Calcula la covariància i el coeficient de correlació per a les variables bidimensionals indicades a les taules següents.
σPQ = −7,22 035
3
rTU = −0,22
σVW = 127,5
rVW = 0,99
Representa la variable bidimensional els parells de valors dels quals són: (8, 2)
(12, 6)
(10, 4)
(12, 2)
(8, 6)
a) Calcula’n la covariància i raona el resultat. b) Elimina un punt de manera que la correlació es mantingui. a) σXY = 0 No hi ha dependència entre les variables, per tant, la covariància és nul·la. b) Quan s’elimina el punt (10, 4), la correlació no varia.
Y
1 6
552
X
917221Unidad12.qxd
19/1/09
11:11
Página 553
SOLUCIONARI
037
12
Dibuixa el diagrama de dispersió corresponent a la variable bidimensional determinada pels parells de dades: (10, 20)
(16, 30)
(10, 30)
(16, 20)
a) Calcula’n la covariància i explica a què és degut aquest resultat. b) Afegeix un punt de manera Y que la correlació es mantingui. a) σXY = 0 No hi ha dependència entre les variables, per tant, la covariància és nul·la.
25
5
b) Quan s’hi afegeix el punt (13, 15), la correlació no varia. 038
2
20
10
X
A la taula es presenten dades climatològiques referides a una ciutat: la temperatura, en °C; la humitat relativa de l’aire, en %, i la velocitat del vent, en km/h. Dies
Dl.
Dt.
Dc.
Dj.
Dv.
Ds.
Dg.
Temperatura
22
24
25
24
23
21
20
Humitat
78
90
80
92
88
74
80
Velocitat del vent
1
3
6
4
4
1
0
Determina la covariància i el coeficient de correlació de les variables bidimensionals següents: a) Temperatura–Humitat. b) Temperatura–Velocitat del vent. c) Humitat–Velocitat del vent. a) σTH = 6,46 b) σTV = 3,17 c) σHV = 6,404 039
rTH = 0,59 rTV = 0,93 rHV = 0,507
S’ha fet una enquesta a persones que han tingut un accident de tràfic, i se’ls ha preguntat el nombre de mesos transcorreguts i l’edat. Les respostes han estat: Carme, 35: [60, 70) Teresa, 15: [50, 60) Pilar, 12: [50, 60) Maria, 6: [20, 30) Joan, 8: [40, 50) Jordi, 15: [30, 40)
Jaume, 24: [50, 60) Marta, 12: [30, 40) Josep, 28: [40, 50) Andreu, 3: [20, 30) Montserrat, 20: [40, 50) Núria, 16: [30, 40)
a) Elabora la taula corresponent a la variable bidimensional. b) Representa el diagrama de dispersió. c) Estudia si hi ha correlació entre les dues variables, i determina’n el coeficient de correlació lineal.
553
917221Unidad12.qxd
19/1/09
11:11
Página 554
Estadística bidimensional a)
X Y [20, 30)
3
6
8
12
15
16
20
24
28
35
Total
1
1
0
0
0
0
0
0
0
0
2
[30, 40)
0
0
0
1
1
1
0
0
0
0
3
[40, 50)
0
0
1
0
0
0
1
0
1
0
3
[50, 60)
0
0
0
1
1
0
0
1
0
0
3
[60, 70)
0
0
0
0
0
0
0
0
0
1
1
Total
1
1
1
2
2
1
1
1
1
1
12
c) σXY = 89,5 rXY = 0,73
b) La correlació és dèbil i positiva. Y 50
10 3
040
X
30
15
A la taula següent s’han perdut dues dades. x1
23
24
25
27
28
29
33
34
36
2
4
3
5
y5
6
7
9
6
8
Se sap que la mitjana de la primera variable és 28 i que la mitjana de la segona variable és 5,8. Completa la taula i determina el coeficient de correlació. x = 28 → rXY = 0,802 041
x1 + 259 = 28 → x1 = 21 10
y = 5,8 →
y 5 + 50 = 5,8 → y5 = 8 10
S’està estudiant imposar un impost a les empreses químiques que sigui proporcional a les seves emissions de sofre a l’atmosfera. S’ha experimentat amb diversos procediments per mesurar les emissions, però no se n’ha trobat cap de fiable. Finalment, s’ha decidit investigar algun mètode indirecte. Es creu que l’emissió de sofre pot estar relacionada amb el consum elèctric, amb el consum d’aigua o amb el volum de les xemeneies de les fàbriques. Per valorar-ho s’ha dut a terme un estudi en un medi controlat. Els resultats es poden veure a la taula. Quantitat de sofre (t)
2,3
Consum elèctric (kWh)
1,8
1
0,4
0,6
3
0,5
1.400 1.250 1.850 600 300 3.400 400
Consum d’aigua (l) 3
Volum de les xemeneies (m )
100
230
45
50
10
540
22
18
16
12
5
6
21
4
Quina de les mesures estadístiques es relaciona de manera més evident amb les emissions de sofre? Justifica la resposta.
554
917221Unidad12.qxd
19/1/09
11:11
Página 555
SOLUCIONARI
12
El volum de les xemeneies és la variable que es relaciona més amb la quantitat d’emissions de sofre. Y
Y
Y
2.500
500
500
100
100
1.500 500 1
042
2
3
X
1
2
3
X
1
3
X
Traça a mà alçada, i sense fer càlculs, la recta de regressió de les variables bidimensionals següents. a)
b)
Y
Y
X
a)
X
b)
Y
Y
X
043
2
X
Representa, sense trobar-ne l’equació, la recta de regressió corresponent a aquestes variables. a)
b)
Y
X
Y
X
555
917221Unidad12.qxd
19/1/09
11:11
Página 556
Estadística bidimensional a)
b)
Y
X
044
X
Per a les variables bidimensionals representades a continuació, hem ajustat diferents rectes de regressió als núvols de punts corresponents. Estima el valor que tindrà y en cada una de les rectes per a un valor de x = 12. a)
Y y = 1,99x − 0,04
5 X
5
b)
Y y = −1,33x + 29,25
5 X
5
c)
Y
y = 0,35x + 13,67
5 5
X
Quina de les estimacions et sembla més fiable? a) y = 1,99 ⋅ 12 − 0,04 = 23,84 b) y = −1,83 ⋅ 12 + 29,25 = 7,29 c) y = 0,35 ⋅ 12 + 13,67 = 17,87 L’estimació més fiable és la de l’apartat a).
556
Y
917221Unidad12.qxd
19/1/09
11:11
Página 557
SOLUCIONARI
045
12
Determina la recta de regressió de Y sobre X i la recta de regressió de X sobre Y corresponents a aquestes taules. a) X 10 11 12 13 14 15 16 17 b)
c)
d)
Y
20
24
28
30
36
32
42
X
60
70
80
90
100
110
120
Y
−5
−8
−12
−15
−16
−24
−20
X
−3
−4
−5
−6
−9
−10
−13
Y
80
92
100
88
76
70
60
X
0,2
0,4
0,5
0,7
0,8
0,9
1
1,2
Y
40
50
120
70
40
40
60
50
a) x = 13,5 σX2 = 5,25
y = 31,5 σY2 = 50,75
40
σXY = 15,5
Recta de regressió de Y sobre X: 15, 5 y − 31,5 = (x − 13,5) → y = 2,95x − 8,33 5, 25 Recta de regressió de X sobre Y: 15, 5 x − 13,5 = (y − 31,5) → x = 0,31y + 3,74 50, 75 b) y = −14,29 σXY = −115,33 x = 90 σX2 = 400 σY2 = 37,22 Recta de regressió de Y sobre X: 115, 33 y + 14,29 = − (x − 90) → y = −0,29x + 11,81 400 Recta de regressió de X sobre Y: 115, 33 x − 90 = − (y + 14,29) → x = −3,099y + 45,72 37, 22 c) x = −7,14 y = 80,86 σXY = 34,48 2 σX = 11,31 σY2 = 159,37 Recta de regressió de Y sobre X: 34, 48 y − 80,86 = (x + 7,14) → y = 3,049x + 102,63 11, 31 Recta de regressió de X sobre Y: 34, 48 x + 7,14 = (y − 80,86) → x = 0,22y − 24,93 159, 37 d) y = 58,75 σXY = −1,088 x = 0,71 σY2 = 635,94 σX2 = 0,099 Recta de regressió de Y sobre X: 1, 088 y − 58,75 = − (x − 0,71) → y = −10,99x + 66,55 0, 099 Recta de regressió de X sobre Y: 1, 088 x − 0,71 = − (y − 58,75) → x = −0,0017y + 0,81 635, 94
557
917221Unidad12.qxd
19/1/09
11:11
Página 558
Estadística bidimensional 046
Troba cinc punts que pertanyin a la recta y = 4x + 6. a) Calcula el coeficient de correlació corresponent i explica el resultat. b) Troba les dues rectes de regressió. Resposta oberta. x
−2
−1
0
1
2
y
−2
2
6
10
14
a) x =0
y =6
σX =
2 = 1,41
σY =
32 = 5,66
σXY = 8
rXY = 1 → La dependència és lineal. b) Recta de regressió de Y sobre X: y−6=
8 (x − 0) → y = 4x + 6 2
Recta de regressió de X sobre Y: x−0=
047
8 1 3 (y − 6) → x = y − 32 4 2
Troba cinc punts que pertanyin a la recta. y = −20x + 10 a) Calcula el coeficient de correlació i explica el resultat. b) Troba les dues rectes de regressió. Raona els resultats obtinguts. Resposta oberta. x
−2
−1
0
1
2
y
50
30
10
−10
−30
x =0 a)
y = 10
σX =
2 = 1,41
σY =
rXY = −1 → La dependència és lineal. b) Recta de regressió de Y sobre X: y − 10 = −
40 (x − 0) → y = −20x + 10 2
Recta de regressió de X sobre Y: x−0=−
558
40 1 1 (y − 10) → x = − y + 800 20 2
800 = 28,28
σXY = −40
917221Unidad12.qxd
19/1/09
11:11
Página 559
SOLUCIONARI
048
12
Es creu que el nombre de guineus en una finca està relacionat amb el nombre de conills. En els últims anys s’han fet vuit censos de tots dos animals, i n’han resultat aquestes dades: Nre. de guineus
20
32
16
18
25
30
14
15
Nre. de conills
320 500 260 300 400 470 210 240
Si la correlació és forta: a) b) c) d)
Determina les dues rectes de regressió. Estima la quantitat de conills que hi hauria si hi hagués 10 guineus. Quantes guineus hi hauria si haguéssim comptat 350 conills? Quina de les dues estimacions és més fiable? a) x = 21,25 σXY = 653,13
y = 337,5
σX =
42,19 = 6,5
σY = 10.168, 75 = 100,84
rXY = 0,99 → La dependència és forta i positiva.
Recta de regressió de Y sobre X: 653,13 y − 337,5 = (x − 21,25) → y = 15,48x + 8,55 42,19 Recta de regressió de X sobre Y: 653,13 x − 21,25 = (y − 337,5) → x = 0,064y − 0,35 10.168, 75 b) x = 10 → y = 15,48 ⋅ 10 + 8,55 = 163,35 En aquest cas hi hauria 163 conills. c) y = 350 → x = 0,064 ⋅ 350 − 0,35 = 22,05 En aquest cas serien 22 guineus. d) Com que el coeficient de correlació és molt pròxim a 1, les dues estimacions són força fiables. 049
Al llarg d’un dia s’ha mesurat la tensió i el pols cardíac d’una persona, per mirar de decidir si les dues variables tenen alguna relació. Les dades obtingudes es reflecteixen a la taula: Nivell mínim de tensió
6
5
9
4
10
8
6
9
Nre. de pulsacions per minut
60
55
80
40
95
75
55
90
a) Calcula la covariància, el coeficient de correlació i les dues rectes de regressió. b) Si la correlació és forta, estima les pulsacions que tindrà la persona quan tingui un nivell mínim de tensió de 15. c) Quin nivell mínim de tensió s’estima quan les pulsacions cardíaques per minut són 70? d) Quina de les dues estimacions és més fiable? e) Dibuixa el núvol de punts i la recta de regressió corresponents.
559
917221Unidad12.qxd
19/1/09
11:11
Página 560
Estadística bidimensional a) x = 7,13 σXY = 35,44
y = 68,75
σX =
4, 04 = 2,01
σY =
323, 44 = 17,98
rXY = 0,98 → La dependència és forta i positiva.
Recta de regressió de Y sobre X: 35, 44 y − 68,75 = (x − 7,13) → y = 8,77x + 6,22 4, 04 Recta de regressió de X sobre Y: 35, 44 x − 7,13 = (y − 68,75) → x = 0,11y − 0,43 323, 44 b) x = 15 → y = 8,77 ⋅ 15 + 6,22 = 137,77 En aquest cas tindria 138 pulsacions per minut. c) y = 70 → x = 0,11 ⋅ 70 − 0,43 = 7,27 S’estima que tindria un nivell mínim de 7. d) Les dues estimacions són molt fiables, perquè el coeficient de correlació és força pròxim a 1. Y e) 90
60
30 1
050
10
5
X
Tenim dues variables bidimensionals representades per aquests núvols de punts. (I)
Y
(II)
Y
5 2 5
X
5
X
a) Escull els coeficients de correlació de totes dues i raona-ho. −0,92 0,6 0,95 −0,65 b) Ara, decideix quines són les equacions de les dues rectes de regressió corresponents. y = −2x + 12,6 y = 3x + 0,2 y = 1,3x + 0,9 y = −0,6x + 10 Justifica la resposta. a) El coeficient de correlació de les variables representades en el gràfic I és 0,95, perquè el núvol de punts mostra una dependència entre les variables forta i positiva. El coeficient de correlació de les variables representades en el gràfic II és −0,65, perquè la dependència entre les variables és dèbil i negativa. b) La recta de regressió del gràfic I és y = 1,3x + 0,9; ja que el pendent de la recta dibuixada és un valor pròxim a 1. La recta de regressió del gràfic II és y = −0,6x + 10, perquè el valor de l’ordenada de la recta representada és 10.
560
917221Unidad12.qxd
19/1/09
11:11
Página 561
SOLUCIONARI
051
12
Una empresa ha investigat la relació entre les despeses que té en publicitat i els beneficis que obté (en milions d’euros). Aquest és un resum de l’estudi. Any
98
99
00
01
02
03
04
06
07
Despeses
2
2,4
2
2,8
3
3,2 3,2 3,3 3,5
4
Beneficis
12
15
13
15
18
19
22
19
05 20
20
a) Comprova si hi ha relació entre les magnituds i, si és possible, estima els beneficis que s’obtindran l’any 2008, si s’invertiran 4,2 milions d’euros en publicitat. b) Quina inversió caldria per assolir 30 milions d’euros de beneficis? a) x = 2,94
y = 17,3
σX =
0, 38 = 0,61
σY = 10, 01 = 3,16
σXY = 1,89
rXY = 0,98 → La dependència és forta i positiva. Recta de regressió de Y sobre X: 1, 89 y − 17,3 = (x − 2,94) → y = 4,97x + 2,69 0, 38 x = 4,2 → y = 4,97 ⋅ 4,2 + 2,69 = 23,56 Els beneficis serien de 23,56 milions d’euros. b) Recta de regressió de X sobre Y: 1, 89 x − 2,94 = (y − 17,3) → x = 0,19y − 0,35 10, 01 y = 30 → y = 0,19 ⋅ 30 − 0,35 = 5,35 La inversió hauria de ser de 5,35 milions d’euros. 052
La Maria i en Jaume viuen al mateix carrer, però en voreres oposades. Els dos tenen un termòmetre al balcó i, com que la Maria creu que el seu s’ha fet malbé, decideixen anotar la temperatura exterior, en °C, durant una setmana i a la mateixa hora del dia. Han anotat els resultats en una taula. Jaume
22
24
25
27
18
20
21
Maria
18
20
18
17
20
21
16
a) Creus que les dues variables estan relacionades? Creus que haurien d’estar-ho? b) Raona si amb aquestes dades es pot obtenir alguna conclusió sobre el termòmetre de la Maria. y = 18,57 σX = 2,86 σY = 1,69 a) x = 22,43 rXY = −0,43 → La dependència és dèbil i negativa.
σXY = −2,097
Les dues variables estan poc relacionades, ja que els termòmetres estan en costats oposats de la vorera reben una exposició solar diferent. b) Com que la dependència és dèbil no es pot concloure res sobre el termòmetre de la Maria.
561
917221Unidad12.qxd
19/1/09
11:11
Página 562
Estadística bidimensional 053
S’ha mesurat el pes, X, i l’alçada, Y, dels alumnes d’una classe. El pes mitjà és de 56 kg, amb una desviació típica de 2,5 kg. L’equació de la recta de regressió que relaciona l’alçada i el pes és: y = 1,8x + 62 a) b) c) d)
Quina alçada pot estimar-se per a un alumne que pesa 64 kg? I si un alumne pesés 44 kg, quina alçada tindria? Quina és l’alçada mitjana dels alumnes d’aquesta classe? El pendent d’aquesta recta és positiu. Què vol dir això? a) x = 64 → y = 1,8 ⋅ 64 + 62 = 177,2 L’alumne deu fer 1,77 m d’alçada. b) x = 44 → y = 1,8 ⋅ 44 + 62 = 141,2 En aquest cas tindria una alçada d’1,41 m. c) y = 1,8 ⋅ 56 + 62 = 162,8 L’alçada mitjana és 1,63 m d) Si el pendent és positiu, llavors la correlació entre les variables també és positiva, és a dir, quan els valors d’una variable augmenten, els valors de l’altra variable també ho fan.
054
En Pere afirma que si un núvol de punts és d’una recta, el coeficient de correlació sempre val 1 o −1. Com que l’Eva no hi està d’acord, en Pere ho prova amb els punts de la recta d’equació y = −5x + 20, i l’Eva ho fa amb els punts de y = 2x −x2. Qui té raó? Per què? Si y = −5x + 20, alguns dels punts són: X
−2
−1
0
1
2
Y
30
25
20
15
10
y = 20 σX = 1,41 σY = 7,07 x =0 rXY = −1 → La dependència és lineal.
σXY = −10
Si y = 2x − x2, no és una recta, i alguns dels punts són: X
−2
−1
0
1
2
Y
−8
−3
0
1
0
y = −2 σX = 1,41 σY = 3,29 σXY = 4 x =0 rXY = 0,86 → La dependència és dèbil; per tant, l’Eva no té raó. 055
Un equip d’alpinistes que va escalar una muntanya, va mesurar l’altitud i la temperatura cada 200 metres d’ascensió. Després va anotar les dades en aquestes taules. Altitud (m)
800
Temperatura (°C)
22
Altitud (m) Temperatura (°C)
562
1.000 1.200 1.400 1.600 1.800 2.000 20
17
15
11
9
2.200 2.400 2.600 2.800 3.000 3.200 5
3
2
2
2
1
8
917221Unidad12.qxd
19/1/09
11:11
Página 563
SOLUCIONARI
12
a) Agafa les deu primeres mesures i, si la correlació és forta, calcula la recta de regressió de la temperatura sobre l’altitud. b) Estima la temperatura que hi haurà als 1.900 metres d’altitud. c) Quina temperatura s’estima als 3.200 metres? Com expliques les diferències? y = 11,2 σX = 574,46 σY = 6,69 a) x = 1.700 rXY = −0,99 → La dependència és forta i negativa.
σXY = −3.820
Recta de regressió de Y sobre X: 3.820 (x − 1.700) → y = −0,012x + 31,6 330.000 b) x = 1.900 → y = −0,012 ⋅ 1.900 + 31,6 = 8,8 La temperatura estimada és de 8,8 °C. y − 11,2 = −
c) x = 3.200 → y = −0,012 ⋅ 3.200 + 31,6 = −6,8 La diferència es deu al fet que el valor no està inclòs en l’interval [800, 2.600], format per les dades que s’han utilitzat per calcular la recta de regressió.
056
L’alcalde d’un poble ha constatat una reducció del nombre de naixements de nens, i ha encarregat un estudi. Any
86
89
92
95
98
01
04
07
Naixements
50
54
40
33
34
23
21
17
a) Pot establir-se, de manera fiable, una fórmula que relacioni l’any amb el nombre de naixements? b) Quants naixements poden estimar-se per al 2008? I per al 2010? Què pot estimar-se per al 2050? c) Aquesta última estimació és fiable? Raona la resposta. a)
X
0
3
6
9
12
15
18
21
Y
50
54
40
33
34
23
21
17
x = 10,5
y = 34
σX = 6,87
σY = 12,61
σXY = −83,63
rXY = −0,97 → La dependència és forta i negativa, i per tant es pot utilitzar la recta de regressió per relacionar les dues variables. b) Recta de regressió de Y sobre X: y − 34 = −
83, 63 (x − 10,5) → y = −1,77x + 52,59 47, 25
Per a l’any 2008 s’estimen: x = 22 → y = −1,77 ⋅ 22 + 52,59 = 13,65 naixements Per a l’any 2010 s’estimen: x = 64 → y = −1,77 ⋅ 64 + 52,59 = −60,69 naixements Per a l’any 2050 s’estimen −60 naixements. c) No és fiable, ja que l’any 2050 està molt allunyat del rang d’anys estudiats en la regressió.
563
917221Unidad12.qxd
19/1/09
11:11
Página 564
Estadística bidimensional 057
Una empresa estudia el nombre de dies de baixa per malaltia, Y, de cada un dels seus treballadors durant l’últim any. Per comparar-ho amb l’antiguitat, X, dels treballadors, han elaborat la taula següent. X
1
2
3
4
5
0
6
12
8
3
0
2
4
5
3
2
1
3
0
1
3
2
0
5
0
0
2
2
1
9
0
0
0
0
1
Y
a) Calcula les mitjanes i les desviacions típiques de les distribucions marginals. b) Determina la covariància i el coeficient de correlació. c) Troba la recta de regressió de Y sobre X i estima, si és fiable, el nombre de dies de baixa que poden esperar en un treballador amb 6 anys d’antiguitat a l’empresa. a) Taula de freqüències marginals dels anys d’antiguitat
Taula de freqüències marginals dels dies de baixa
xi
fi
yi
fi
1
10
0
29
2
18
2
15
3
16
3
6
4
9
5
5
5
3
9
1
Total
56
Total
56
x = 2,59 σX = 1,11 b) σXY = 1,02
y = 1,46 σY = 1,89 rXY = 0,49
1, 02 (x − 2,59) → y = 0,83x − 0,69 1, 23 La dependència és dèbil, i per tant l’estimació no és fiable.
c) Recta de regressió de Y sobre X: y − 1,46 =
058
Un inversor borsari vol predir l’evolució que tindrà l’Índex de la Borsa Espanyola (IBEX). Ha arribat a la conclusió que allò que passa amb l’IBEX un dia és el que passa a la cotització de l’empresa AW&B el dia anterior. Esbrina si això és correcte, a partir de les cotitzacions durant una setmana i els valors assolits per l’IBEX al dia següent. Dia AW&B Dia IBEX
564
1r
2n
3r
4t
5è
6è
7è
21,8
23,4
19,6
19,4
18,4
19,9
19,2
2n
3r
4t
5è
6è
7è
8è
12.560 12.720 11.580 11.420 10.930 11.450 11.480
917221Unidad12.qxd
19/1/09
11:11
Página 565
SOLUCIONARI
12
a) Quina cotització tindrà AW&B el dia anterior al dia en què l’IBEX assoleixi els 14.000 punts? b) Si un dia AW&B té una cotització de 24 euros, quin valor podem esperar que assoleixi l’IBEX el dia següent? x = 20,24 σX = 2, 77 = 1,66
y = 11.734,29 σY = 366.809, 62 = 605,65
σXY = 977,26 rXY = 0,97 → La dependència és forta i positiva. a) Recta de regressió de X sobre Y: x − 20,24 =
977, 26 (y − 11.734,29) → x = 0,0027y − 11,44 366.809, 62
y = 14.000 → x = 0,0027 ⋅ 14.000 − 11,44 = 26,36 b) Recta de regressió de Y sobre X: y − 11.734,29 =
977, 26 (x − 20,24) → y = 352,8x − 4.593,62 2, 77
x = 24 → y = 352,8 ⋅ 24 − 4.593,62 = 3.873,58
059
Troba el coeficient de correlació de la variable bidimensional les rectes de regressió de la qual són: • Recta de Y sobre X: 2x −y −1 = 0 • Recta de X sobre Y: 9x −4y −9 = 0 a) Troba la mitjana aritmètica de cada una de les variables. b) Pots calcular la desviació típica de y si saps que la de la variable X és 2 ? 2x − y − 1 = 0 → y = 2x − 1 → 9x − 4y − 9 = 0 → x = rXY =
σ XY σ XY 3 σ XY · 2 2
=
σ XY = 2 → σX = σX 2
σ XY 2
4 σ 4 3 σ XY y + 1 → XY2 = → σY = 9 σY 9 2 2 2 = 0, 94 3
a) Les rectes de regressió es tallen en el punt (x, y ). 2x − y − 1 = 0 ⎫ ⎪ ⎬ → x = 5, y = 9 9x − 4y − 9 = 0⎪ ⎪ ⎭ Llavors, resulta que: x = 5, y =9 b) σ X =
2 →
σ XY 3·2 = 2 → σ XY = 4 → σY = =3 2 2
565
917221Unidad12.qxd
19/1/09
11:11
Página 566
Estadística bidimensional 060
Sigui la variable bidimensional següent: X
3
5
8
9
10
12
15
Y
2
3
7
4
8
5
8
Investiga què succeeix amb la covariància i el coeficient de correlació en cada cas. a) b) c) d)
Sumem 10 a tots els valors de la variable X. Sumem 10 a tots els valors de la variable X i de la variable Y. Multipliquem per 4 tots els valors de la variable X. Multipliquem per 4 tots els valors de la variable X i de la variable Y. x = 8,86
y = 5,29
σXY = 6,42
σX = 14, 07 = 3,75
σY = 5, 02 = 2,24
rXY = 0,76
a)
X
13
15
18
19
20
22
25
Y
2
3
7
4
8
5
8
x = 8,86 + 10 = 18,86 σX = 3,75 b)
σXY = 6,42 rXY = 0,76
X
13
15
18
19
20
22
25
Y
12
13
17
14
18
15
18
y = 5,29 + 10 = 15,29 σY = 2,24 c)
σXY = 6,42 rXY = 0,76
X
12
20
32
36
40
48
60
Y
2
3
7
4
8
5
8
x = 8,86 ⋅ 4 = 35,44 σX = 3,75 ⋅ 4 = 15 d)
X
12
20
32
36
40
48
60
Y
8
12
28
16
32
20
32
y = 5,29 ⋅ 4 = 21,16 σY = 2,24 ⋅ 4 = 8,96 061
σXY = 6,42 ⋅ 4 = 25,68 rXY = 0,76
σXY = 6,42 ⋅ 16 = 102,72 rXY = 0,76
Respon aquestes qüestions. a) És cert que el signe dels pendents de les dues rectes de regressió d’una variable bidimensional és sempre igual? b) Què passa si les dues rectes de regressió tenen el mateix pendent? Com és la correlació? a) És cert, perquè el signe dels pendents de les rectes de regressió coincideix amb el signe de la covariància en totes dues. b) Com que les dues rectes passen pel punt (x, y ), si tenen el mateix pendent, llavors són coincidents. Per tant, la dependència entre les dues variables unidimensionals és lineal. La correlació és igual a 1 o 0.
566
917221Unidad12.qxd
19/1/09
11:11
Página 567
SOLUCIONARI
062
12
L’angle que formen les dues rectes de regressió d’una distribució bidimensional és més gran com més petit sigui el coeficient de correlació. Comprova-ho estudiant les dues magnituds en aquestes distribucions. 10
12
14
16
18
3
8
1
9
2
10
12
14
16
18
3
6
8
6
7
10
12
14
16
18
5
6
6,5
8,5
9
x = 14
y = 4,6
σXY = −0,4
σX = 8 = 2,83
σY = 1, 55 = 1,24
rXY = −0,11
0, 4 (x − 14) → y = −0,05x + 5,3 8 0, 4 Recta de regressió de X sobre Y: x − 14 = − (y − 4,6) → x = −0,26y + 15,2 1, 55 L’angle que formen les rectes és:
Recta de regressió de Y sobre X: y − 4,6 = −
cos α = y =6
0, 26 + 0, 05 (−1) + 0, 052 · (−0, 26)2 + 12 2
σY =
2, 8 = 1,67
σXY = 3,2
= 0, 29 → α = 72° 33' 48 " rXY = 0,68
3, 2 (x − 14) → y = 0,4x + 0,4 8 3, 2 Recta de regressió de X sobre Y: x − 14 = (y − 6) → x = 1,14y + 7,16 2, 8
Recta de regressió de Y sobre X: y − 6 =
L’angle que formen les rectes és: cos α = y =7
1,14 − 0, 4 1 + 0, 4 2 · 1,14 2 + (−1)2 2
σY =
2, 4 = 1,55
= 0, 45 → α = 63° 3' 30 "
σXY = 4,2
rXY = 0,96
4, 2 (x − 14) → y = 0,53x − 0,42 8 4, 2 Recta de regressió de X sobre Y: x − 14 = (y − 7) → x = 1,75y + 1,75 2, 4
Recta de regressió de Y sobre X: y − 7 =
L’angle que formen les rectes és: : cos α =
1, 75 + 0, 53 1 + 0, 532 · 1, 752 + 12 2
= 0, 99 → α = 1° 49 ' 16 "
567
917221Unidad12.qxd
19/1/09
11:11
Página 568
Estadística bidimensional 063
S’ha fet un test de memòria, X, i un d’atenció, Y, a diversos alumnes i els resultats s’han reflectit en aquesta taula. X
Y
[0, 10)
[10, 20)
[20, 30)
[30, 40)
Anna
Josep
Marta
Biel
Maria Júlia
Miquel
Marina
Joan Txell
[40, 50)
[0, 10) [10, 20) [20, 30) [30, 40) [40, 50)
Laura
Jaume
a) Calcula la covariància i el coeficient de correlació. b) Determina les dues rectes de regressió. c) Si és factible, estima quina puntuació obtindrà en Jordi en memòria, si té un 33 en atenció. d) Si és factible, estima quina puntuació obtindrà l’Eva en atenció, si té un 27 en memòria. yj
5
15
25
35
45
Total
5
0
0
0
0
0
0
15
1
1
1
0
0
3
25
0
1
2
1
0
4
35
0
0
1
1
1
3
xi
45
0
0
0
1
0
1
Total
1
2
4
3
1
11
a) x = 25,91 σX = 117, 31 = 10,83
y = 26,82
σXY = 71,0038
σY = 87, 51 = 9,35
rXY = 0,7
b) Recta de regressió de Y sobre X: y − 26,82 =
71, 0038 (x − 25,91) → y = 0,61x + 11,01 117, 31
Recta de regressió de X sobre Y: 71, 0038 x − 25,91 = (y − 26,82) → x = 0,81y + 4,19 87, 51 c) y = 33 → x = 0,81 ⋅ 33 + 4,19 = 30,92 d) x = 27 → y = 0,61 ⋅ 27 + 11,01 = 27,48
568
917221Unidad12.qxd
19/1/09
11:11
Página 569
SOLUCIONARI
12
PER ACABAR... 064
Troba la relació existent entre el coeficient de correlació lineal d’una distribució bidimensional i els pendents de les seves rectes de regressió. Comprova el resultat obtingut per a aquestes dades. X
10
13
16
14
17
18
Y
3
6
7
8
11
11
Y
Els pendents de les rectes de regressió són: ⎧ ⎪ σ ⎪ mX = XY2 → σ X = ⎪ ⎪ σX ⎪⎪ ⎨ ⎪ σ ⎪ ⎪ mY = XY2 → σY = ⎪ ⎪ σY ⎪ ⎩
2
σ XY mY
σ XY = σ X · σY
rXY =
Per tant, resulta que:
2
σ XY mx
σ XY σ XY · mX
X
= mX · mY
σ XY mY
x = 14,67 σX = 7,12 = 2,67
y = 7,67 σXY = 6,98 σY = 7, 84 = 2,8 rXY = 0,93 6, 98 Recta de regressió de Y sobre X: y − 7,67 = (x − 14,67) → mX = 0,98 7,12 6, 98 (y − 7,67) → mY = 0,89 Recta de regressió de X sobre Y: x − 14,67 = 7, 84 mX ⋅ mY = 0,93
065
Discuteix si és possible que la recta de regressió de X sobre Y i la recta de regressió de Y sobre X siguin paral·leles. I perpendiculars? y) No és possible que siguin paral·leles, ja que sempre tenen un punt comú: (x, Són perpendiculars si la correlació és nul·la.
066
Investiga com varia el coeficient de correlació entre dues variables estadístiques quan multipliquem les dades relatives a una de les constants per una quantitat constant, k. I si les multipliquem per la mateixa constant? Què passaria si multipliquessim cada variable per una constant diferent? Quan multipliquem les dades d’una variable per una quantitat constant k, les seves mesures estadístiques verifiquen que: n
n
∑ fi · kx i
i =1
=
N
k · ∑ fi · x i i =1
N
=k· x
n
n
∑ fi · (kx i − kx )2
i =1
=
N
∑ fi · k 2(x i − x )2
i =1
N
n
=
k 2 · ∑ fi · (x i − x )2 i =1
N
= k 2 · σ2X
k · σ = k · σX 2
2 X
569
917221Unidad12.qxd
19/1/09
11:11
Página 570
Estadística bidimensional Llavors la covariància entre les dues variables és: n
∑ fi · kx i · y i
i =1
N
n
− kx · y =
k · ∑ fi · x i · y i i =1
N
⎞⎟ ⎛ n f ·x ·y ⎜⎜ ∑ i i i ⎟⎟ i =1 ⎜ − kx · y = k ⎜⎜ − x · y ⎟⎟⎟ = k · σ XY ⎟⎠ ⎜⎝ N
Així doncs, el coeficient de correlació és: k · σ XY σ XY = = rXY k · σ X · σY σ X · σY Si multipliquem les dades de les dues variables per la mateixa constant k, llavors el coeficient de correlació és: k 2 · σ XY σ XY = = rXY k · σ X · k · σY σ X · σY I si multipliquem la segona variable per una constant m: k · m · σ XY σ XY = = rXY k · σ X · m · σY σ X · σY 067
Demostra que el coeficient de correlació de dues variables estadístiques no varia si a cada valor de les dues variables els sumem o restem un mateix nombre. Utilitza aquesta propietat per calcular el coeficient de correlació de les variables estadístiques següents. X
2.001
2.002
2.003
2.004
2.005
Y
7.390
7.350
7.240
7.210
7.110
Si sumem un valor c a cada valor d’una variable estadística, llavors la mitjana de les dades obtingudes és: n
∑ fi · (x i + c)
i =1
N
=
n
n
i =1
i =1
∑ fi · x i + ∑ fi · c N
n
=
=
∑ fi · x i + c · N
i =1
N
n
n
i =1
i =1
∑ fi · x i + c · ∑ fi N
=
=x+c
La variància d’aquestes dades verifica que: n
n
∑ fi · (x i + c − ( x + c))2
i =1
N
=
∑ fi · (x i − x )2
i =1
N
= σ2X
Per tant, la desviació típica també coincideix. La covariància entre les dues variables és: n
∑ fi · (x i + c) · y i
i =1
N
n
n
− ( x + c) · y =
∑ fi · x i · y i + ∑ fi · c · y i
i =1
i =1
N
n
=
i =1
N
n
=
570
n
∑ fi · x i · y i + c · ∑ fi · y i
i =1
∑ fi · x i · y i
i =1
N
−x · y−c· y = −x · y−c· y =
+ c · y − x · y − c · y = σ XY
917221Unidad12.qxd
19/1/09
11:11
Página 571
SOLUCIONARI
12
Així doncs, el coeficient de correlació és igual que el de les variables inicials. De la mateixa manera, si sumem o restem un mateix nombre a les dues variables el coeficient no varia. 068
En dos estudis realitzats sobre les dades d’una variable bidimensional, les rectes de regressió van ser les següents. En el primer estudi, la recta de regressió de Y sobre X és: 8x −3y −61 = 0 i la recta de X sobre Y és: x −y + 18 = 0. I en l’altre estudi, les rectes de regressió són, respectivament: 5x −2y −10 = 0 8x −5y + 20 = 0 y = 41 i r = 0,8, comprova quin dels estudis és vàlid. x = 23, Si coneixem ⎫ 8x − 3y − 61 = 0⎪ ⎪ ⎬ → x = 23, y = 41 x − y + 18 = 0 ⎪ ⎪ ⎭
⎫ 8x − 5y + 20 = 0⎪ ⎪ ⎬ → x = 10, y = 20 5x − 2y − 10 = 0 ⎪ ⎪ ⎭
y ). El primer estudi és el correcte, ja que les rectes es tallen en el punt (x, 069
Siguin dues variables estadístiques X i Y. Sabem que: • La recta de regressió de Y sobre X passa pels punts (1, 3) i (2, 5). • La recta de regressió de X sobre Y té pendent m = 3 i la seva ordenada a l’origen és 2. • La variància de Y és 3. Calcula les mesures estadístiques de cada una de les variables estadístiques i el coeficient de correlació. La recta que passa pels punts (1, 3) i (2, 5) té com a equació: y = 2x + 1 L’equació de l’altra recta és: y = 3x + 2 2x − y + 1 = 0⎫ ⎪ ⎬ → x = − 1, y = − 1 3x − y + 2 = 0⎪ ⎪ ⎭ ⎧ ⎪ x = −1 Llavors, resulta que: ⎪ ⎨ ⎪ ⎪ ⎩ y = −1 El coeficient de correlació és igual a l’arrel quadrada del producte del pendent de la recta de regressió de Y sobre X per la inversa del pendent de la recta de regressió de X sobre Y: r= Per tant, tenim que: r =
m⋅ 2⋅
1 = m'
σ XY σ XY σ XY ⋅ 2 = 2 σX σY σ X ⋅ σY
1 = 0,8164 3
El sistema d’equacions format per les dues rectes de regressió és: ⎫ ⎪ σ XY = 2⎪ ⎪ 2 ⎪ σX σY2 ⎪ → = 2 ⋅ 3 → σY2 = 6σ2X → σY = 6 σ X ⎬ 2 ⎪ σY2 σ X = 3⎪ ⎪ ⎪ σ XY ⎪ ⎪ ⎭ 1 Com que la variància de Y és 3: σ2X = 2
571