korrelazio koefizientea

Page 1

BI DIMENTSIOKO ALDAGAI ESTATISTIKO

1. DISPERTSIO DIAGRAMA. PUNTU HODEIA Bi aldagaien (X eta Y) arteko erlazioa ikertzeko, bi aldagaiei dagozkien datu-multzoa lortu behar da. Ondoren komenigarria da, datu-multzo horretako (x1,y1), (x2,y2)... puntuen adierazpen grafikoa egitea. Adierazpen grafiko honi dispertsio diagrama deitzen zaio. Adibidea Europako hiriburuen latitudea eta urteko tenperaturaren batez bestekoaren balioak ondoko taulan daude. Egin ezazu bere dispertsio diagrama. Hiriburuak Tenperatura Latitudea

Amsterdam Atenas Bonn Brusela Kopenhage Dublin Lisboa Londres Luxenburgo Madril Paris Erroma

13 24 13 14 11 13 19 14 14 19 15 22

54 37 52 52 54 53 39 53 50 40 49 42

Dispertsio diagrama 60 55 50 45 40 35 30 25 10

15

20

25

Dispertsio diagramaren puntu-hodeiaren formak bi aldagaien arteko korrelazioa zer nolakoa den adierazten digu.Hona hemen korrelazioaren lehen ideiak: Puntu hodeiak forma luzatu bat daukanean korrelazio lineala existitzen da, puntuak lerro zuzen batera hurbiltzen direlako. Puntu hodeien estutasunak korrelazioaren indarra adierazten digu. Hodei estu eta luzeak, korrelazio sendoa adierazten du. Malda positiboa duen zuzen baten inguruan kontzentratuta dagoenean puntu hodeia, korrelazio zuzena duela esaten da. X aldagaiaren handitzeak, Y aldagaiaren handitzea ematen du. Malda negatiboa duen zuzen baten inguruan kontzentratuta dagoenean puntu hodeia, alderantzizko korrelazio duela esaten da. X aldagaiaren handitzeak, Y aldagaiaren txikitzea ematen du.

2. BI DIMENTSIOKO ALDAGAI ESTATISTIKOAREN PARAMETROAK Bi dimentsioko datuen multzoa ondoko puntuen bidez emanda datorrena da (x1,y1), (x2,y2), ..., (xn,yn). Aldagai bakoitzari elkarkideak diren datuak bazterretako neurriak deitzen dira. X aldagaiari dagozkion bazterretako neurriak x1, x2, ..., xn dira. Y aldagaiari dagozkion bazterretako neurriak y1, y2, ..., yn dira.

Batez bestekoak

∑ x i ⋅ fi x= N

eta

y i ⋅ f i' ∑ y= , N

OHARRA: Bi dimentsioko banaketa batean

non

N = ∑ f i = ∑ f i'

(x, y ) banaketaren grabitate-zentroa da. Orr. 3


BI DIMENTSIOKO ALDAGAI ESTATISTIKO

Bariantzak (Bazterretako bariantzak)

S

2 X

(x i − x) 2 ⋅ f i ∑ x i2 ⋅ f i ∑ = =

S2Y =

N ∑ (y i − y) 2 ⋅ f j

N

=

N ∑ y i2 ⋅ f j

N

− x2

− y2

KOBARIANTZA Korrelazioaren zentzua jakin arazten digun zenbakiari kobariantza deitzen zaio.

SXY =

∑ (x i − x)(y i − y) = ∑ x i ⋅ y i ⋅ f ij − x ⋅ y N

N

Kobariantzaren balioa positiboa denean, ikertutako aldagaien arteko korrelazioa zuzena dela esan nahi du, eta korrelazioaren balioa negatiboa denean alderantzizko korrelazioa dagoela. Kobariantzak arazo bat sortzen du, bere balioa ardatzetan aukeratutako eskalaren menpe dagoela. Hau da, kobariantza aldatzen da altuera metrotan edo zentimetrotan adierazten bada. Baita dirua eurotan edo dolarretan adierazten bada.

Adibidea Aurreko orrialdeko adibidea erabiliz, kalkulatu aldagai bakoitzaren batez bestekoa, desbideratze tipikoa, bariantza eta kobariantza.

191 575 x= = 15,916 y = = 47,916 12 12 3223 S2X = − 15,916 2 = 15,26 12 SX = 15,26 = 3,906 28013 S2Y = − 47,916 2 = 38,47 12 S Y = 38,47 = 5,20 8879 SXY = − 15,916 ⋅ 47,916 = −22,71 12

X 13 24 13 14 11 13 19 14 14 19 15 22 191

Y 54 37 52 52 54 53 30 53 50 40 49 42 575

fij 1 1 1 1 1 1 1 1 1 1 1 1

X2 169 576 169 196 121 169 361 196 196 361 225 484 3223

Y2 2916 1369 2704 2704 2916 2809 1521 2809 2500 1600 2401 1764 28013

XY 702 888 676 728 594 689 741 742 700 760 735 924 8879

Orr. 4


BI DIMENTSIOKO ALDAGAI ESTATISTIKO

Adibidea Kontutan har ditzagun talde bateko 44 minusbaliatuen adina eta psikomotrizitatea neurtzen dituen banaketaren ondoko taula. [5,7) [7,9) [9,11) [11,13 Bilatu bi aldagaien batez bestekoa, bariantza eta ko- [25,30) 4 3 1 8 bariantza. 2 7 2 11 [30,35) [35,40) [40,45) [45,50)

1

1 2

11

7

13

13

1 6 3 11

14 8 3 44

Sortu dezagun taula, ondoren kalkuluak egiteko.

Adinak [5,7) [5,7) [5,7) [5,7) [7,9) [7,9) [7,9) [9,11) [9,11) [11,13) [11,13) [11,13) [11,13)

Psikom. [25,30) [30,35) [35,40) [25,30) [30,35) [35,40) [40,45) [30,35) [35,40) [25,30) [35,40) [40,45) [45,50)

X 5 6 6 8 8 8 8 10 10 12 12 12 12

Y 27,5 32,5 37,5 27,5 32,5 37,5 42,5 32,5 37,5 27,5 37,5 42,5 47,5

fi 4 2 Q1 3 7 1 2 2 11 1 1 6 3 44

X fi 24 12 6 24 56 8 16 20 110 12 12 72 36 408

Y fi 110 65 37,5 82,5 227,5 37,5 85 65 412,5 27,5 37,5 255 142,5 1 585

X2 fi 144 72 36 192 448 64 128 200 1100 144 144 864 432 3 968

Y2 fi 3025 2112,5 1406,3 2268,8 7393,8 1406,3 3612,5 2112,5 15469 756,25 1406,3 10838 6768,8 58 575

X Y fi 660 390 225 660 1820 300 680 650 4125 230 450 3060 1710 15 060

408 1585 = 9,27 = 36,02 y= 44 44 3968 58575 S2X = − 9,27 2 = 4,25 S2Y = − 36,02 2 = 33,81 44 44 SX = 4,25 = 2,06 SY = 33,81 = 5,81 15060 SXY = − 9,27 ⋅ 36,02 = 8,367 44 x=

Orr. 5


BI DIMENTSIOKO ALDAGAI ESTATISTIKO

KORRELAZIOA Bi dimentsioko banaketa bateko aldagaien arteko erlazioa edo dependentzia korrelazioaren bidez ikertzen da. Korrelazio-motak: ° Korrelazio zuzena: Aldagai bataren balioa handitzen denean bestearena ere handitzen bada. Puntu hodeiari dagozkien zuzena gorakorra denean. ° Alderantzizko korrelazioa: Aldagai bataren balioa handitzen denean bestearena txikitzen bada. Puntu hodeiari dagozkien zuzena beherakorra denean. ° Korrelazio nulua: Aldagaien arteko menpekotasuna ez denean ematen. Puntu hodeiek forma borobil bat hartzen dutenean. Korrelazio-maila: ° Korrelazio sendoa: Puntu hodeiak zuzenetik hurbil daudenean ° Korrelazio ahula: Puntu hodeiak zuzenetik bananduta daudenean ° Korrelazio nulua: Puntu hodeiak zuzenetik guztiz bananduta daudenean. Korrelazio linealaren koefizientea (r) Kobariantza eta desbideratze tipikoen biderketaren arteko zatiketa da eta, r letraren bidez adierazten da.

r=

SXY SX ⋅ SY

Korrelazio koefizienteak, r, honako propietate hauek ditu: ¾ Kobariantza positiboa bada, korrelazioa ere positiboa izango da. ¾ Kobariantza negatiboa bada, korrelazioa ere negatiboa izango da. ¾ Korrelazioak ez dauka dimentsiorik. Hau da, bi aldagaien balioak adierazteko erabiltzen diren unitateekin ez du zerikusirik. Beraz, unitate aldaketa bat egiten bada ere, r ez da aldatzen. ¾ Korrelazio koefizientea -1 ≤ r ≤ 1 tartean dago beti. ¾ r= -1 bada, laginari dagozkion puntu guztiak ZUZEN batean daude, X eta Y-ren artean dependentzia funtzionala dago. Bi aldagaien arteko korrelazioa perfektua da. ¾ -1<r<0 tartean badago, korrelazioa negatiboa da. r-ren balioa -1-tik zenbat eta hurbilago, korrelazioa hainbat eta indartsuagoa; 0-tik zenbat eta hurbilago, korrelazioa hainbat eta ahulagoa. Kasu honetan bi aldagaien artean ALDERANTZIZKO korrelazioa dago; hau da, X-en balio handiei Yren balio txikiak dagozkie, eta alderantziz. X eta Y aldagaien artean zorizko dependentzia dago.

¾ ¾

r=0 bada, bi aldagaien artean ez dago erlaziorik. Kasu honetan bi aldagaien artean INDEPENDENTZIA dago. 0<r<1 tartean badago, korrelazioa positiboa da. r-ren balioa 1-tik zenbat eta hurbilago korrelazioa hainbat eta indartsuagoa; 0-tik zenbat eta hurbilago, korrelazioa hainbat eta ahulagoa. Kasu honetan bi aldagaien artean korrelazio ZUZENA dago; hau da, X-en balio handiei Y-ren balio handiak dagozkie eta alderantziz. X eta Y aldagaien artean zorizko dependentzia dago.

¾

r=1 bada, laginari dagozkion puntu guztiak ZUZEN batean daude; beraz, X eta Y aldagaien artean dependentzia funtzionala dago. Orr. 6


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.