KNJIG STATI ISBN 978-961-237-599-7
Univerzitetni učbenik Knjiga o statistiki je namenjen študentom pedagogike in študentom pedagoških smeri študija, s pridom pa jo bodo lahko uporabljali tudi študentje drugih sorodnih družbenih ved. Avtor v knjigi predstavlja in obravnava osnovne statistične metode, ki se uporabljajo pri raziskovanju vzgojnih pojavov. Pri vsaki najprej pojasni teoretične osnove, nato pa uporabo te metode v pedagoškem raziskovanju. Učbenik je napisan v preprostem jeziku. Opremljen je s številnimi primeri uporabe in izvedbami opisanih statističnih metod. Predstavljeni so načini in pogoji praktične uporabe metod ter možni zapleti pri obdelavi podatkov. Zaradi izbora metod in načina njihovega obravnavanja je knjiga lahko elementarni učbenik za študente na prvi stopnji študija, nadaljevalni učbenik za študente na drugi stopnji, ali pa uvodni priročnik za študente na doktorskem študiju. Knjiga o statistiki je lahko uporabna tudi kot praktični priročnik za raziskovalno delo na pedagoškem področju.
Boris Kožuh je rojen leta 1945
v Italiji. Leta 1973 je diplomiral na Oddelku za pedagogiko Filozofske fakultete v Ljubljani. Po študiju se je zaposlil kot asistent za pedagoško statistiko pri profesorju dr. Janezu Sagadinu. Doktoriral je leta 1986, ob koncu devetdesetih let pa je bil tudi gostujoči profesor na Univerzi v Opolu na Poljskem. Leta 2000 je bil izvoljen za rednega profesorja za pedagoško metodologijo, leta 2008 pa je dobil naziv zaslužni profesor Univerze v Ljubljani. Aktivno obvlada ruščino, češčino, poljščino in hrvaščino ter pasivno vse ostale slovanske jezike. Deset let je bil glavni in odgovorni urednik osrednje slovenske pedagoške znanstvene revije Sodobna pedagogika. Predaval je na vseh treh slovenskih univerzah in na številnih
tujih. Sodeluje s profesorji na številnih univerzah po svetu (UCLA v Los Angelesu, South Bank University v Londonu, Karlova univerza v Pragi, Antioch University v Los Angelesu, University of North Dakota, več univerz na Poljskem ter v nekdanjih jugoslovanskih republikah itd.). V domačih in mednarodnih revijah objavlja študije s področja pedagoške metodologije. Objavil je 12 knjig v Sloveniji in več kot 25 v tujini, kot urednik pa je sodeloval pri številnih zbornikih, izdanih na različnih univerzah po svetu. Deset let vodi mednarodno združenje ICIA, kjer v sodelovanju z univerzami iz ZDA, Kanade, Anglije, Argentine, Avstralije in številnimi univerzami iz Evrope organizira mednarodne znanstvene on-line konference.
Boris Kožuh: KNJIGA O STATISTIKI
9 789612 375997
Boris Kožuh
KNJIGA O STATISTIKI Oddelek za pedagogiko in andragogiko Ljubljana 2013
Boris Ko탑uh
KNJIGA O STATISTIKI
Ljubljana 2013
KNJIGA O STATISTIKI Avtor: Boris Kožuh Recenzenta: Jasna Mažgon, Mara Cotič Lektor: Rok Janežič Tehnično urejanje in prelom: Jure Preglau © Univerza v Ljubljani, Filozofska fakulteta, 2013. Vse pravice pridržane. Založila: Znanstvena založba Filozofske fakultete Univerze v Ljubljani Izdal: Oddelek za pedagogiko Za založbo: Andrej Černe, dekan Filozofske fakultete Vodja Uredništva visokošolskih in drugih učbenikov: Jaka Repič Oblikovna zasnova: Jana Kuhar Naslovnica: VBG d. o. o. Tisk: Birografika Bori, d. o. o. Ljubljana, 2013 Prva izdaja Naklada: 400 izvodov Cena: 23,90 EUR
CIP - Kataložni zapis o publikaciji Narodna in univerzitetna knjižnica, Ljubljana 311.1(075.8) KOŽUH, Boris Knjiga o statistiki / Boris Kožuh. - 1. izd. - Ljubljana : Znanstvena založba Filozofske fakultete, 2013 ISBN 978-961-237-599-7 268607232
Kazalo
3
Kazalo
1 Osnovni pojmi................................................................................................................................... 9 1.1 Proučevanje množičnih pojavov.......................................................................................... 9 1.2 Statistična množica in enote.................................................................................................. 9 1.3 Spremenljivke ...........................................................................................................................11 1.3.1 Številske in opisne spremenljivke..........................................................................12 1.3.2 Merske lestvice..............................................................................................................13 1.3.3 Uporaba statističnih metod......................................................................................17 1.3.4 Zvezne in nezvezne spremenljivke........................................................................17 1.3.5 Neodvisne in odvisne spremenljivke....................................................................18 1.4 Statistični parametri................................................................................................................19
2 Urejevanje podatkov..................................................................................................................21 2.1 Urejevanje podatkov za številske spremenljivke..........................................................21 2.1.1 Ranžirna vrsta................................................................................................................21 2.1.2 Frekvenčna porazdelitev ...........................................................................................23 2.2 Urejevanje podatkov za opisne spremenljivke ............................................................25 2.3 Priprava podatkov za računalniško obdelavo................................................................30 2.3.1 Zbiranje podatkov........................................................................................................30 2.3.2 Seznam spremenljivk..................................................................................................32 2.3.3 Zapisovanje vrednosti ...............................................................................................32
3 Rangi.....................................................................................................................................................38 3.1 Absolutni rangi.........................................................................................................................38 3.2 Relativni rangi............................................................................................................................39 3.3 Značilni kvantilni rangi in kvantili......................................................................................40 3.3.1 Delitev na pol.................................................................................................................40 3.3.2 Delitev na četrtine........................................................................................................40 3.3.3 Delitev na desetine......................................................................................................41 3.3.4 Delitev na stotine.........................................................................................................41
4
Knjiga o statistiki
4 Srednje vrednosti..........................................................................................................................43 4.1 Primerjanje množic..................................................................................................................43 4.2 Srednje vrednosti.....................................................................................................................44 4.3 Izračunavanje aritmetične sredine.....................................................................................46 4.3.1 Računanje iz individualnih podatkov....................................................................46 4.3.2 Računanje iz frekvenčne porazdelitve..................................................................46 4.4 Tehtana aritmetična sredina.................................................................................................48 4.5 Tehtan strukturni odstotek...................................................................................................50
5 Razpršenost......................................................................................................................................51 5.1 Pojem razpršenosti..................................................................................................................51 5.2 Viri razpršenosti........................................................................................................................52 5.3 Merjenje razpršenosti.............................................................................................................53 5.3.1 Razpršenost podatkov za nominalne spremenljivke......................................53 5.3.2 Razpršenost podatkov za ordinalne spremenljivke.........................................54 5.3.3 Razpršenost podatkov za intervalne spremenljivke........................................55 5.4 Mere razpršenosti....................................................................................................................55 5.4.1 Variacijski razmik...........................................................................................................56 5.4.2 Decilni razmik ...............................................................................................................57 5.4.3 Kvartilni razmik..............................................................................................................57 5.4.4 Kvartilni odklon.............................................................................................................58 5.4.5 Povprečni absolutni odklon......................................................................................59 5.4.6 Varianca in standardni odklon.................................................................................60 5.5 Izračunavanje variance ..........................................................................................................62 5.5.1 Računanje iz individualnih podatkov....................................................................62 5.5.2 Računanje iz frekvenčne porazdelitve..................................................................64 5.6 Relativna mera razpršenosti.................................................................................................65 5.7 Relativni odklon .......................................................................................................................67 5.8 Analiza razpršenosti................................................................................................................69 5.8.1 Kako izračunamo pojasnjeno in nepojasnjeno varianco...............................75
Kazalo
5
6 Normalna porazdelitev..............................................................................................................77 6.1 Pojem in značilnosti................................................................................................................77 6.2 Uporaba zakonitosti normalne porazdelitve.................................................................79 6.2.1 Odstotek enot pod izbrano vrednostjo spremenljivke...................................80 6.2.2 Odstotek enot nad izbrano vrednostjo spremenljivke...................................80 6.2.3 Odstotek vrednosti v izbranem razmiku..............................................................81 6.2.4 Vrednost, pod katero je določeni odstotek enot..............................................83 6.2.5 Meji, med katerima je dani odstotek enot..........................................................85 6.2.6 Upoštevanje narave zveznih spremenljivk.........................................................86
7 Povezanost med pojavi.............................................................................................................87 7.1 Pojem korelacije.......................................................................................................................87 7.1.1 Korelacijski grafikon....................................................................................................89 7.1.2 Pozitivna in negativna korelacija............................................................................91 7.1.3 Linearna in nelinearna korelacija............................................................................92 7.1.4 Korelacija in vzročno-posledične zveze...............................................................94 7.2 Indeks korelacije.......................................................................................................................96 7.3 Korelacijski koeficienti............................................................................................................97 7.3.1 Pearsonov korelacijski koeficient............................................................................98 7.3.2 Korelacija ranga.......................................................................................................... 102 7.3.3 Biserialni korelacijski koeficient........................................................................... 105 7.3.4 Točkovni biserialni korelacijski koeficient......................................................... 109 7.3.5 Tetrakorični korelacijski koeficient...................................................................... 111 7.3.6 Korelacijsko razmerje............................................................................................... 112 7.4 Regresija................................................................................................................................... 116 7.5 Parcialna korelacija............................................................................................................... 117 7.5.1 Izločanje vpliva ene spremenljivke..................................................................... 119 7.5.2 Izločanje vpliva več spremenljivk........................................................................ 120
8 Raziskovanje na vzorcih......................................................................................................... 122 8.1 Osnovne množice in vzorci................................................................................................ 122 8.1.1 Zakaj vzorčimo........................................................................................................... 122 8.1.2 Posploševanje na osnovno množico.................................................................. 123
6
Knjiga o statistiki
8.1.3 reprezentativnost...................................................................................................... 124 8.1.4 Izbiranje vzorcev........................................................................................................ 126 8.1.5 Večstopenjsko vzorčenje........................................................................................ 132 8.1.6 Izbiranje enot s ponavljanjem.............................................................................. 134 8.1.7 Stratificirano vzorčenje............................................................................................ 134 8.1.8 Mali in veliki vzorci.................................................................................................... 135 8.1.9 Neodvisni in odvisni vzorci.................................................................................... 136 8.1.10 Enostavni slučajnostni vzorci.............................................................................. 137 8.1.11 Posploševanje na hipotetično osnovno množico....................................... 137 8.1.12 Oznake za parametre............................................................................................. 138 8.2 Ocenjevanje parametrov z velikimi vzorci................................................................... 139 8.2.1 Množica vzorcev in množica vseh vzorcev....................................................... 141 8.2.2 Porazdelitev vzorčnih parametrov...................................................................... 143 8.2.3 Ocenjevanje aritmetične sredine z enostavnimi slučajnostnimi vzorci.144 8.2.4 Ocenjevanje strukturnega odstotka z enostavnimi slučajnostnimi vzorci................................................................................................ 155 8.2.5 Ocenjevanje standardnega odklona z enostavnimi slučajnostnimi vzorci................................................................................................ 157 8.2.6 Ocenjevanje Pearsonovega korelacijskega koeficienta z enostavnimi slučajnostnimi vzorci............................................................................................... 158 8.3 Preizkušanje hipotez z velikimi vzorci........................................................................... 161 8.3.1 Preizkušanje ničelne hipoteze o razliki med aritmetičnimi sredinami z enostavnimi slučajnostnimi vzorci............................................... 162 8.3.2 Preizkušanje ničelne hipoteze o razliki med strukturnimi odstotki z enostavnimi slučajnostnimi vzorci.................................................................... 174 8.3.3 Preizkušanje hipotez o razliki med standardnimi odkloni z enostavnimi slučajnostnimi vzorci.................................................................... 178 8.3.4 Preizkušanje ničelne hipoteze o razliki med Pearsonovimi korelacijskimi koeficienti z enostavnimi slučajnostnimi vzorci.................. 180 8.4 χ2-preizkus................................................................................................................................ 183 8.4.1 Preizkušanje hipoteze enake verjetnosti ........................................................... 184 8.4.2 Preizkušanje hipoteze neodvisnosti ................................................................... 191 8.4.3 Pogoj za uporabo χ2-preizkusa............................................................................... 198
Kazalo
7
8.5 Koeficienti kontingence...................................................................................................... 200 8.5.1 Pearsonov kontingenčni koeficient...................................................................... 201 8.5.2 Cramérjev koeficient.................................................................................................. 204 8.5.3 Koeficient ф................................................................................................................... 204 8.6 Napake pri ocenjevanju parametrov in preizkušanju hipotez.............................. 205 8.6.1 Ocenjevanje parametrov.......................................................................................... 205 8.6.2 Preizkusi ničelnih hipotez........................................................................................ 206 8.7 Mali vzorci................................................................................................................................ 207 8.7.1 Studentova ali t-porazdelitev................................................................................. 207 8.7.2 Množica vzorcev in množica vseh vzorcev........................................................ 208 8.7.3 Porazdelitev vzorčnih parametrov........................................................................ 209 8.7.4 Reprezentativnost in velikost vzorca .................................................................. 211 8.7.5 Ocenjevanje aritmetične sredine z malimi vzorci........................................... 212 8.7.6 Preizkušanje ničelnih hipotez................................................................................. 218 Literatura................................................................................................................................................ 227 Priloge..................................................................................................................................................... 229
Osnovni pojmi
9
1 Osnovni pojmi
1.1 Proučevanje množičnih pojavov Vzgojni pojavi, ki jih proučujemo, so lahko množični ali enkratni. Množični pojavi so tisti, ki se pojavljajo večkrat, enkratni pa tisti, ki nastopajo samo enkrat. Gimnazija Vič je enkratni pojav, gimnazija nasploh pa množični pojav (saj jih je v Sloveniji več kot 20). Dijak M. Z. iz kraja A je enkratni pojav, dijak gimnazije pa je množični pojav. Statistične metode uporabljamo pri proučevanju množičnih pojavov, pri proučevanju enkratnih pa ne. S temi metodami proučujemo kvantitativne in kvalitativne značilnosti ter zakonitosti vzgojnih (pedagoških) pojavov. Definicija množičnih pojavov je sicer preprosta, a nam pri presoji, ali uporabiti statistične metode ali ne, ne pomaga veliko. Kadar proučujemo npr. »množico« treh ali štirih ravnateljev, ne bomo uporabili statističnih metod (pa čeprav gre po definiciji za množični pojav). Velja pravilo, da bomo statistične metode uporabili pri proučevanju nekoliko »bolj množičnih« pojavov ali, natančneje, za množice vsaj velikosti vzgojne skupine (šolskega oddelka, učne skupine, krožka in podobno). Šele takrat bo uporaba statističnih metod smiselna. Vendarle pa ostre meje ni (saj tudi velikost skupin v vzgojno-izobraževalnem delu nima enotne spodnje meje). To pravilo dodatno ilustrira odgovor na pogosto zastavljeno vprašanje: Pri kateri velikosti skupine lahko uporabimo statistične metode? Odgovor na takšno vprašanje bi seveda bil: Že pri dveh enotah. A kot smo že povedali, uporaba statističnih metod pri tako majhnih skupinah ni smiselna in smotrna.
1.2 Statistična množica in enote Množice na pedagoškem področju lahko sestavljajo najrazličnejše enote: dijaki, učitelji, gojenci, učenci in ravnatelji, a tudi vrtci, šole, dijaški domovi, knjige, delovni zvezki, učbeniki, učni načrti, šolsko pohištvo, učila, strokovne revije, šolske stavbe, učne ure, ekskurzije, ocene, izdelki učencev, vprašanja, računalniki itd. V empiričnih raziskavah vedno proučujemo konkretno skupino. Da bi jo lahko preučili, jo moramo natančno opredeliti. Tako opredeljeno skupino imenujemo statistična množica. Opredeliti množico pomeni postaviti pogoje, ki določajo, kdo vanjo sodi
10
Knjiga o statistiki
in kdo ne. Te pogoje imenujemo opredeljujoči pogoji. Opredeljujoči pogoji so na splošno trije: • s stvarnim opredeljujočim pogojem določimo, kdo (ali kaj) so enote te množice, • s časovnim opredeljujočim pogojem določimo čas, v katerem bomo zajeli množico, • s krajevnim opredeljujočim pogojem določimo geografske razsežnosti množice. Tiste enote, ki ustrezajo opredeljujočim pogojem, sodijo v tako opredeljeno statistično množico. S tem so natančno določene enote statistične množice in tudi celotna statistična množica. Če kateri od teh pogojev manjka, statistična množica ni dovolj natančno določena in tako ne vemo, katere enote jo sestavljajo. V tabeli je nekaj primerov ustrezno opredeljenih statističnih množic: Tabela 1. Statistične množice Učenci osnovnih šol v Mariboru na dan 4. marca 2012 Tehniške gimnazije v Sloveniji v šolskem letu 2010/2011 Učitelji razrednega pouka na osnovnih šolah v Kopru v šolskem letu 2011/2012 Šole za voznike motornih vozil v Ljubljani na dan 1. junija 2012 Ravnatelji osnovnih šol v Celju na dan 5. septembra 2011
Zaplete pri zbiranju podatkov o enotah množice prinaša časovni pogoj, kadar je določen v dolgem razmiku (semester, šolsko leto, polletje in podobno). Če se časovni pogoj nanaša na celo šolsko leto, moramo zajeti vse enote, ki se pojavijo v tistem šolskem letu (torej moramo čakati do konca šolskega leta). V tretjem primeru iz tabele bi bili to vsi učitelji – torej tudi tisti, ki so se zaposlili med šolskim letom. Za praktično izvedbo raziskave je to velika ovira (še zlasti za zbiranje podatkov). Običajno opredeljujemo množice v celih šolskih letih le, kadar v raziskavi uporabljamo podatke iz že obstoječe dokumentacije: npr. iz dokumentacije zavoda za šolstvo, urada za statistiko, ministrstev in podobno. Takrat lahko kot časovni opredeljujoči pogoj določimo celo šolsko leto. Če pa podatke zbiramo sami, množice najpogosteje opredeljujemo trenutno – z določenim datumom. Res je, da tudi dan (datum) ni povsem dosledno trenutna opredelitev; tudi dan je interval 24 ur.
Osnovni pojmi
11
Nekatere pojave moramo opredeliti intervalno: število opravljenih učnih ur (npr. v enem tednu, mesecu ali šolskem letu), število seminarjev, ki so se jih učitelji udeležili (npr. v zadnjih treh letih) itd. Takšnih množic nikakor ne moremo opredeliti trenutno; številne pa lahko opredelimo trenutno ali intervalno. Razprave o časovnem pogoju ne bomo širili na filozofska vprašanja trenutnega opredeljevanja statističnih množic. Bistveno je, da je časovni opredeljujoči pogoj jasno in nedvoumno določen. Statistično množico v raziskovalnem poročilu običajno imenujemo raziskovalna množica ali na kratko množica. Bistveno drugače pa statistične množice imenujemo v vzorčnih raziskavah, kjer iz množice izberemo le manjši del. Takrat celotno statistično množico imenujemo osnovna množica, manjši izbrani del pa vzorec (ali redkeje vzorčna množica).
1.3 Spremenljivke Enote statistične množice imajo nešteto lastnosti. Vsaka lastnost enot množice je spremenljivka. Naštejmo nekaj enot in njihovih pomembnejših lastnosti. Tabela 2. Statistične enote in spremenljivke enota
lastnosti ali spremenljivke
šola
leto ustanovitve, stopnja šole (osnovna, srednja itd.), skupno število učencev, število oddelkov, število zaposlenih, število učiteljev itd.
učitelj
stopnja izobrazbe, strokovni naziv, smer dokončanega študija, kateri predmet uči, šola, na kateri je zaposlen itd.
dijak
spol, starost, ocene, prizadevnost, interesi, ali je član športnega kluba, narodnost, najljubši šolski predmet, telesna teža itd.
priročnik
naslov priročnika, ime avtorja, leto izdaje, kraj izdaje, število strani, format, število ilustracij, cena, številka ISBN, ime založbe itd.
šola za voznike motornih vozil
število vozil, katere programe izvaja, število zaposlenih, število inštruktorjev vožnje itd.
Enote množice proučujemo tako, da zbiramo podatke o njihovih lastnostih – spremenljivkah. Spremenljivke so osrednji pojem statistike. Uporabiti statistične metode pravzaprav pomeni obdelati podatke za spremenljivke. V vsaki raziskavi pedagoške pojave proučujemo z drugačnim namenom. Zato bomo vsakokrat proučevali druge spremenljivke, celo takrat, ko raziskujemo podobne ali iste množice.
12
Knjiga o statistiki
1.3.1 Številske in opisne spremenljivke Da bi bolje razumeli pojem in vlogo spremenljivk v pedagoškem raziskovanju, bomo spremenljivke delili po nekaj kriterijih. Ena preprostejših je delitev spremenljivk po tem, kako so izražene njihove vrednosti. Lahko jih izražamo s številkami ali z besedami. Spremenljivke, ki jim vrednosti izražamo s številkami, imenujemo številske ali numerične. Tabela 3. Številske spremenljivke spremenljivka
vrednosti
štipendija
104, 151, 90 itd.
število študentov v letniku
45, 52, 39, 28, 90 itd.
starost v letih
14, 15, 17, 22 itd.
število oddelkov v vrtcu
4, 5, 8, 6 itd.
Spremenljivke, ki jim vrednosti izražamo z besedami (opisi), imenujemo opisne ali atributivne. Tabela 4. Opisne spremenljivke spremenljivka
vrednosti
katere tuje jezike obvlada študentka
angleški, francoski, nemški itd.
stopnja študija
prva stopnja, druga stopnja, tretja stopnja
narodnost
Italijanka, Madžarka, Slovenka, Hrvatica, Kitajka, Nemka, Španka itd.
opravljene vaje iz statistike
vse, nekatere, nobena
zadovoljnost s potekom izpita
zelo, srednje, malo
Vendar ta delitev povzroča tudi majhno dilemo. Vrednosti nekaterih spremenljivk so namreč izražene hkrati številčno in besedno. Pomislimo na šolske ocene, ki so skoraj vedno zapisane s številko in besedo. Ali so šolske ocene številske ali opisne spremenljivke? Da bi na to vprašanje odgovorili, moramo razmisliti, kakšna je narava te spremenljivke. Bolj pomembna je narava kot pa oblika spremenljivke, torej na kakšen način so vrednosti izražene. Takšen razmislek hitro pokaže, da je pri šolski oceni bistvena beseda
Osnovni pojmi
13
in ne številka. Zakaj? Odlična ocena je namreč povsod najboljša in je med ocenami na najvišjem mestu. Ta ocena je lahko zapisana z različnimi številkami (v osnovnih in srednjih šolah pri nas s številko 5, na Češkem s številko 1, na Poljskem s številko 6, na univerzah pri nas s številko 10, na italijanskih univerzah s številko 30, na univerzah na Poljskem s številko 5 itd.). Besedni izrazi so enoznačni, številke pa lahko določamo poljubno. Po svojem bistvu je torej šolska ocena opisna in ne številska spremenljivka.
1.3.2 Merske lestvice Veliko pomembnejša je delitev glede na vrsto in količino informacije, ki jo vsebujejo vrednosti spremenljivke (rezultati merjenja, podatki). Delitev po tem kriteriju ima štiri stopnje (štiri vrste spremenljivk ali štiri merske lestvice): A. nominalne spremenljivke, B. ordinalne spremenljivke, C. intervalne spremenljivke, D. razmernostne spremenljivke. Nominalne spremenljivke ne vsebujejo veliko informacije. Lahko ugotovimo le, ali se enote razlikujejo ali ne. Značilna nominalna spremenljivka je spol. Po tej spremenljivki lahko ugotovimo, ali sta dva učenca različnega ali enakega spola. Pri nominalnih spremenljivkah namesto izraza vrednosti raje uporabljamo izraz kategorije. Nekatere nominalne spremenljivke imajo le dve kategoriji, nekatere pa več: Tabela 5. Nominalne spremenljivke z dvema kategorijama spremenljivka
kategorije
spol
moški, ženski
ali učenec poje v šolskem zboru
da, ne
ali ima učenka svoj računalnik doma
ima, nima
ali se pri pisnem izpitu iz statistike lahko uporablja literatura
uporaba je dovoljena, uporaba ni dovoljena
14
Knjiga o statistiki
Tabela 6. Nominalne spremenljivke z več kategorijami spremenljivka
kategorije
narodnost
Kitajec, Francoz, Slovenec itd.
smer študija na filozofski fakulteti
geografija, filozofija, pedagogika, psihologija, zgodovina, umetnostna zgodovina, etnologija, knjižničarstvo itd.
kakšno študijsko literaturo uporabljajo študenti
monografije, zbornike, univerzitetne učbenike, znanstvene revije, strokovne revije itd.
Kategorij nominalne spremenljivke se ne da razvrstiti po velikosti od manjših do večjih, ker te lastnosti nominalne spremenljivke nimajo. Poenostavljeno bi lahko rekli, da so vse kategorije na isti ravni. Nominalne spremenljivke so čiste opisne spremenljivke in nimajo kvantitativne osnove. Pri presojanju, ali je določena spremenljivka nominalna ali »kaj več«, moramo biti pazljivi – presoditi moramo na podlagi bistva spremenljivke in ne na podlagi tega, kako so poimenovane njene kategorije. Pokažimo to s primerom. V anketi so dijaki odgovarjali na vprašanje, ali jim je bila filmska predstava všeč. Možna sta bila le dva odgovora: DA in NE. Kljub tako postavljenima kategorijama ta spremenljivka ni nominalna. Zadovoljnost se namreč stopnjuje; ni tako, da so eni popolnoma zadovoljni, drugi pa sploh ne. V resnici gre za nižjo in višjo stopnjo zadovoljnosti. Podobno je tudi z drugimi takšnimi spremenljivkami (priljubljenost, prizadevnost itd.). Nominalno spremenljivko bi dobili, če bi dijake vprašali, ali so bili na filmski predstavi. V tem primeru bi imeli odgovori DA in NE povsem drugačen pomen kot pri vprašanju o zadovoljnosti. Nenatančna imena spremenljivk ali njihovih kategorij so lahko včasih zavajajoča. Ordinalne spremenljivke vsebujejo že več informacije. Vsebujejo takšno informacijo, s pomočjo katere lahko ugotovimo, ali so enote enake ali različne, pa tudi nekaj več: katera enota je na lestvici višje in katera nižje. Vrednosti teh spremenljivk se stopnjujejo in jih lahko razvrstimo od najmanjše do največje (in s tem tudi enote). Namesto izraza vrednosti pri ordinalnih spremenljivkah raje uporabljamo izraz stopnje (redkeje kategorije). Kategorije nominalnih spremenljivk so vse na isti ravni, pri ordinalnih spremenljivkah pa se kategorije stopnjujejo – ker izražajo količino. Te spremenljivke imajo kvantitativno osnovo. Značilna ordinalna spremenljivka je stopnja izobrazbe. Ordinalne spremenljivke najpogosteje dobimo pri opazovanju, anketiranju, uporabi lestvic stališč in ocenjevalnih lestvic itd. Pogosto
Osnovni pojmi
15
že oblika anketnega vprašanja nakazuje, da gre za ordinalno spremenljivko: npr. koliko ste prispevali ... ali koliko se učite ... itd. Tudi kategorije ordinalne spremenljivke nakazujejo kvantitativno osnovo: veliko, srednje, malo; pogosto, včasih, redko itd. Zato kategorije ordinalne spremenljivke raje imenujemo stopnje. V zvezi s stopnjevanjem pri ordinalnih spremenljivkah se je treba zavedati, da vemo, katere stopnje so višje in katere nižje, ne vemo pa, kakšne so razlike med posameznimi stopnjami. Zato tudi ne moremo reči, da so intervali med posameznimi stopnjami povsod enaki. Še več – izkušnje kažejo, da ti intervali še zdaleč niso enaki. Ordinalno lestvico si lahko predstavljamo kot stopnišče z neenakimi stopnicami. Tudi če bi bili pri določeni ordinalni spremenljivki intervali med stopnjami enaki, bi nam to dejstvo ostalo skrito. Stopnje ordinalnih spremenljivk so običajno izražene z besedami, pogosto pa tudi s številkami (npr. šolske ocene in šolski uspeh). Številke ustvarjajo videz, kot da gre za enake intervale. Čeprav se na prvi pogled zdi, da je razlika med zadostno in dobro oceno enaka razliki med dobro in prav dobro oceno, pa to seveda ni res. Nemogoče je natančno določiti, kakšna je razlika med oceno 2 in 3 ali 3 in 4. Zato tudi ni možno trditi, da so te razlike enake (enaki intervali). Tudi rangi, kot npr. vrstni red prihoda v cilj pri krosu, zakrivajo dejanske razlike v dosežkih med učenci. Zdi se, kakor da so dosežki učencev enakomerno nanizani od prvega do zadnjega; kakor da so razlike med njimi enake (saj so med vsemi rangi enake razlike: med 7. in 8. je enaka razlika kot med 14. in 15.). V resnici so med posameznimi ocenami in tudi med posameznimi rangi razlike neenake (v tisti lastnosti, ki jo s temi ocenami ali rangi izražamo). Kako pa je s spremenljivko dosežek na testu znanja. Ali so tu intervali enaki ali ne? Zdi se, da je interval med npr. 14 in 15 točk enak intervalu med 8 in 9 točk. Vsakokrat gre le za eno točko in na videz je »točka tu enaka točki tam«. A čeprav se zdijo intervali enaki, so v resnici različni, saj je naraščanje težavnosti od naloge do naloge v testu neenakomerno. Izenačenost intervalov pri dosežkih na testu znanja pa je vendarle v splošnem večja kot pri številnih drugih ordinalnih spremenljivkah. Tega ne moremo neposredno pokazati, to lahko pokažejo le izkušnje. Izenačenost ali enakost intervalov med posameznimi stopnjami določene merske lestvice bi bila zelo dobrodošla lastnost. Pozneje bomo videli, da so takšne spremenljivke v obravnavani klasifikaciji intervalne in razmernostne. Nekatere spremenljivke, ki so vmes med ordinalnimi in intervalnimi, pogosto obravnavamo kot intervalne (npr. dosežke na testih znanja v točkah,
KNJIG STATI ISBN 978-961-237-599-7
Univerzitetni učbenik Knjiga o statistiki je namenjen študentom pedagogike in študentom pedagoških smeri študija, s pridom pa jo bodo lahko uporabljali tudi študentje drugih sorodnih družbenih ved. Avtor v knjigi predstavlja in obravnava osnovne statistične metode, ki se uporabljajo pri raziskovanju vzgojnih pojavov. Pri vsaki najprej pojasni teoretične osnove, nato pa uporabo te metode v pedagoškem raziskovanju. Učbenik je napisan v preprostem jeziku. Opremljen je s številnimi primeri uporabe in izvedbami opisanih statističnih metod. Predstavljeni so načini in pogoji praktične uporabe metod ter možni zapleti pri obdelavi podatkov. Zaradi izbora metod in načina njihovega obravnavanja je knjiga lahko elementarni učbenik za študente na prvi stopnji študija, nadaljevalni učbenik za študente na drugi stopnji, ali pa uvodni priročnik za študente na doktorskem študiju. Knjiga o statistiki je lahko uporabna tudi kot praktični priročnik za raziskovalno delo na pedagoškem področju.
Boris Kožuh je rojen leta 1945
v Italiji. Leta 1973 je diplomiral na Oddelku za pedagogiko Filozofske fakultete v Ljubljani. Po študiju se je zaposlil kot asistent za pedagoško statistiko pri profesorju dr. Janezu Sagadinu. Doktoriral je leta 1986, ob koncu devetdesetih let pa je bil tudi gostujoči profesor na Univerzi v Opolu na Poljskem. Leta 2000 je bil izvoljen za rednega profesorja za pedagoško metodologijo, leta 2008 pa je dobil naziv zaslužni profesor Univerze v Ljubljani. Aktivno obvlada ruščino, češčino, poljščino in hrvaščino ter pasivno vse ostale slovanske jezike. Deset let je bil glavni in odgovorni urednik osrednje slovenske pedagoške znanstvene revije Sodobna pedagogika. Predaval je na vseh treh slovenskih univerzah in na številnih
tujih. Sodeluje s profesorji na številnih univerzah po svetu (UCLA v Los Angelesu, South Bank University v Londonu, Karlova univerza v Pragi, Antioch University v Los Angelesu, University of North Dakota, več univerz na Poljskem ter v nekdanjih jugoslovanskih republikah itd.). V domačih in mednarodnih revijah objavlja študije s področja pedagoške metodologije. Objavil je 12 knjig v Sloveniji in več kot 25 v tujini, kot urednik pa je sodeloval pri številnih zbornikih, izdanih na različnih univerzah po svetu. Deset let vodi mednarodno združenje ICIA, kjer v sodelovanju z univerzami iz ZDA, Kanade, Anglije, Argentine, Avstralije in številnimi univerzami iz Evrope organizira mednarodne znanstvene on-line konference.
Boris Kožuh: KNJIGA O STATISTIKI
9 789612 375997
Boris Kožuh
KNJIGA O STATISTIKI Oddelek za pedagogiko in andragogiko Ljubljana 2013