OPISN STATI ISBN 978-961-06-0484-6
9 789610 604846
Priročnik Opisna statistika v R-ju je primarno namenjen študentom dodiplomskega študija psihologije, a je lahko koristen vir za študente kateregakoli družboslovnega študijskega programa, ki ima v predmetniku statistične predmete. Čeprav je priročnik napisan tako, da predpostavlja le minimalno predhodno znanje statistike, je namenjen tudi tistim, ki že imajo določena statistična znanja in izkušnje, a želijo začeti uporabljati program R. R je prosto dostopen in odprtokoden program za statistične analize, upravljanje s podatki in njihovo grafično predstavitev. Zaradi
Opisna_statistika_naslovka_FINAL.indd 1
svoje dostopnosti, prožnosti in neprestanega razvoja postaja vedno bolj priljubljeno statistično orodje. R je zelo primeren tudi za poučevanje statistike, saj v primerjavi s programi z razvejanim grafičnim vmesnikom v večji meri spodbuja razmišljanje o uporabljenih analizah, željo po globljem razumevanju postopkov in dejansko uporabo pridobljenih statističnih znanj. Vsako poglavje priročnika vsebuje jedrnate povzetke obravnavanih konceptov in postopkov, primere ukazov oz. kode s komentarji, naloge z rešitvami in seznam uporabljenih funkcij.
plomski in podiplomski študij psihologije na Oddelku za psihologijo FF UL. Trenutno je docent za psihološko metodologijo na Filozofski fakulteti Univerze v Ljubljani, kjer sodeluje pri izvedbi nekaterih metodoloških in statističnih predmetov v študijskih programih Psihologija, Statistika ter Humanistika in družboslovje. Njegovi raziskovalni interesi obsegajo razvoj in priredbe psiholoških testov, raziskovanje kognitivnega nadzora, razvoj in validacijo postopkov za merjenje in preučevanje raznovrstnih psiholoških pojavov s pomočjo sodobne tehnologije (igrifikacija eksperimentalnih paradigem, uporaba opreme za navidezno in obogateno resničnost), kot metodolog in statistik pa sodeluje tudi v medicinskih raziskavah ter raziskavah z drugih psiholoških področij.
LUKA KOMIDAR: OPISNA STATISTIKA V R-JU
LUKA KOMIDAR je končal dodi-
LUKA KOMIDAR
OPISNA STATISTIKA V R-JU Oddelek za psihologijo Ljubljana 2021
18. 06. 2021 12:27:48
Luka Komidar
OPISNA STATISTIKA V R-JU
Ljubljana 2021
Opisna statistika v R-ju FINAL.indd 1
18. 06. 2021 14:39:18
OPISNA STATISTIKA V R-JU Tip publikacije: univerzitetni učbenik Avtor: Luka Komidar Recenzenta: Anja Podlesek, Erik Štrumbelj Lektoriranje: Branka Gradišar Tehnično urejanje: Jure Preglau Prelom: Aleš Cimprič Slika na naslovnici: Stock photo © Medesulda © Univerza v Ljubljani, Filozofska fakulteta, 2021. Vse pravice pridržane. Založila: Znanstvena založba Filozofske fakultete Univerze v Ljubljani Izdal: Oddelek za psihologijo Za založbo: Roman Kuhar, dekan Filozofske fakultete Vodja Uredništva visokošolskih in drugih učbenikov: Janica Kalin Tisk: Birografika Bori, d. o. o. Prva izdaja Ljubljana, 2021 Naklada: 400 izvodov Cena: 15,90 EUR
CIP - Kataložni zapis o publikaciji Narodna in univerzitetna knjižnica, Ljubljana 311.1 004.42:311.1 KOMIDAR, Luka Opisna statistika v R-ju / Luka Komidar. - 1. izd. Ljubljana : Znanstvena založba Filozofske fakultete Univerze v Ljubljani, 2021 ISBN 978-961-06-0484-6 COBISS.SI-ID 67122947
Opisna statistika v R-ju FINAL.indd 2
18. 06. 2021 14:39:18
Kazalo
3
Kazalo
Predgovor.................................................................................................................................................................7 Spoznavanje R-ja in RStudia............................................................................................................................9 Namestitev programa R.................................................................................................................................................. 9 Namestitev programa RStudio.................................................................................................................................... 9 Namestitev dodatnih paketov..................................................................................................................................... 9 Namestitev in aktivacija paketov........................................................................................................................10 RStudio – pregled uporabniškega vmesnika........................................................................................................10 Pomembne tehnične značilnosti R-ja...............................................................................................................11 Nastavitev delovnega direktorija.......................................................................................................................11 Objekti v R-ju....................................................................................................................................................................12 Pomoč pri uporabi funkcij.....................................................................................................................................12 Operatorji...........................................................................................................................................................................12 Podatkovni tipi.................................................................................................................................................................13 Podatkovne strukture....................................................................................................................................................14 Skalar ...........................................................................................................................................................................14 Vektor...........................................................................................................................................................................14 Matrika.........................................................................................................................................................................15 Seznam.........................................................................................................................................................................16 Polje...............................................................................................................................................................................17 Faktor............................................................................................................................................................................17 Podatkovni okvir.......................................................................................................................................................18 Branje in shranjevanje objektov v datoteke..........................................................................................................20 Uvoz podatkov..........................................................................................................................................................20 Shranjevanje podatkov in ustvarjenih objektov...........................................................................................21 Izvoz ustvarjenih rezultatov/tabel in slik.........................................................................................................22 Izbor določene skupine udeležencev iz celotnega vzorca �����������������������������������������������������������������������������22 Naloge (spoznavanje R-ja)...........................................................................................................................................24 Rešitve nalog (spoznavanje R-ja)..............................................................................................................................26 Funkcije, ki smo jih spoznali v poglavju Osnovne informacije ����������������������������������������������������������������������28
Urejanje podatkov, pregled porazdelitev/strukture spremenljivk ��������������������������������������������� 31 Merske ravni spremenljivk...........................................................................................................................................31 Razvrščanje podatkov...................................................................................................................................................31 Rekodiranje vrednosti spremenljivk........................................................................................................................32 Frekvenčne porazdelitve..............................................................................................................................................34 Frekvenčne tabele za pregled ene spremenljivke........................................................................................34 Slike frekvenčne porazdelitve spremenljivke................................................................................................35 Kontingenčne tabele (prikaz večstopenjske strukture nominalnih spremenljivk) .........................39
Opisna statistika v R-ju FINAL.indd 3
18. 06. 2021 14:39:18
4
Opisna statistika v R-ju
Naloge (urejanje podatkov in pregled porazdelitev).........................................................................................41 Rešitve nalog (urejanje podatkov in pregled porazdelitev) ���������������������������������������������������������������������������43 Funkcije, ki smo jih spoznali v poglavju Urejanje podatkov, pregled porazdelitev spremenljivk........................................................................................................................................................46
Položaj podatka/osebe v (katerikoli) porazdelitvi............................................................................... 47 Absolutni rangi................................................................................................................................................................47 Percentilni rangi..............................................................................................................................................................47 Kvantili................................................................................................................................................................................48 Naloge (položaj podatka v porazdelitvi)................................................................................................................50 Rešitve nalog (položaj podatka v porazdelitvi)....................................................................................................52 Funkcije, ki smo jih spoznali v poglavju Položaj podatka/osebe v (katerikoli) porazdelitvi................................................................................................................................54
Mere centralne tendence, razpršenosti in oblike porazdelitve ����������������������������������������������������� 55 Mere centralne tendence.............................................................................................................................................56 Modus...........................................................................................................................................................................56 Mediana.......................................................................................................................................................................56 Aritmetična sredina.................................................................................................................................................57 Tehtana aritmetična sredina.................................................................................................................................57 Geometrična sredina...............................................................................................................................................58 Robustne mere centralne tendence..................................................................................................................58 Mere razpršenosti...........................................................................................................................................................59 Variacijski razmik......................................................................................................................................................59 Interkvartilni razmik in odklon............................................................................................................................59 Povprečni absolutni odklon od aritmetične sredine...................................................................................59 Standardni odklon/deviacija in varianca.........................................................................................................60 Koeficient variacije...................................................................................................................................................60 Robustne mere razpršenosti................................................................................................................................61 Mere oblike porazdelitve.............................................................................................................................................62 Asimetričnost porazdelitve...................................................................................................................................62 Sploščenost porazdelitve......................................................................................................................................62 Funkcije za izračun več opisnih statistik hkrati....................................................................................................63 Naloge (mere centralne tendence)..........................................................................................................................65 Rešitve nalog (mere centralne tendence)..............................................................................................................68 Naloge (mere razpršenosti).........................................................................................................................................71 Rešitve nalog (mere razpršenosti)............................................................................................................................72 Naloge (mere oblike porazdelitve in preverjanje prileganja NP) �����������������������������������������������������������������73 Rešitve nalog (mere oblike porazdelitve in preverjanje prileganja NP) �����������������������������������������������������75 Funkcije, ki smo jih spoznali v poglavju Mere centralne tendence, razpršenosti, oblike porazdelitve...........................................................................................................................................77
Normalna porazdelitev.................................................................................................................................... 79 Preverjanje prileganja porazdelitve spremenljivke normalni porazdelitvi �����������������������������������������������80 Preverjanje prileganja normalni porazdelitvi na podlagi opisnih statistik �����������������������������������������80
Opisna statistika v R-ju FINAL.indd 4
18. 06. 2021 14:39:18
Kazalo
5
Preverjanje prileganja normalni porazdelitvi z grafičnimi metodami �������������������������������������������������80 Preverjanje prileganja normalni porazdelitvi s statističnimi testi ����������������������������������������������������������83 Določanje položaja podatka/osebe v normalni porazdelitvi ������������������������������������������������������������������������83 Izračun standardiziranega dosežka (z-vrednost)..........................................................................................83 Percentilni rangi........................................................................................................................................................84 Kvantili..........................................................................................................................................................................85 Naloge (položaj podatka v normalni porazdelitvi).............................................................................................86 Rešitve nalog (položaj podatka v normalni porazdelitvi)................................................................................88 Funkcije, ki smo jih spoznali v poglavju Normalna porazdelitev �����������������������������������������������������������������90
Korelacija (Pearsonov r) in bivariatna linearna regresija ����������������������������������������������������������������� 91 Razsevni diagram............................................................................................................................................................92 Kovarianca in Pearsonov koeficient korelacije.....................................................................................................94 Naloge (Pearsonov koeficient korelacije)...............................................................................................................96 Rešitve nalog (Pearsonov koeficient korelacije)..................................................................................................98 Osnovna opredelitev bivariatne linearne regresije......................................................................................... 100 Standardizirana regresijska enačba...................................................................................................................... 101 Dodajanje regresijske premice na razsevni diagram...................................................................................... 102 Razstavljanje variance kriterija in mere prileganja regresijskega modela podatkom ����������������������� 104 Napovedni interval...................................................................................................................................................... 106 Preverjanje predpostavk linearne regresije........................................................................................................ 108 Neodvisnost opazovanj/naključno vzorčenje............................................................................................ 108 Merska raven spremenljivk................................................................................................................................ 109 Linearnost odnosa med spremenljivkama.................................................................................................. 109 Normalnost porazdelitve rezidualov.............................................................................................................. 110 Homoskedastičnost.............................................................................................................................................. 110 Analiza vplivnih točk.................................................................................................................................................. 110 Naloge (bivariatna linearna regresija).................................................................................................................. 114 Rešitve nalog (bivariatna linearna regresija)...................................................................................................... 117 Funkcije, ki smo jih spoznali v poglavju Korelacija (Pearsonov r) in bivariatna linearna regresija............................................................................................................................................ 121
Drugi korelacijski koeficienti......................................................................................................................123 Korelacije za kombinacijo intervalne in nominalne spremenljivke ���������������������������������������������������������� 123 Točkovno biserialni koeficient korelacije (rpb)............................................................................................. 123 Biserialni koeficient korelacije (rb)................................................................................................................... 124 Koeficient korelacije eta (η)............................................................................................................................... 125 Korelacije za kombinacijo dveh (ali več) ordinalnih spremenljivk ������������������������������������������������������������ 126 Spearmanov ro (ρ)................................................................................................................................................ 126 Kendallov tau (τ).................................................................................................................................................... 126 Kendallov W (koeficient konkordance).......................................................................................................... 127 Korelacije za kombinacijo dveh nominalnih spremenljivk........................................................................... 128 Koeficient fi (Φ)...................................................................................................................................................... 128
Opisna statistika v R-ju FINAL.indd 5
18. 06. 2021 14:39:18
6
Opisna statistika v R-ju
Tetrahorični koeficient korelacije (rtet)............................................................................................................ 130 Koeficient kontingence (C)................................................................................................................................ 130 Cramerjev V............................................................................................................................................................. 131 Naloge (drugi korelacijski koeficienti).................................................................................................................. 132 Rešitve nalog (drugi korelacijski koeficienti)..................................................................................................... 136 Funkcije, ki smo jih spoznali v poglavju Drugi korelacijski koeficienti ���������������������������������������������������� 140
Priporočeno dodatno branje......................................................................................................................141 Statistične knjige.......................................................................................................................................................... 141 Spletne strani................................................................................................................................................................ 141
Opisna statistika v R-ju FINAL.indd 6
18. 06. 2021 14:39:18
Predgovor
7
Predgovor
Priročnik Opisna statistika v R-ju je primarno namenjen študentom 1. letnika dodiplomskega študija psihologije, a je lahko koristen vir za študente kateregakoli družboslovnega študijskega programa, ki ima v predmetniku statistične predmete. Čeprav je priročnik napisan tako, da predpostavlja le minimalno predhodno znanje statistike, je namenjen tudi tistim, ki že imajo določena statistična znanja in izkušnje, a želijo začeti uporabljati program R. R je prosto dostopen in odprtokoden program za statistične analize, upravljanje s podatki in njihovo grafično predstavitev. Nekomu, ki pri svojem delu uporablja enega od statističnih paketov z bogatim grafičnim vmesnikom (npr. IBM SPSS), se lahko na prvi pogled zdi, da je R (ali katero od razvojnih okolij za R, npr. RStudio) za družboslovno izobražene strokovnjake manj prijazen in morda celo prezahteven. Podobne strahove in dvome smo imeli tudi na Oddelku za psihologijo FF UL, ko smo pred nekaj leti prešli z uporabe programa SPSS na R/RStudio. Po izkušnjah, ki smo jih v nekaj letih pridobili tako učitelji kot študenti, lahko zapišem, da so bili ti strahovi neutemeljeni, saj se je R izkazal kot zelo intuitivno, prožno in učinkovito statistično orodje. R odlikuje množica lastnosti, ki uporabniku omogočajo hitro učenje tako R-ja kot statistike in lahko močno zvišajo učinkovitost dela že bolj prekaljenega statistika. Med prednostmi bi posebej izpostavil modularno zasnovo R-ja in neprestan razvoj novih funkcionalnosti, ki nemalokrat vključujejo najsodobnejše postopke. Neutrudna skupnost rednih razvijalcev in programerskih navdušencev skrbi za nenehno vzdrževanje in razvijanje novih paketov, kar v praksi pomeni, da imamo uporabniki na voljo izredno široko in bogato paleto statističnih analiz. R je po mojih osebnih izkušnjah odličen tudi z didaktičnega vidika, saj v primerjavi s programi z razvejanim grafičnim vmesnikom v precej večji meri spodbuja razmišljanje o uporabljenih analizah, željo po globljem razumevanju postopkov in dejansko uporabo pridobljenih statističnih znanj (od študentov, ki smo jih učili statistiko s pomočjo programa SPSS, smo (pre)večkrat slišali, da se učijo zgolj »klikanja po programu« in ne statistike). R skozi pisanje pregledno strukturirane in dobro komentirane kode spodbuja tudi sistematičnost in natančnost ter jasno, jedrnato in razumljivo izražanje. Pričujoči priročnik ni klasičen učbenik. Kratki opisi konceptov in postopkov omogočajo razumevanje predstavljenih statističnih analiz in R-jeve kode, a le ob predpostavki, da je bralec predhodno prebral ustrezna poglavja v vsaj enem od mnogih kakovostnih statističnih učbenikov (nekateri od njih so omenjeni na koncu priročnika). Vsa glavna poglavja priročnika so strukturirana na enak način; vsako vsebuje jedrnate povzetke obravnavanih konceptov in postopkov, primere R-jevih ukazov/kode in komentarjev, naloge z rešitvami in seznam uporabljenih R-jevih funkcij. Poudariti želim, da priročnik predstavlja zgolj majhno podmnožico vseh možnih načinov izvedbe analiz in ustvarjanja grafičnih prikazov (npr. v tem priročniku se le mimogrede dotaknem izredno priljubljenega paketa ggplot2). Vsak uporabnik R-ja si s pridobivanjem izkušenj oblikuje svoj slog dela in izbira svoje načine izvajanja statističnih analiz. Bralce prosim in pozivam, da mi brez zadržkov sporočate svoje predloge za izboljšave in opozorila glede morebitnih napak in nejasnosti; pišete mi lahko na e-naslov luka.komidar@ff.uni-lj.si Nobena knjiga ne nastane brez pomoči, zato bi se na koncu iskreno zahvalil Anji Podlesek in Gregorju Sočanu za natančno branje, popravke in komentarje, Sari Seršen pa za pozoren pregled nalog in njihovih rešitev.
Opisna statistika v R-ju FINAL.indd 7
18. 06. 2021 14:39:18
Opisna statistika v R-ju FINAL.indd 8
18. 06. 2021 14:39:18
Spoznavanje R-ja in RStudia
9
Spoznavanje R-ja in RStudia
R je hkrati programski jezik in statistični paket.
Namestitev programa R Domača stran projekta R (mnogo koristnih virov in povezav): https://www.r-project.org/ Najprej je treba namestiti osnovni program R (veliko spletnih strani/zrcal): https://cloud.r-project.org/ R je na voljo za operacijske sisteme Windows, Applove operacijske sisteme in nekatere distribucije Linuxa (npr. Debian, Red Hat, openSUSE, Ubuntu). V primeru operacijskega sistema Windows izberite base, na računalnik prenesite najnovejšo stabilno različico namestitvene datoteke in namestite R.
Namestitev programa RStudio Na voljo je več različic razvojnih okolij oz. programske opreme, ki presegajo funkcionalnost programa R. V tem priročniku bomo uporabljali program RStudio, ki je na voljo za iste operacijske sisteme kot R. RStudio namestimo po predhodni namestitvi programa R. V izogib težavam pri nameščanju dodatnih paketov priporočam, da programa R in RStudio namestite z administratorskimi pravicami (po desnem kliku na namestitveno datoteko izberite možnost Zaženi kot skrbnik/Run as administrator). Domača stran RStudia: https://www.rstudio.com/ Namestitvene datoteke so tukaj (izberite RStudio Desktop Open Source Licence): https://www.rstudio.com/products/rstudio/download3/
Namestitev dodatnih paketov R je izrazito modularen program, kar pomeni, da lahko funkcionalnost, ki jo nudi osnovni program R, nadgradimo z namestitvijo dodatnih paketov. Za uporabo funkcij, uporabljenih v tem priročniku, so potrebni sledeči paketi: • car • DescTools • ggplot2 • gmodels • lmtest • MASS • mosaic • psych • vcd
Opisna statistika v R-ju FINAL.indd 9
18. 06. 2021 14:39:18
10
Opisna statistika v R-ju
Namestitev in aktivacija paketov install.packages("ime_paketa")
# to storimo samo enkrat
Dodatne pakete lahko aktiviramo vsakič znova na začetku vsake seje: library(ime_paketa)
Lahko pa v datoteko Rprofile.site (namestitveni direktorij R –> etc) dodamo funkcijo .First. Vse, kar bo vsebovala ta funkcija, se bo izvedlo ob začetku nove seje, npr.: .First <- function() { library(psych) library(gmodels) ... }
Za spreminjanje datoteke Rprofile.site potrebujemo administratorske pravice, zato je treba urejevalnik besedila, npr. Notepad++ (https://notepad-plus-plus.org/) ipd., v katerem bomo urejali to datoteko, zagnati z administratorskimi pravicami. Lahko ustvarimo tudi skripto (v urejevalniku kode oz. v oknu levo zgoraj; glej naslednje poglavje o RStudiu), ki jo shranimo in poženemo ob začetku vsake seje. V skripto nanizamo želene ukaze/ funkcije, npr.: library(vcd) library(psych) ...
Če želimo preveriti, kateri nameščeni paketi so aktivirani, uporabimo funkcijo search(). Funkcija vrne tudi seznam »pripetih« objektov (glej poglavje o podatkovnih okvirjih). Informacije o nameščenih in v trenutni seji aktiviranih paketih lahko najdemo tudi v grafičnem vmesniku RStudia, in sicer v oknu, ki se privzeto nahaja desno spodaj. Za izpis funkcij, ki jih vsebuje paket, uporabimo funkcijo: ls("package:ime_paketa")
RStudio – pregled uporabniškega vmesnika Štiri okna (opisi se nanašajo na privzete položaje oken): • levo zgoraj: − skriptno okno (zapis niza ukazov in komentarjev, ki jih lahko shranimo kot skripto) − pregled podatkov; funkcija View(ime_objekta) • levo spodaj: − konzola (vpis ukazov in njihova takojšnja izvedba, izpis besedilnih rezultatov) − obstoječe vnose in izpise v konzoli izbrišemo s Ctrl+L • desno zgoraj: − okolje (seznam in lastnosti objektov), uvoz podatkov iz drugih programov; klik na določen objekt v okolju sproži ukaz View() za ta objekt − zgodovina ukazov
Opisna statistika v R-ju FINAL.indd 10
18. 06. 2021 14:39:18
Spoznavanje R-ja in RStudia
•
11
desno spodaj: − raziskovalec direktorijev/datotek − izris slik − seznam nameščenih paketov − izpis pomoči
Pomembne tehnične značilnosti R-ja • • • • • •
R razlikuje velike in male črke (angl. case-sensitive); pomembno za vse, torej imena objektov, funkcij, datotek, direktorijev … Decimalno ločilo je pika (in ne vejica, kot predpisuje slovenski pravopis). Ukaze lahko vpisujemo v skriptno okno in jih zaganjamo s Ctrl+Enter ali s klikom na Run. Če ima skripta več ukazov/funkcij, lahko vse izvedemo s klikom na Source (ali s Ctrl+Shift+s). V konzoli se lahko s smernima tipkama (navzgor/navzdol) premikamo med že izvedenimi ukazi oz. po zgodovini ukazov. Samodokončanje imen funkcij in objektov; po začetku pisanja imena funkcije/objekta nam bo R v kontekstnem meniju ponudil možnosti, ki se začnejo na izpisan niz znakov – izbrano funkcijo/ime lahko dokončamo s pritiskom tipke Tab. Komentarje (besedilo, ki ga bo R tako v skripti kot v konzoli ignoriral) označimo z znakom #. Omogoča le enovrstične komentarje, torej moramo v primeru večvrstičnega komentarja na začetek vsake vrstice zapisati znak #.
Nastavitev delovnega direktorija Posamezne projekte (skripte, podatkovne datoteke …) je smotrno imeti v določenem direktoriju, ki ga pri ukvarjanju s trenutnim projektom nastavimo kot delovni direktorij. V zvezi z delovnim direktorijem sta na voljo dve funkciji: getwd()
# izpiše trenutno izbran delovni direktorij; delovni # direktorij je zapisan tudi v zgornji sistemski vrstici # konzole
setwd("pot do direktorija")
Pri vpisu poti do izbranega direktorija v operacijskem sistemu Windows za ločilo med direktoriji ne smemo uporabiti znaka \ (backslash; poševnica nazaj), ampak znak / (forward slash; poševnica), npr.: setwd("C:/Users/Janez Novak/R/moji projekti")
Delovni direktorij lahko nastavimo tudi prek uporabniškega vmesnika RStudia, in sicer prek menia (Session -> Set Working Directory -> Choose Directory …) ali v pregledu direktorijev/datotek v spodnjem desnem oknu. Lahko pa odpremo že obstoječo R-jevo skripto v Raziskovalcu (v sistemih Windows), pri čemer bo direktorij, v katerem se nahaja ta skripta, nastavljen kot delovni direktorij.
Opisna statistika v R-ju FINAL.indd 11
18. 06. 2021 14:39:19
12
Opisna statistika v R-ju
Objekti v R-ju Ukazi v R-ju običajno sledijo obliki: objekt <- funkcija(arg1, arg2, ...)
To pomeni, da je objekt ustvarjen na podlagi določene funkcije. Z operatorjem <- objektu priredimo vrednost(i), ki jih vrne funkcija (objektu lahko tudi neposredno priredimo določeno vred nost, npr. x <- 5). Ukaz lahko vsebuje zgolj ime funkcije in morebitne argumente, lahko pa vsebuje samo ime (že ustvarjenega) objekta, pri čemer bo izvedba takega ukaza vodila do izpisa vsebine objekta (npr. po zagonu objekta x, bo R izpisal vrednost 5). Seznam ustvarjenih objektov je prikazan v oknu desno zgoraj (zavihek Environment/Okolje), lahko jih izpišemo tudi s funkcijo ls(). Če želimo nek (ali več) objekt(ov) izbrisati, uporabimo funkcijo rm(ime_objekta); če jih brišemo več, njihova imena ločimo z vejico. Če želimo naenkrat izbrisati vse objekte v okolju, izvedemo ukaz rm(list = ls()).
Pomoč pri uporabi funkcij Če želimo izpisati pomoč za določeno funkcijo, lahko uporabimo ukaza: ?ime_funkcije # ali help(ime_funkcije)
ali v oknu, ki je privzeto desno spodaj (zavihek Help), poiščemo želeno funkcijo s pomočjo iskalnega polja. Pomoč se bo izpisala v istem oknu (desno spodaj).
Operatorji Aritmetični operatorji (osnovne računske operacije) + - * / ^ ali ** %%
# # # # # #
seštevanje odštevanje množenje deljenje potenciranje modulo (vrne ostanek po deljenju)
Prireditveni operatorji (prirejanje vrednosti objektu) <- <<=
Opisna statistika v R-ju FINAL.indd 12
# priporočen operator za prirejanje
18. 06. 2021 14:39:19
Spoznavanje R-ja in RStudia
13
Primerjalni operatorji (primerjamo dva operanda; vrne logično vrednost: TRUE/FALSE) == != > < >= <=
# # # # # #
je enako; vrne TRUE, če sta operanda enaka ni enako; vrne TRUE, če sta operanda različna večje; vrne TRUE, če je levi operand večji od desnega manjše; vrne TRUE, če je levi operand manjši od desnega večje ali enako manjše ali enako
Logični operatorji !x x | y xor(x,y)
x & y isTRUE(x)
# # # # # # # # #
logična negacija; če je x resničen (TRUE), negacija objekta x vrne FALSE (in obratno) logični ali; če je katerikoli operand resničen, vrne TRUE ekskluzivni ali; če je en od operandov resničen, drugi pa ne, vrne TRUE (če sta oba operanda TRUE ali FALSE, xor vrne FALSE) logični in; če sta oba operanda resnična, vrne TRUE funkcija, ki preveri, če je x resničen; če je resničen, vrne TRUE
Podatkovni tipi R pozna sledeče podatkovne tipe: • številski: − numeric (realna števila; cela števila in števila s plavajočo vejico); npr. 3; 24,73; –6,8 … − integer (cela števila; za eksplicitno opredelitev kot celo število pripišemo L); npr. 5L, 0L, 42L … ali ustvarimo vrednost/vektor znotraj funkcije as.integer(); − complex (kompleksna števila); npr. 4 + 2i; • character (znakovni/besedilni; v drugih jezikih/programih je ta tip običajno poimenovan string); • logical (logični); TRUE/FALSE ali v skrajšani obliki T/F. Posebne vrednosti: • NA (not available; ni na voljo); manjkajoče vrednosti; • NaN (not a number; ni število); nemogoče numerične vrednosti (npr. rezultat deljenja z 0); • NULL (prazna vrednost). Podatkovni tip objekta izpišemo s funkcijo class(ime_objekta) str(ime_objekta)
Opisna statistika v R-ju FINAL.indd 13
# ali s funkcijo ... # str (structure); ta izpiše tudi vrednosti # objekta
18. 06. 2021 14:39:19
OPISN STATI ISBN 978-961-06-0484-6
9 789610 604846
Priročnik Opisna statistika v R-ju je primarno namenjen študentom dodiplomskega študija psihologije, a je lahko koristen vir za študente kateregakoli družboslovnega študijskega programa, ki ima v predmetniku statistične predmete. Čeprav je priročnik napisan tako, da predpostavlja le minimalno predhodno znanje statistike, je namenjen tudi tistim, ki že imajo določena statistična znanja in izkušnje, a želijo začeti uporabljati program R. R je prosto dostopen in odprtokoden program za statistične analize, upravljanje s podatki in njihovo grafično predstavitev. Zaradi
Opisna_statistika_naslovka_FINAL.indd 1
svoje dostopnosti, prožnosti in neprestanega razvoja postaja vedno bolj priljubljeno statistično orodje. R je zelo primeren tudi za poučevanje statistike, saj v primerjavi s programi z razvejanim grafičnim vmesnikom v večji meri spodbuja razmišljanje o uporabljenih analizah, željo po globljem razumevanju postopkov in dejansko uporabo pridobljenih statističnih znanj. Vsako poglavje priročnika vsebuje jedrnate povzetke obravnavanih konceptov in postopkov, primere ukazov oz. kode s komentarji, naloge z rešitvami in seznam uporabljenih funkcij.
plomski in podiplomski študij psihologije na Oddelku za psihologijo FF UL. Trenutno je docent za psihološko metodologijo na Filozofski fakulteti Univerze v Ljubljani, kjer sodeluje pri izvedbi nekaterih metodoloških in statističnih predmetov v študijskih programih Psihologija, Statistika ter Humanistika in družboslovje. Njegovi raziskovalni interesi obsegajo razvoj in priredbe psiholoških testov, raziskovanje kognitivnega nadzora, razvoj in validacijo postopkov za merjenje in preučevanje raznovrstnih psiholoških pojavov s pomočjo sodobne tehnologije (igrifikacija eksperimentalnih paradigem, uporaba opreme za navidezno in obogateno resničnost), kot metodolog in statistik pa sodeluje tudi v medicinskih raziskavah ter raziskavah z drugih psiholoških področij.
LUKA KOMIDAR: OPISNA STATISTIKA V R-JU
LUKA KOMIDAR je končal dodi-
LUKA KOMIDAR
OPISNA STATISTIKA V R-JU Oddelek za psihologijo Ljubljana 2021
18. 06. 2021 12:27:48