Bjørnar Karlsen Kivedal
Anvendt statistikk og økonometri
Grunnleggende temaer og anvendelser i Gretl og R
Anvendt statistikk og økonometri
Grunnleggende temaer og anvendelser i Gretl og R
Grunnleggendetemaerog
anvendelseriGretlogR
©Universitetsforlaget2023
ISBN978-82-15-06831-2
Materialetidenneproduksjoneneromfattetavåndsverklovensbestemmelser.Utensærskiltavtalemedrettighetshaverneerenhvereksemplarfremstillingogtilgjengeliggjøring baretillattidenutstrekningdeterhjemletilovellertillattgjennomavtalemedKopinor, interesseorganforrettighetshaveretilåndsverk.Utnyttelseistridmedlovelleravtale kanmedføreerstatningsansvaroginndragningogkanstraffesmedbøterellerfengsel.
Henvendelseromdenneutgivelsenkanrettestil:
Universitetsforlaget
Postboks508Sentrum
0105Oslo
www.universitetsforlaget.no
Omslag:SisselTjernstad/Universitetsforlaget
Ombrekkingoglayout:BjørnarKarlsenKivedal
Trykkoginnbinding:AksellAS
Bokaersattmed:ComputerModern12
Papir:90gG-print
Bokaharegennettside:www.nettressurser.no/anvendtstatistikk
Introduksjonskapitlethergirenoversiktover,ogbakgrunnfor,innholdeti boka.InestekapittelpresentererjegGretlogR,medfokuspåinstallasjon oginnlastingavdatasett,samtnoenenkleverktøyfordeskriptivstatistikk. JegvilderetterinkluderebrukavGretlogRihvertkapittelitilknytning tiltemaenesompresenteresforåvisehvordanvikangjøreulikeanalyser.
Hvertkapitteldekkerdermedulikeverktøy,derkapittel3startermed enoversiktoverrelevantgrunnleggendestatistikk,mensvigårvideremed hypotesetestikapittel4.
Ikapittel5gårvigjennomregresjonsanalyseoghvordandettekangjøres iGretlogR.Fordesomharenvissgrunnleggendekompetanseistatistikk, menønskerålæresegregresjonsanalyseog/ellerbrukavGretlogRtil regresjonsanalyse,sågårdetanågådirektetilkapittel5etteråhainstallert ogstartetGretlog/ellerRsombeskrevetikapittel2.
Ikapittel6utvidervidenenkleregresjonsmodellentilåhamedflere forklaringsvariabler.Detteførerikketilsåstoreendringeriutførelseni GretlellerR,mengjøratvimåtolkeestimatenepåennymåte.Vifårher inkludertkontrollvariabler.Detteerviktigforåforsøkeåisolereeffektene viønskeråsepå.Dersomdualleredekjennertilenkelregresjon,kandugå direktetilkapittel6.
Brukavdummyvariablerintroduseresikapittel7,noesomgjørdet muligåskillemellomulikegrupper.Viskalherberegnefasteeffekterog
interaksjonseffekter,itilleggtilåestimeresannsynlighetsmodellerforulike utfall.
Regresjonsmodellenkanogsåbrukestilåestimereikke-lineæresammenhenger.Dettekangjøresvedåtransformerevariablenevihargjennomf.eks. logaritmefunksjonerellerpolynomiskeledd.Ulikemetoderågjøredettepå presenteresikapittel8.
Ofteermaninteressertiåanalyseredatasomerobservertovertid, somf.eks.aksjepriser,utviklingisalgavetproduktellermakroøkonomiske variabler.Itidsserieanalysestøtervipånoennyeutfordringersomvibør undersøkeførvibrukerregresjonsmodellenmedtidsserievariabler.Viskal sepånoengrunnleggendetemaerogmodellerinnenfortidsserieanalysei kapittel9.
Ikapittel10servipånoenandreverktøysomoftebrukesianvendt statistikk:t-test,kjikvadrattestogvariansanalyse.Disseerikkeutvidelser avregresjonsmodellen,mensomvivilseikapitleterdetmuligågjøre tilsvarendeanalysermedregresjonsmodellen.Dettekapitletkanlesesuten forkunnskaperomregresjonsmodellen,altsådirekteetterkapittel3og4.
Viserførstkortteoretiskpådeuliketemaeneforåginødvendigbakgrunnogforankring.Iallhovedsakvilvibrukesmåeksemplermedmanuell estimeringitilleggtilanalysevedbrukavGretlogR.Datasetteneogutskriftenefraprogramvarenblirdermedmertransparente,sidendetermulig åhaoversiktoveralleobservasjonerogvariablerførmangårigangmedå jobbemedstørredatasettif.eks.oppgavenesomdufinneribokasnettressurser.
SomemneansvarligforetemneianvendtstatistikkvedHøgskoleniØstfold overmangeårharjeglengesyntesatdetharværtutfordrendeåfinne enpassendepensumbokianvendtstatistikkogøkonometriforandreårs
bachelorstudenterinnenøkonomiogadministrasjonogregnskap.Detteer enavdeavgjørendegrunnenetilatjegbestemtemegforåskrivedenne boka.Ikkebareformindel,menogsåfordegsomstudent.Deterviktigmed etlæremiddelderduintroduseresforrelevanteoganvendbareanalyse-og databehandlingsverktøysomkanbrukestilforeksempelenbacheloroppgave ellersomkanværenyttigiarbeidslivet.Jegvilpåpekeatinnholdetiboka ikkeerpåetlikeavansertnivåsomlærebøkenesomvanligvisbenyttesi økonometri-ogstatistikkemnerpåmastergradsstudier.
DennebokaleggervektpåbrukavGretlogRforågjøreanalyserog databehandling.BådeGretlogRergratis,letttilgjengeligeprogrammed åpenkildekode,ogdeerenkleåbruketilgrunnleggendeanvendtstatistikk ogøkonometri.DetgårdermedanåfølgebokaentendubrukerReller Gretl.Jeggjørogsåanalyseneibokaforhåndmedsmåeksemplerforå visedeghvaprogrammenegjør.
PånorskfinnesdetlitetilgjengeliglitteraturomGretlfratidligere,og derformenerjegatdetvardestoviktigereåbaseredeleravbokarundt denneprogramvaren.Gretltrekkesoftefremsomstatistiskprogramvare sompassergodtiundervisningssammenheng.
Itilleggkanprogrammetbrukestilmeravansertøkonometriogdatabehandlingenndetsomdekkesidenneboka.Mangeavtemaenesomdekkes iboka,kanmanbrukeMicrosoftExceltil,mensidenGretlerlagetfor anvendtstatistikkogøkonometri,såerdetmyeenklereograskereåbrukedettetilslikeanalyser.Deterogsåmuligåimporterekommandoerfra andreprogrammeringsspråksomf.eks.R,Python,Julia,OxogStata.
SelvomdetalleredefinnesflerenorskebøkersombeskrivermangeavR sinefunksjonaliteter,komjegfremtilatdetvarlikeviktigatdenneboka ogsåtarforsegdettedatabehandlingsverktøyet,iogmedatRsomprogramvarealleredeistorgradbenyttesvedmangeutdanningsinstitusjoner ogarbeidsplasser.
Bokaskjernetema,vedsidenavanvendelseridenevnteprogramvarene, erregresjonsanalyse.Kombinasjonenavregresjonsanalyseogandrestatistiskeverktøyidennebokagjøratdenbådedekkervideregåendeemneri andrestatistikkbøkersomoftebrukesinnenforbedriftsøkonomi,ogdengir enmeromfattendeinnføringiregresjonsanalyseogøkonometri.
Gretl(GnuRegression,EconometricsandTime-seriesLibrary)erenprogramvaremedåpenkildekode,slikatdukanbrukeprogrammetuavhengig avhvaslagsinnkjøpsavtalehøyskolen,universitetetellerarbeidsgiverendin har.MestsannsynligharduriktignoktilgangtilMicrsoftExcel,derdukan gjøremyeavdetsomvilpresenteresmedGretlidenneboka,menExcel egnersegbestfordeallermestgrunnleggendegjøremålene.ItilleggerGretl lagetforåarbeidemednettoppøkonometrioganvendtstatistikk,slikat detsomregelgårraskereåbrukeGretlselvtilenkleoppgaver.Syntaksen vilogsåværeforskjelligiExcelavhengigavomdubrukerengelskeller norskversjonavprogrammet,noesomkangjørearbeidetvanskeligereom dueksempelvisharenannenspråkversjonavExcelinstallertennforeleserenellerkollegenedine.DenautomatiskeformateringeniExcelkanogså bypåproblemernårvianalysererdatasett.
Datasettetsombrukestilregresjonsanalysensomutgjørstoredelerav boka,eretlitekonstruertdatasettmedkunåtteobservasjoner.Dettegjør atviitilleggtilågjøreanalyseriGretlkanberegnemyemanuelt,noesom gjørdetlettereforossåsesammenhengenmellomdatasettetoghvaGretl faktiskgjør.
Gretlergratisogmedåpenkildekode,ogkanlastesnedfra http://gretl.
sourceforge.net/.DetfinnesversjonerbådetilWindows,MacOSXog
Linux.SkjermbildeneogbeskrivelseneidennebokaertattfraWindows, menprogrammetfungererpåsammemåteforandreoperativsystem.
EtteratduharinstallertGretlogåpnetprogrammet,vildetseslikut:
Dettevilherrefererestilsom hovedvinduet iGretl,sidenmanogsåfår oppmangeandrevinduervedulikeberegningerogestimeringer.Idette hovedvinduetvilvihaoversiktovervariableneidatasettetvårt.Laosssiat viharetutvalgpååttepersoner, i 1,..., 8,dervikjennerlønnsinntekten måltitusenkroner Yi ogutdanningmåltiantallårettervideregåendeskole Xi .Dettegiråtteobservasjonspar:
Tabell2.1:Lønnogutdanningforåttepersoner
12345678
23155475
Denførstepersoneniutvalget(i 1)tjeneraltså320000kroneroghar toårsutdanningettervideregåendeskole,menspersonnrfemharfemårs utdanningettervideregåendeogtjener650000kroner.
DukanlasteinndataiGretlpåfleremåter.Forsmådatasetteller dersomviselvsamlerinndatamanuelt,kanviskriveinndataenedirekte iGretlvedåvelge File>Newdataset ihovedvinduet.
Vikanåpnedataenevihariendatafil,somf.eks.engdt-fil(Gretldatasett),enExcel-fil(xlsellerxslx)ellerfraandrefilformatsomstøttes.Dette
kangjøresvia File>Opendata>Userfile....Derettermåvivelge filformatdersomviåpnernoeannetennengdt-fil.
Etteratdataene(detovariablenelønnogutdanning)erlastetinn,ser hovedvinduetiGretlslikut:
Vedåklikkepåenavvariablene(ellermarkerebegge)kanvif.eks.gåtil Data>Displayvalues påverktøymenyenforåseobservasjoneneslikde serutif.eks.Excel,somvistifigur2.6.Vikanogsåendrenavneteller beskrivelsentilvariabelenvedågåtil Variable>Editattributes.
ItilleggkanvieksportereetdatasetttilenfilsomkanåpnesiExcelved åvelge File>Exportdata.Vikandavelgevariableneviønskerålagre (All-> foråhamedalle)somvistifigur2.7.Velgf.eks.formatCSV (CommaSeparatedValue),somkanåpnesdirekteiExcelellerandreprogram.Deretterkanvivelge semicolon som separatorfordatacolumns og comma som decimalpointcharacter,noesompasserbestmednye norskeversjoneravExcel.
Vikanlageetspredningsplottvedåklikkepådenmarkerteknappensom liggersomnrfirefrahøyre(X-Ygraph)idennedreverktøylinjenihovedvinduet:
Derkanvif.eks.velgeutdanningpåx-aksen(denhorisontaleaksen)og lønnpåy-aksen(denvertikaleaksen).Vifårdaoppetvindumedspredningsplottetmellomdetovariablene:
Ispredningsplottetviserdesmåsirklenehvertobservasjonsparogdenrette linjaerregresjonslinja(meromdenneikapittel5)medtilhørendeligning øversttilvenstreifiguren.Regresjonslinjakanfjernesvedåhøyreklikkepå figurenogvelge Edit,ogvelge none under fittedline slikatvikunfår etrentspredningsplott.Vikanogsåendrehvordanobservasjoneneskalse utidennemenyen.
Dennefigurenkanlagressometbildeellerkopieresoglimesinnietdokument.Vedåhøyreklikkepåbildetfårvifremvalgene.
GjennomGretlerdettilgangtilmangedatasettsombrukessomeksempeldataiulikeøkonometrilærebøker.Vedågåtil Opendata>Sample file... erdetalleredenoenfanersomindikerergruppermedtilgjengelige datasett(Gretl,GreeneogKoop).Ifanen Gretl erdetnoenulikedatasett kjentfradiverselitteratur,sefigur2.11,mens Greene og Koop inneholder datasettbrukthhv.ilærebøkeneEconometricAnalysis(Greene,2003)og AnalysisofEconomicData(Koop,2013).
Itilleggkanmanklikkepå Lookonserver (tredjeknappivinduet)for ålasteneddatasettfraandrelærebøker.Dettekanværenyttigforåreplikereeksempleroggjøreoppgaverfradissebøkene.Se https://gretl. sourceforge.net/gretl_data.html forenoversiktoverhvasomertilgjengelig.Dissedatasetteteneerogsåoftetilgjengeligepåderespektive lærebøkeneshjemmesider,menviamenyeniGretlerdetmuligååpnede
direkteiGretl.Mangeavoppgavenetilhørendekapitleneibokaherer konstruertbasertpådatafraulikedatasettherfra.
RerilikhetmedGretlgratisogåpenkildekode.Selvommankanlaste nedRfraf.eks. https://www.r-project.org/ ogbrukeRdirekte,såer detoftevanligåbruke RStudio,lagetavPosit,sometgrensesnittforR. RStudioerikkeetgrafiskgrensesnittsomGretl,selvomdeterenkelte menyersomgjøredetlettereåbrukenoenfunksjoner.
DetfinnesmyelitteraturombrukavRbådepånorskogengelsk.Både forgrunnleggendefunksjonerogmeravanserteanalyser.Likevelerfokuset idennebokalagtopptilengrunnleggendeinnføringforenkletemaerinnen anvendtstatistikkogøkonometri.DetermangeulikemåteråbrukerR pågjennomuliketilleggspakkerogfunksjoner.Jegvilsålangtdetlarseg gjøreforsøkeåbrukedeinnebygdefunksjoneneiRsomikkekreveratman installererekstrapakkeriR(selvomdetteisegselverveldigenkeltå gjøre).
ForåbrukeRStudio,somdetvilværefokuspåidenneboka,såmåførstR installeressomnevntiforrigeavsnitt.DeretterkanRStudiolastesnedog installeres,f.eks.fra https://posit.co/downloads/.Dersomduallerede harRinstallertfratidligere,børduoppdateretilnyesteversjonførdugår videre.
EtteråhainstallertRStudiovilvifåoppvinduetvistiFigur2.12(avhengig avhvilkenversjonvihar).
Etteroppstartharvitrepanelersombrukes.Tilvenstreligger“Console”, somerområdetdervikanskrivekode.Øversttilhøyrefinnerviblant annet“Environment”,somvilvisevariablerellerandreobjektersomvi jobbermed,ognedersttilhøyrevilf.eks.figurervisesunderfanen“Plots”.
Enstorfordelvedåbrukeetkommandobasertprogramerimidlertidat vikanlagrealtvigjørforåletterebevarehistorikkenogforåreplikere resultatenevåre.Dettekangjøresvedåhaet skript.Vedågåtil File>
NewFile>Rscript fårvioppetnyttvinduøversttilvenstresomgiret tomtdokument,seFigur2.13.Detteerskriptetdervikanskriveinnkode ellerkommandoer.Fortrinnsvisenkommandoforhverlinje.Detteskriptet kanvilagrevedåf.eks.trykke Ctrl+S.
VikandaskriveR-koderiRStudiovedåfylleoppskript-filen(somnormalt harfiletternavnet R).
DeterfleremåteråbrukeRpå,oghervilvivisenoenenkleberegninger foråillustrerehvordanvariablerogobjekterbrukesiRsomvikanfåbruk forsenere.Vikanf.eks.definerevariabelen x somerlik2,vedåskrive x <-2 ogbrukedettetilålagevariabelen y somergittsom y 2x 3som hvis x 2blir y 7vedåskrive y<-2*x+3.Vikanskrivedettesomto linjeriskriptvinduet.Deretterkanviklikkepå Run forhverlinje,trykke Ctrl+Enter påhverlinjeellermarkerebeggelinjeneogderetterklikkepå
Run ellertrykke Ctrl+Enter.Vifårdautatxer2ogyer7ivinduet
“Values”somvistiFigur2.14
Denne boka tar studenten et steg videre i statistikkfaget. Hovedfokuset gjennom boka er grunnleggende regresjonsanalyse og legger vekt på bruk av Gretl og R for å gjøre analyser og databehandling. Boka fungerer derfor også godt som en innføring i disse programvarene.
Anvendt statistikk og økonometri er skrevet for studenter innen samfunnsøkonomi og økonomi og administrasjon, og passer særlig godt for de som tidligere har hatt grunnleggende fag innen matematikk og statistikk på bachelornivå. De viktigste elementene fra matematikk og statistikk blir repetert for å gjøre framstillingen enklere, slik at stoffet også er tilgjengelig for personer uten store forkunnskaper på feltet. Boka egner seg også godt til kurs knyttet til videreutdanning i kvantitative metoder og i arbeidslivet.
Boka har egen nettside der du finner oppgaver, løsningsforslag og datasett.
www.nettressurser.no/anvendtstatistikk
Bjørnar Karlsen Kivedal har en doktorgrad i samfunnsøkonomi fra NTNU og er førsteamanuensis ved Høgskolen i Østfold.
ISBN 978-82-15-06831-2