omsl.Å forlare sosiale-09.pdf
09-12-08
14:16:16
Å forklare sosiale fenomener er en lærebok i kvantitativ kausalanalyse, særlig rettet mot videregående kurs i samfunnsvitenskap og helsefag. Boken behandler mange ulike sider ved forskningsprosessen, og består av fire hoveddeler:
CM
MY
CY
CMY
K
Ole-Jørgen Skog (f. 1946) er dr. philos. og professor i sosiologi ved Universitetet i Oslo. Han har tidligere vært professor ved Stockholms Universitet, forskningssjef ved Statens institutt for rusmiddelforskning (SIRUS) og vitenskapelig leder ved Senter for grunnforskning ved Det Norske Videnskaps-Akademi. Han har publisert et stort antall forskningsartikler i internasjonale fagtidsskrifter, særlig om epidemiologiske og avvikssosiologiske temaer, samt om teorien om rasjonelle valg.
Å FORKLARE SOSIALE FENOMENER
Y
Fremstillingen er supplert med flere utdypende og klargjørende kommentarer og med lettfattelige og pedagogisk godt tilrettelagte eksempler.
Ole-Jørgen Skog
M
www.gyldendal.no/akademisk
C
• Første del behandler epistemologiske temaer, og drøfter årsaksbegrepet og forholdet mellom kausal og intensjonal forklaring, ulike eksperimentelle og ikke-eksperimentelle forskningsdesign, samt forskjellige validitetsspørsmål. • Andre del behandler statistisk usikkerhet, og gir en enkel innføring i sannsynlighetsteori, metodene for beregning av statistiske feilmarginer (konfidensintervaller) og grunnprinsippene ved statistisk hypoteseprøving (signifikanstesting). • Tredje del gir en innføring i kausal analyse med lineære regresjonsmodeller. Fremstillingen starter med å beskrive den enkle, bivariate regresjonsmodellen og regresjonsanalysens forutsetninger. Deretter beskrives mer komplekse regresjonsmodeller med flere variabler, samt regresjonsanalyse av tidsseriedata • Fjerde del gir en innføring i en analysemetode for kvalitative data, såkalt logistisk regresjonsanalyse. Her beskrives logits, odds og oddsrater som mål for dikotome variable, den logistiske regresjonsmodellen og de forutsetninger den bygger på, samt multivariat logistisk regresjonsanalyse.
Ole-Jørgen Skog
Revidert og utvidet utgave
Å FORKLARE
SOSIALE FENOMENER En regresjonsbasert tilnærming
0000 Sosiale fenomener.book Page 11 Thursday, September 8, 2005 12:51 PM
Innhold Bokens notasjon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
Del I Kausale modeller Kapittel 1 Kausalitet i samfunnsvitenskapene . . . . . . . . . . . . . . . . . . . . . . . 1.1 1.2 1.3 1.4 1.5 1.6 1.7
Innledning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Hva er kausalitet? Forutsetter kausalitet lover? . . . . . . . . . . . . . . . . . . . . . . Regelmessigheter og tilbøyeligheter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Intensjonale og kausale forklaringer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Om det å forklare noe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Det praktisk-epistemologiske problem: å skille kausalitet fra tilfeldige sammentreff og spuriøs korrelasjon . . . . . . . . . . . . . . . . . . . . Kontrollvariabelmetoden og eksperimentell kontroll . . . . . . . . . . . . . . . .
Kapittel 2 Grunnbegreper i kausal modellering . . . . . . . . . . . . . . . . . . . . . . 2.1 Mekanismer – direkte og indirekte kausale virkninger . . . . . . . . . . . . . . . 2.2 Partielle sammenhenger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Samspill (statistisk interaksjon) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Spuriøse sammenhenger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Behovet for kvantitative analyseteknikker . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Kausaldiagrammer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Feedback og resiprok kausalitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Litteratur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Kapittel 3 Forskningsdesign . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 3.2
Innledning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tverrsnittsstudier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 21 23 28 32 34 37 41 46 46 49 51 54 58 59 64 68 69 69 71
0000 Sosiale fenomener.book Page 12 Thursday, September 8, 2005 12:51 PM
12
Å forklare sosiale fenomener
3.3 Longitudinelle studier (panelstudier) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Eksperimentelle studier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Tidsseriestudier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 Avsluttende kommentar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Litteratur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
74 78 81 86 86
Kapittel 4 Validitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
87 87 89 90 95 98 99 101 106 109 111 113 115
4.1 4.2
Innledning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Begrepsvaliditet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kriterievaliditet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Indekser og Cronbachs alpha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Påvirkningsvariabelens begrepsvaliditet . . . . . . . . . . . . . . . . . . . . . . . . Utvalgets representativitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Konklusjonsvaliditet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 Intern validitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nivåfeil-problemet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Regresjon mot gjennomsnittet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Ekstern validitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Litteratur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Del II Statistisk usikkerhet Kapittel 5 Statistiske feilmarginer: det sannsynlighetsteoretiske grunnlaget . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Kilder til slumpvariasjon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Sannsynligheter og sannsynlighetsutvalg . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Uavhengighet. Utvalg med og uten tilbakelegging . . . . . . . . . . . . . . . . . . 5.4 Binomiske forsøk med p = 0.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Standardfeilen til et estimat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6 Generelle binomiske forsøk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.7 Standardfeilen til en andel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.8 Uvanlige fenomener – standardfeilen til et antall . . . . . . . . . . . . . . . . . . . 5.9 Sammenfatning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Litteratur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
119 119 121 125 126 133 137 143 145 147 149
0000 Sosiale fenomener.book Page 13 Thursday, September 8, 2005 12:51 PM
Innhold
Kapittel 6 Konfidensintervaller, normalfordelingen og Students t-fordeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 6.1 6.2 6.3 6.4 6.5 6.6
Standard normalfordeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lineærtransformasjoner og standardskårer . . . . . . . . . . . . . . . . . . . . . . . . Grunnprinsippet for konstruksjon av et konfidensintervall . . . . . . . . . . . Students t-fordeling og konfidensintervallet for en andel . . . . . . . . . . . . . Sannsynlighetsfordeling og konfidensintervall for et aritmetisk gjennomsnitt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Gjennomsnittet når populasjonen ikke er normalfordelt: konsekvenser for sannsynlighetsfordelingen . . . . . . . . . . . . . . . . . . . . . . . .
150 155 157 162 166 170
Kapittel 7 Hypoteseprøving: t-test, kji-kvadrat og F-test . . . . . . . . . . . . . 173 7.1 Nullhypotese og alternativ hypotese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Hypoteseprøving for en korrelasjonskoeffisient. H0: r = 0 . . . . . . . . . . . . 7.3 t-test for sammenligning av to middelverdier . . . . . . . . . . . . . . . . . . . . . . . 7.4 Generelt om sammenligning av to uavhengige størrelser . . . . . . . . . . . . . 7.5 En-halet og to-halet test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.6 Kji-kvadrat-test for krysstabeller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.7 Kji-kvadrat-«goodness-of-fit»-test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.8 F-testen – variansanalyse (ANOVA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.9 Teststyrke. Feil av type I og type II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Litteratur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
173 175 180 183 185 187 193 196 207 209
Del III Lineær regresjonsanalyse Kapittel 8 Introduksjon til regresjonsanalyse . . . . . . . . . . . . . . . . . . . . . . . . 213 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9
Hva man kan oppnå med en regresjonsanalyse . . . . . . . . . . . . . . . . . . . . . Den lineære regresjonsmodellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Minste kvadratsums metode (OLS) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Hvor mye forklarer modellen – R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Konfidensintervall for parameterestimat – hypotesetesting . . . . . . . . . . . Hvis regresjonsparameteren ikke blir signifikant . . . . . . . . . . . . . . . . . . . . Prediksjon og prediksjonsfeil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Skifte av måleenhet. Standardiserte regresjonskoeffisienter . . . . . . . . . . . Nok et eksempel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
213 215 222 224 225 228 230 232 234
13
0000 Sosiale fenomener.book Page 14 Thursday, September 8, 2005 12:51 PM
14
Å forklare sosiale fenomener
Kapittel 9 Regresjonsanalysens forutsetninger . . . . . . . . . . . . . . . . . . . . . 9.1 Innledning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2 Linearitetsforutsetningen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3 Homoskedastisitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.4 Normalitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.5 Fravær av autokorrelasjon. Tidsseriedata . . . . . . . . . . . . . . . . . . . . . . . . . 9.6 Når restleddet er korrelert med den uavhengige variabelen . . . . . . . . . . 9.7 Målefeil i den avhengige variabelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.8 Målefeil i den uavhengige variabelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.9 Oppsummering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Litteratur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Kapittel 10 Multippel lineær regresjon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1 10.2 10.3
Hva man kan oppnå med en multivariat analyse . . . . . . . . . . . . . . . . . . . Tolkning og estimering av parametere i den multiple modellen . . . . . . . Eksempel: selvmord sett i lys av religiøs integrasjon og familieintegrasjon . . . . . . . . . . . . . . . . . . . . . . . . . 10.4 Sammenligning av R2 for bivariate og multiple modeller . . . . . . . . . . . . 10.5 Konsekvensen for parameterestimatet hvis man utelater en relevant uavhengig variabel . . . . . . . . . . . . . . . . . . . 10.6 Eksempel: holdninger til alkoholpolitiske restriksjoner . . . . . . . . . . . . . . 10.7 Kurvelinearitet og polynomisk regresjon . . . . . . . . . . . . . . . . . . . . . . . . . . 10.8 Faktorer som påvirker standardfeilen til parameterestimatet. Kolinearitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.9 Konsekvenser for standardfeilen hvis man utelater en relevant uavhengig variabel . . . . . . . . . . . . . . . . . . . . . . . 10.10 Sammenligning av regresjonsmodeller ved hjelp av F-testen . . . . . . . . . 10.11 F-test av kolinearitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Litteratur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Kapittel 11 Flere regresjonstemaer: samspill, dummyvariabler, stianalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1 11.2 11.3 11.4 11.5 11.6
Innledning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Samspill i lineær regresjonsanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modellering av samspill med et produktledd . . . . . . . . . . . . . . . . . . . . . . Sammenligning av modell med og uten samspillsledd . . . . . . . . . . . . . . . Andre måter å håndtere samspill på – ikke-lineære modeller . . . . . . . . . Dummyvariabler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
236 236 237 246 249 250 253 254 255 256 257 258 258 261 266 270 271 276 283 286 289 291 294 297
298 298 300 303 306 308 313
0000 Sosiale fenomener.book Page 15 Thursday, September 8, 2005 12:51 PM
Innhold
11.7 Modellering av kausale systemer: stianalyse . . . . . . . . . . . . . . . . . . . . . . . . 320 Litteratur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
Kapittel 12 Regresjonsanalyse av tidsseriedata . . . . . . . . . . . . . . . . . . . . . . 324 12.1 Innledning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2 Autokorrelasjon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.3 Konsekvenser av autokorrelasjon i restleddet . . . . . . . . . . . . . . . . . . . . . . . 12.4 Filtrering av serier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.5 Eksempel: alkohol og drukkenskapsarrestasjoner . . . . . . . . . . . . . . . . . . . 12.6 Avsluttende kommentar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Litteratur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
324 328 332 338 342 347 348
Del IV Logistisk regresjonsanalyse Kapittel 13 Grunnleggende begreper i logistisk regresjonsanalyse . . . . 351 13.1 13.2 13.3 13.4 13.5 13.6 13.7 13.8 13.9
Det spesielle med en dikotom avhengig variabel . . . . . . . . . . . . . . . . . . . . Logit-omkodingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Den logistiske regresjonsmodellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tolkningen av parameterne i logistisk regresjon: odds og oddsrater . . . . Spesialtilfellet der også den uavhengige variabelen er dikotom . . . . . . . . . Tolkningen av parameterne når den uavhengige variabelen har mange verdier . . . . . . . . . . . . . . . . . . . . . . Standardfeil og konfidensintervall for parameterne . . . . . . . . . . . . . . . . . . Hypoteseprøving . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sammenfatning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
351 354 358 361 367 369 371 373 377
Kapittel 14 Den logistiske regresjonsanalysens forutsetninger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379 14.1 14.2 14.3 14.4 14.5 14.6
Innledende beskrivelse av forutsetningene . . . . . . . . . . . . . . . . . . . . . . . . . Testing av den empiriske regresjonskurvens form . . . . . . . . . . . . . . . . . . . Når regresjonskurven avviker fra den logistiske . . . . . . . . . . . . . . . . . . . . . Tolkningen av logistiske regresjonskoeffisienter: relative versus absolutte effektmål . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tolkningen av logistiske regresjonskoeffisienter: individuelle effekter versus aggregerte konsekvenser . . . . . . . . . . . . . . . . . Sammenfatning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
379 381 385 390 393 397
15
0000 Sosiale fenomener.book Page 16 Thursday, September 8, 2005 12:51 PM
16
Ă… forklare sosiale fenomener
Kapittel 15 Multippel logistisk regresjon . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.1 Innledende beskrivelse av den multiple logistiske modellen . . . . . . . . . . 15.2 Kontroll for konfunderende faktorer i multippel logistisk regresjon . . . 15.3 Likelihood ratio-testen og kolinearitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.4 Tolkningen av samspillsledd i logistisk regresjon . . . . . . . . . . . . . . . . . . . 15.5 Ulike mĂĽl pĂĽ hvor mye de uavhengige variablene forklarer . . . . . . . . . . . 15.6 Oppsummering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Litteratur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
399 399 405 410 414 418 423 423
Stikkord . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
425
Statistiske tabeller Normalfordelingen (tabell 6.2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Students t-fordeling (tabell 6.3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kji-kvadrat-fordelingen (tabell 7.1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . F-fordelingen (tabell 7.2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
154 164 193 203