Biostatistik & epidemiologi

Page 1

BIOSTATISTIK & EPIDEMIOLOGI

Biostatistik og epidemiologi_mat_tryk.indd 1

25.02.2022 11.34


Andre bøger i serien Medicinsk Forskning Forskning i sundhed (2018) 22 temateorier til kvalitativ forskning (2022)

Biostatistik og epidemiologi_mat_tryk.indd 2

25.02.2022 11.34


BIOSTATISTIK & EPIDEMIOLOGI GRUNDBOG FOR DE SUNDHEDSVIDENSKABELIGE UDDANNELSER

Jesper Krogh, Carsten Hjorthøj, Morten Arendt Rasmussen og Simon Francis Thomsen

FADL’S FORLAG

Biostatistik og epidemiologi_mat_tryk.indd 1

25.02.2022 11.34


Biostatistik & epidemiologi Jesper Krogh, Carsten Hjorthøj, Morten Arendt Rasmussen og Simon Francis Thomsen 1. udgave, 1. oplag © FADL’s Forlag 2022 ISBN 978-87-93810-27-3 Forlagsredaktion og projektledelse: Joachim Sømark Omslag: Julie Panton Grafisk tilrettelæggelse: Kathinka Fennestad Tryk: ADverts Printed in Latvia 2022 Tak til Moises Alberto Suárez Zdunek for vurdering og review af manuskriptet. Mekanisk, fotografisk eller anden gengivelse af denne bog eller dele heraf er kun tilladt ifølge overenskomst mellem Undervisningsministeriet og Copy-Dan. Enhver anden udnyttelse uden forlagets skriftlige samtykke er forbudt ifølge gældende dansk lov om ophavsret. FADL’s Forlag Blegdamsvej 26 2200 København N Skriv til redaktion@fadlsforlag eller besøg os på fadlforlag.dk

Biostatistik og epidemiologi_mat_tryk.indd 2

25.02.2022 11.34


INDHOLD Forord

7

Type 1- og Type 2-fejl 53 Effektestimater – klinisk versus statistisk

1

signifikans

Evidensbegrebet og sundheds­videnskabelige studiedesigns 9 Evidensbegrebet i sundhedsvidenskabelig forskning

6

9

Den randomiserede kontrollerede

Chi i anden-test 69

undersøgelse

Chi i anden-test for højere ordens

12 12

tabeller 13

64

71

Chi i anden-test for trend 72 13

Logistisk regression 73

Diagnostiske studier 13

Poisson-regression

Kvalitativ forskning 14

7

77

Analyse af numeriske data T-testen

DEL 1: BIOSTATISTIK

80

80

Korrelationskoefficient

84

Lineær regression 87

Introduktion til biostatistik 20

Variansanalyse

Kontekst

Mann-Whitney-U-test

23

Samarbejde med statistiker

23

95 99

Wilcoxon signed rank-test Kruskal-Wallis-test

Deskriptiv statistik 25

100

102

Friedmans test 103

Kategoriske data 25

8

Numeriske data 27 Teoretiske fordelinger 35

Analyse af overlevelses­data 107 Hvad kan overlevelses­analyser bruges

Referenceområder og referencekurver

42

til?

Censurerede data 43

107

Censurering

108

Overlevelsestabeller og Kaplan-Meier-

Dataindsamling og databehandling

45

kurver

109

Overvejelser forud for dataindsamling 45

Cox-regression

Valg af statistikprogram 47

Immortal time bias

Indtastning og oprensning af data 47

5

63

Risiko og odds

Case-studier og ekspertvurderinger

4

Analyse af kategoriske data 63 Beregning af sandsynlighed

Case-control-studier

3

61

Det systematiske review og meta-analyse 11

Kohortestudier

2

58

Kausalitet

Test af hypoteser

50

9

112 114

Diagnostiske tests og måleusikkerhed

Statistisk inferens 50

Receiver operating characteristics

Test af hypoteser og signifikanstest 51

(ROC)

Biostatistik og epidemiologi_mat_tryk.indd 3

116

Diagnostiske tests 116 118

25.02.2022 11.34


Reproducerbarhed og måleusikkerhed

119

Regression to the mean 124

Fødselsregistret

126

179

179

Dødsårsagsregistret

10 Beregning af stikprøve­størrelse

11

Lægemiddeldatabasen

180

Cancerregistret og kliniske

Beregning af stikprøve­størrelse ved

cancerdatabaser

kontinuert effektmål i to populationer 127

Andre kliniske databaser

180

Beregning af stikprøve­størrelse ved dikotomt

Det Nationale Alkoholbehandlingsregister

effektmål i to populationer 129

og Register over Stofmisbrugere i

Beregning af stikprøve­størrelse for ændring i

Behandling

et gennemsnit i en enkelt population 129

Register over Tvang i Psykiatrien

Beregning af stikprøve­størrelse for ændring i

DREAM-databasen

frekvens i en enkelt population 130

Populationsregistre hos Danmarks

Beregning af stikprøve­størrelse, når

Statistik

effektmålet er relativ risiko 130

Regulering af og sikkerhed ved brug af de

Beregning af stikprøve­størrelse, når

danske registre til forskning 181

effektmålet er odds ratio 131

Særlige forhold ved registerforskning 181

180

180 180

181

181

Generelle betragtninger i forbindelse med

Kombination af registeroplysninger med

beregning af stikprøvestørrelse

andre data 182

132

Kombination af registre med forskellige

Eksplorativ dataanalyse og mønster­ genkendelse 134

dækningsperioder

14 Kohortestudier

Den praktiske tilgang til eksplorativ dataanalyse

135

183

186

Grundlæggende struktur i prospektive

Multivariate korrelerede data 137

kohortestudier

Populationsstratifikation

Tidsmæssig sammenhæng mellem

139

187

Mønstergenkendelse med principal

eksponering og udfald

component analysis (PCA)

Historisk prospektive kohortestudier

140

187 188

Fordele og ulemper ved kohortestudier

DEL 2: EPIDEMIOLOG 12 Introduktion til epidemiologi

15 Case-control-studier

146

Centrale epidemiologiske begreber

189

192

Grundlæggende struktur i retrospektive 146

case-control-studier

192

Intern validitet 151

Fordele og ulemper ved case-control-

Confounding

studier

Interaktion

158

169

Udvælgelse af kontrolpopulationen

Ekstern validitet 171

undersøgelse 199

177

Design af randomiserede kontrollerede

Det Centrale Personregister

177

undersøgelser

201

Landspatientregistret

177

Valg af studiepopulation 202

Sygesikringsregistret

179

Valg af effektmål 202

Biostatistik og epidemiologi_mat_tryk.indd 4

195

16 Den randomiserede kontrollerede

Hills kriterier 172

13 Registerstudier

193

25.02.2022 11.34


Randomisering Blinding

204

204

Intervention

205

Komparator Follow-up

205 206

17 Systematisk review og meta-analyse

208

Systematisk review af randomiserede kontrollerede undersøgelser 209 Meta-analyse af randomiserede kontrollerede undersøgelser 213 Systematisk review af observationelle studier

220

Meta-analyse af observationelle studier 224 GRADE-systemet

18 Missing data

224

228

Typer af missing data, og hvorfor det opstår

228

At ignorere missing data – complete case analysis

230

Last observation carried forward, baseline observation carried forward/nonresponse imputation, mean substitution og lignende

231

Missing-indicator method 233 Inverse probability weighting

234

Multiple imputationer 235 Full information maximum likelihood 238 Sensitivitetsanalyser, best- og worst-casescenarier

239

Svar på spørgsmål 241 Appendiks

254

A. Normalfordelingstabel 254 B. T-fordelingstabel 256 C. χ2-fordeling

257

Symbolforklaring og forkortelser 258 Stikordsregister 261

Biostatistik og epidemiologi_mat_tryk.indd 5

25.02.2022 11.34


FORFATTERINFO Jesper Krogh Afdelingslæge, klinisk lektor, dr.med. Afdeling for Hormon- og Stofskiftesygdomme Rigshospitalet Det Sundhedsvidenskabelige Fakultet Københavns Universitet Carsten Hjorthøj Forskningsleder, lektor, ph.d. Copenhagen Research Center for Mental Health – CORE, Psykiatrisk Center København, Region Hovedstadens Psykiatri Epidemiologisk Afdeling, Institut for Folkesundhedsvidenskab, Københavns Universitet Morten Arendt Rasmussen Associate Professor, ph.d., Msc. Dansk Børneastma Center Herlev-Gentofte Hospital Institut for Fødevarevidenskab Det Natur- og Biovidenskablige fakultet Københavns Universitet Simon Francis Thomsen Ledende overlæge, professor, dr.med., ph.d. Biomedicinsk Institut Det Sundhedsvidenskabelige Fakultet Københavns Universitet Dermato-Venerologisk Afdeling og Videncenter for Sårheling Bispebjerg Hospital

Biostatistik og epidemiologi_mat_tryk.indd 6

25.02.2022 11.34


7

FORORD Vi kan stort set ikke åbne et nyhedsmedie uden

landets universiteter, og bogens eksempler er

at blive konfronteret med udsagn hentet fra sta-

primært hentet fra den sundhedsvidenskabeli-

tistik og epidemiologi: ‘Mandlige rygere har 50 %

ge verden. De beskrevne principper er dog an-

større risiko for blodpropper’, ‘Remdesivir re-

vendelige for alle, der vil introduceres til basal

ducerer dødeligheden af svær COVID-infektion

(bio)statistik og epidemiologi, f.eks. inden for

med 10 %’ og ‘Antallet af dødfødte børn er kraf-

fag som odontologi, farmaci, humanbiologi og

tigt reduceret de sidste 10 år’. Bag udsagnene fin-

folkesundhedsvidenskab. Bogen vil også være

des ofte store videnskabelige undersøgelser, der

relevant for mange studerende i professionsud-

har indsamlet en lang række data, enten ved di-

dannelserne samt for ph.d.-studerende inden for

rekte undersøgelse af patienter og raske kontrol-

sundhedsvidenskab.

personer eller indirekte ved kobling af de mange

De fleste statistikbøger er i sagens natur ude-

registre om f.eks. danskernes årsager til hospi-

lukkende, og ikke overraskende, forfattet af sta-

talsbesøg og forbrug af lægemidler. Når data er

tistikere. Forfatterne til denne bog tæller deri-

indsamlet, skal de gøres overskuelige, håndtér-

mod en kandidat i folkesundhedsvidenskab, en

og analysérbare og på den måde hjælpe os til at

statistiker og to læger. Dette er ikke en traditio-

forstå sammenhænge mellem f.eks. adfærd og

nel sammensætning af forfattere til en bog om

sundhed.

biostatistik og epidemiologi; men det er et hold

Simpel statistik kondenserer tusinde observa-

forfattere med betydelig praktisk erfaring med

tioner til ét gennemsnit, der gør de mange data

forskning, forskningsformidling samt undervis-

håndtérbare og mulige at uddrage resultater fra.

ning af studerende fra bachelor- og kandidat- til

Tusinde observationer kan selvfølgelig ikke re-

ph.d.-niveau, hvilket vi håber, gør bogen mere

duceres til ét tal, og opgaven for forskerne består

anvendelig.

nu i at identificere variation og betydende mønstre i de tusinde observationer.

Hensigten, særligt i den statistiske del af bogen, har været at introducere læseren til stati-

Denne bog vil medvirke til dels at give læseren

stiske principper og begreber og samtidig give

en forståelse af statistikken og epidemiologiens

læseren mulighed for at udføre nogle mindre

begreber, dels at give læseren en mulighed for

og overskuelige beregninger selv. Det sidste kan

at mestre basale statistiske og epidemiologiske

måske betragtes som overflødigt, al den stund at

værktøjer til beskrivelse af egne observationer.

beregninger i praksis foretages ved hjælp af sta-

Vores håb er tillige, at læseren får en forståel-

tistikprogrammer. Imidlertid har vi en tro på, at

se af, hvornår de forskellige værktøjer anvendes

når læseren opdager, at langt de fleste af bogens

hensigtsmæssigt, hvornår de ikke skal bruges, og

eksempler kan udregnes ved brug af telefonens

ikke mindst hvilke muligheder og begrænsnin-

lommeregnerfunktion – ja, så bliver statistik må-

ger de enkelte værktøjer tilbyder til forklaringen

ske lidt mindre mystisk, og måske opnår læseren

af verden omkring os.

en større fornemmelse for og indsigt i de bereg-

Bogens målgruppe er medicinstuderende ved de sundhedsvidenskabelige fakulteter ved

Biostatistik og epidemiologi_mat_tryk.indd 7

ninger, som statistikprogrammet vanligvis serverer for os.

25.02.2022 11.34


Læring opnås bedst ved at forholde sig aktivt til stoffet. Vi opfordrer derfor læseren til dels at lave beregningerne som nævnt ovenfor og dels at give sig i kast med de spørgsmål, der er angivet efter hvert kapitel. Svarene findes bagerst i bogen. Bogens overskuelige struktur og grundige indeksering gør den velegnet som opslagsværk og kan fint støtte læseren, når statistiske og epidemiologiske begreber fra videnskabelige artikler skal læses og forstås. Bogen er opbygget, således at læseren i første del af bogen introduceres til basale statistiske begreber og analyser, som f.eks. kategorisering af data, og hvilke tests der anvendes i forskellige situationer. Den anden halvdel af bogen beskæftiger sig med epidemiologi, og her vil læseren blive præsenteret for principperne bag epidemiologisk forskning og studiedesigns. Bogen kan bruges som opslagsbog, men er statistik helt nyt for læseren, anbefales det at læse bogen kronologisk, idet en forståelse og kendskab til basale begreber ofte er nødvendigt for at forstå de senere kapitler. Det er vores håb, at læseren med denne bog vil få en større forståelse for biostatistik og epidemiologi og dermed være i stand til at forstå den videnskabelige litteratur og omsætte denne til kloge, kliniske beslutninger. Vi håber også, at læseren – med bogen i hånden – vil engagere sig i den altid nødvendige akademiske diskussion og dannelse af det fag, man nu måtte tilhøre. Ultimativt vil det naturligvis være ønskeligt, om læseren selv fik lyst til at bidrage til den videnskabelige litteratur med egne observationer, videnskabelige undersøgelser og konklusioner. Jesper Krogh Carsten Hjorthøj Morten Arendt Rasmussen Simon Francis Thomsen Foråret 2022

Biostatistik og epidemiologi_mat_tryk.indd 8

25.02.2022 11.34


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.