BIOSTATISTIK & EPIDEMIOLOGI
Biostatistik og epidemiologi_mat_tryk.indd 1
25.02.2022 11.34
Andre bøger i serien Medicinsk Forskning Forskning i sundhed (2018) 22 temateorier til kvalitativ forskning (2022)
Biostatistik og epidemiologi_mat_tryk.indd 2
25.02.2022 11.34
BIOSTATISTIK & EPIDEMIOLOGI GRUNDBOG FOR DE SUNDHEDSVIDENSKABELIGE UDDANNELSER
Jesper Krogh, Carsten Hjorthøj, Morten Arendt Rasmussen og Simon Francis Thomsen
FADL’S FORLAG
Biostatistik og epidemiologi_mat_tryk.indd 1
25.02.2022 11.34
Biostatistik & epidemiologi Jesper Krogh, Carsten Hjorthøj, Morten Arendt Rasmussen og Simon Francis Thomsen 1. udgave, 1. oplag © FADL’s Forlag 2022 ISBN 978-87-93810-27-3 Forlagsredaktion og projektledelse: Joachim Sømark Omslag: Julie Panton Grafisk tilrettelæggelse: Kathinka Fennestad Tryk: ADverts Printed in Latvia 2022 Tak til Moises Alberto Suárez Zdunek for vurdering og review af manuskriptet. Mekanisk, fotografisk eller anden gengivelse af denne bog eller dele heraf er kun tilladt ifølge overenskomst mellem Undervisningsministeriet og Copy-Dan. Enhver anden udnyttelse uden forlagets skriftlige samtykke er forbudt ifølge gældende dansk lov om ophavsret. FADL’s Forlag Blegdamsvej 26 2200 København N Skriv til redaktion@fadlsforlag eller besøg os på fadlforlag.dk
Biostatistik og epidemiologi_mat_tryk.indd 2
25.02.2022 11.34
INDHOLD Forord
7
Type 1- og Type 2-fejl 53 Effektestimater – klinisk versus statistisk
1
signifikans
Evidensbegrebet og sundhedsvidenskabelige studiedesigns 9 Evidensbegrebet i sundhedsvidenskabelig forskning
6
9
Den randomiserede kontrollerede
Chi i anden-test 69
undersøgelse
Chi i anden-test for højere ordens
12 12
tabeller 13
64
71
Chi i anden-test for trend 72 13
Logistisk regression 73
Diagnostiske studier 13
Poisson-regression
Kvalitativ forskning 14
7
77
Analyse af numeriske data T-testen
DEL 1: BIOSTATISTIK
80
80
Korrelationskoefficient
84
Lineær regression 87
Introduktion til biostatistik 20
Variansanalyse
Kontekst
Mann-Whitney-U-test
23
Samarbejde med statistiker
23
95 99
Wilcoxon signed rank-test Kruskal-Wallis-test
Deskriptiv statistik 25
100
102
Friedmans test 103
Kategoriske data 25
8
Numeriske data 27 Teoretiske fordelinger 35
Analyse af overlevelsesdata 107 Hvad kan overlevelsesanalyser bruges
Referenceområder og referencekurver
42
til?
Censurerede data 43
107
Censurering
108
Overlevelsestabeller og Kaplan-Meier-
Dataindsamling og databehandling
45
kurver
109
Overvejelser forud for dataindsamling 45
Cox-regression
Valg af statistikprogram 47
Immortal time bias
Indtastning og oprensning af data 47
5
63
Risiko og odds
Case-studier og ekspertvurderinger
4
Analyse af kategoriske data 63 Beregning af sandsynlighed
Case-control-studier
3
61
Det systematiske review og meta-analyse 11
Kohortestudier
2
58
Kausalitet
Test af hypoteser
50
9
112 114
Diagnostiske tests og måleusikkerhed
Statistisk inferens 50
Receiver operating characteristics
Test af hypoteser og signifikanstest 51
(ROC)
Biostatistik og epidemiologi_mat_tryk.indd 3
116
Diagnostiske tests 116 118
25.02.2022 11.34
Reproducerbarhed og måleusikkerhed
119
Regression to the mean 124
Fødselsregistret
126
179
179
Dødsårsagsregistret
10 Beregning af stikprøvestørrelse
11
Lægemiddeldatabasen
180
Cancerregistret og kliniske
Beregning af stikprøvestørrelse ved
cancerdatabaser
kontinuert effektmål i to populationer 127
Andre kliniske databaser
180
Beregning af stikprøvestørrelse ved dikotomt
Det Nationale Alkoholbehandlingsregister
effektmål i to populationer 129
og Register over Stofmisbrugere i
Beregning af stikprøvestørrelse for ændring i
Behandling
et gennemsnit i en enkelt population 129
Register over Tvang i Psykiatrien
Beregning af stikprøvestørrelse for ændring i
DREAM-databasen
frekvens i en enkelt population 130
Populationsregistre hos Danmarks
Beregning af stikprøvestørrelse, når
Statistik
effektmålet er relativ risiko 130
Regulering af og sikkerhed ved brug af de
Beregning af stikprøvestørrelse, når
danske registre til forskning 181
effektmålet er odds ratio 131
Særlige forhold ved registerforskning 181
180
180 180
181
181
Generelle betragtninger i forbindelse med
Kombination af registeroplysninger med
beregning af stikprøvestørrelse
andre data 182
132
Kombination af registre med forskellige
Eksplorativ dataanalyse og mønster genkendelse 134
dækningsperioder
14 Kohortestudier
Den praktiske tilgang til eksplorativ dataanalyse
135
183
186
Grundlæggende struktur i prospektive
Multivariate korrelerede data 137
kohortestudier
Populationsstratifikation
Tidsmæssig sammenhæng mellem
139
187
Mønstergenkendelse med principal
eksponering og udfald
component analysis (PCA)
Historisk prospektive kohortestudier
140
187 188
Fordele og ulemper ved kohortestudier
DEL 2: EPIDEMIOLOG 12 Introduktion til epidemiologi
15 Case-control-studier
146
Centrale epidemiologiske begreber
189
192
Grundlæggende struktur i retrospektive 146
case-control-studier
192
Intern validitet 151
Fordele og ulemper ved case-control-
Confounding
studier
Interaktion
158
169
Udvælgelse af kontrolpopulationen
Ekstern validitet 171
undersøgelse 199
177
Design af randomiserede kontrollerede
Det Centrale Personregister
177
undersøgelser
201
Landspatientregistret
177
Valg af studiepopulation 202
Sygesikringsregistret
179
Valg af effektmål 202
Biostatistik og epidemiologi_mat_tryk.indd 4
195
16 Den randomiserede kontrollerede
Hills kriterier 172
13 Registerstudier
193
25.02.2022 11.34
Randomisering Blinding
204
204
Intervention
205
Komparator Follow-up
205 206
17 Systematisk review og meta-analyse
208
Systematisk review af randomiserede kontrollerede undersøgelser 209 Meta-analyse af randomiserede kontrollerede undersøgelser 213 Systematisk review af observationelle studier
220
Meta-analyse af observationelle studier 224 GRADE-systemet
18 Missing data
224
228
Typer af missing data, og hvorfor det opstår
228
At ignorere missing data – complete case analysis
230
Last observation carried forward, baseline observation carried forward/nonresponse imputation, mean substitution og lignende
231
Missing-indicator method 233 Inverse probability weighting
234
Multiple imputationer 235 Full information maximum likelihood 238 Sensitivitetsanalyser, best- og worst-casescenarier
239
Svar på spørgsmål 241 Appendiks
254
A. Normalfordelingstabel 254 B. T-fordelingstabel 256 C. χ2-fordeling
257
Symbolforklaring og forkortelser 258 Stikordsregister 261
Biostatistik og epidemiologi_mat_tryk.indd 5
25.02.2022 11.34
FORFATTERINFO Jesper Krogh Afdelingslæge, klinisk lektor, dr.med. Afdeling for Hormon- og Stofskiftesygdomme Rigshospitalet Det Sundhedsvidenskabelige Fakultet Københavns Universitet Carsten Hjorthøj Forskningsleder, lektor, ph.d. Copenhagen Research Center for Mental Health – CORE, Psykiatrisk Center København, Region Hovedstadens Psykiatri Epidemiologisk Afdeling, Institut for Folkesundhedsvidenskab, Københavns Universitet Morten Arendt Rasmussen Associate Professor, ph.d., Msc. Dansk Børneastma Center Herlev-Gentofte Hospital Institut for Fødevarevidenskab Det Natur- og Biovidenskablige fakultet Københavns Universitet Simon Francis Thomsen Ledende overlæge, professor, dr.med., ph.d. Biomedicinsk Institut Det Sundhedsvidenskabelige Fakultet Københavns Universitet Dermato-Venerologisk Afdeling og Videncenter for Sårheling Bispebjerg Hospital
Biostatistik og epidemiologi_mat_tryk.indd 6
25.02.2022 11.34
7
FORORD Vi kan stort set ikke åbne et nyhedsmedie uden
landets universiteter, og bogens eksempler er
at blive konfronteret med udsagn hentet fra sta-
primært hentet fra den sundhedsvidenskabeli-
tistik og epidemiologi: ‘Mandlige rygere har 50 %
ge verden. De beskrevne principper er dog an-
større risiko for blodpropper’, ‘Remdesivir re-
vendelige for alle, der vil introduceres til basal
ducerer dødeligheden af svær COVID-infektion
(bio)statistik og epidemiologi, f.eks. inden for
med 10 %’ og ‘Antallet af dødfødte børn er kraf-
fag som odontologi, farmaci, humanbiologi og
tigt reduceret de sidste 10 år’. Bag udsagnene fin-
folkesundhedsvidenskab. Bogen vil også være
des ofte store videnskabelige undersøgelser, der
relevant for mange studerende i professionsud-
har indsamlet en lang række data, enten ved di-
dannelserne samt for ph.d.-studerende inden for
rekte undersøgelse af patienter og raske kontrol-
sundhedsvidenskab.
personer eller indirekte ved kobling af de mange
De fleste statistikbøger er i sagens natur ude-
registre om f.eks. danskernes årsager til hospi-
lukkende, og ikke overraskende, forfattet af sta-
talsbesøg og forbrug af lægemidler. Når data er
tistikere. Forfatterne til denne bog tæller deri-
indsamlet, skal de gøres overskuelige, håndtér-
mod en kandidat i folkesundhedsvidenskab, en
og analysérbare og på den måde hjælpe os til at
statistiker og to læger. Dette er ikke en traditio-
forstå sammenhænge mellem f.eks. adfærd og
nel sammensætning af forfattere til en bog om
sundhed.
biostatistik og epidemiologi; men det er et hold
Simpel statistik kondenserer tusinde observa-
forfattere med betydelig praktisk erfaring med
tioner til ét gennemsnit, der gør de mange data
forskning, forskningsformidling samt undervis-
håndtérbare og mulige at uddrage resultater fra.
ning af studerende fra bachelor- og kandidat- til
Tusinde observationer kan selvfølgelig ikke re-
ph.d.-niveau, hvilket vi håber, gør bogen mere
duceres til ét tal, og opgaven for forskerne består
anvendelig.
nu i at identificere variation og betydende mønstre i de tusinde observationer.
Hensigten, særligt i den statistiske del af bogen, har været at introducere læseren til stati-
Denne bog vil medvirke til dels at give læseren
stiske principper og begreber og samtidig give
en forståelse af statistikken og epidemiologiens
læseren mulighed for at udføre nogle mindre
begreber, dels at give læseren en mulighed for
og overskuelige beregninger selv. Det sidste kan
at mestre basale statistiske og epidemiologiske
måske betragtes som overflødigt, al den stund at
værktøjer til beskrivelse af egne observationer.
beregninger i praksis foretages ved hjælp af sta-
Vores håb er tillige, at læseren får en forståel-
tistikprogrammer. Imidlertid har vi en tro på, at
se af, hvornår de forskellige værktøjer anvendes
når læseren opdager, at langt de fleste af bogens
hensigtsmæssigt, hvornår de ikke skal bruges, og
eksempler kan udregnes ved brug af telefonens
ikke mindst hvilke muligheder og begrænsnin-
lommeregnerfunktion – ja, så bliver statistik må-
ger de enkelte værktøjer tilbyder til forklaringen
ske lidt mindre mystisk, og måske opnår læseren
af verden omkring os.
en større fornemmelse for og indsigt i de bereg-
Bogens målgruppe er medicinstuderende ved de sundhedsvidenskabelige fakulteter ved
Biostatistik og epidemiologi_mat_tryk.indd 7
ninger, som statistikprogrammet vanligvis serverer for os.
25.02.2022 11.34
Læring opnås bedst ved at forholde sig aktivt til stoffet. Vi opfordrer derfor læseren til dels at lave beregningerne som nævnt ovenfor og dels at give sig i kast med de spørgsmål, der er angivet efter hvert kapitel. Svarene findes bagerst i bogen. Bogens overskuelige struktur og grundige indeksering gør den velegnet som opslagsværk og kan fint støtte læseren, når statistiske og epidemiologiske begreber fra videnskabelige artikler skal læses og forstås. Bogen er opbygget, således at læseren i første del af bogen introduceres til basale statistiske begreber og analyser, som f.eks. kategorisering af data, og hvilke tests der anvendes i forskellige situationer. Den anden halvdel af bogen beskæftiger sig med epidemiologi, og her vil læseren blive præsenteret for principperne bag epidemiologisk forskning og studiedesigns. Bogen kan bruges som opslagsbog, men er statistik helt nyt for læseren, anbefales det at læse bogen kronologisk, idet en forståelse og kendskab til basale begreber ofte er nødvendigt for at forstå de senere kapitler. Det er vores håb, at læseren med denne bog vil få en større forståelse for biostatistik og epidemiologi og dermed være i stand til at forstå den videnskabelige litteratur og omsætte denne til kloge, kliniske beslutninger. Vi håber også, at læseren – med bogen i hånden – vil engagere sig i den altid nødvendige akademiske diskussion og dannelse af det fag, man nu måtte tilhøre. Ultimativt vil det naturligvis være ønskeligt, om læseren selv fik lyst til at bidrage til den videnskabelige litteratur med egne observationer, videnskabelige undersøgelser og konklusioner. Jesper Krogh Carsten Hjorthøj Morten Arendt Rasmussen Simon Francis Thomsen Foråret 2022
Biostatistik og epidemiologi_mat_tryk.indd 8
25.02.2022 11.34