Livet på den anden side - Fra fysikstuderende til statistikkens 'lille hjælper'

Page 1


Livet på den aNden side - Fra fysikstuderende til statistikkens ’Lille Hjælper’ Af Lars Hervig Jacobsen

S

å jeg havde sat mig for at blive fysiker eller dø i forsøget. Og da jeg havde regnet med det sidste, var det lidt overraskende, da jeg pludselig stod med et fint eksamensbevis i hånden og skulle finde ud af, hvad der skulle ske herefter. Jeg er ikke typen, der planlægger, og da slet ikke et liv efter døden, så det var på ingen måde afklaret, hvilken modtageradresse jeg skulle skrive på mine jobaansøgninger. Søgningsresultatet på jobindex.dk pegede i retning af “lagermedarbejder med god fysik”, men den type job stod allerede på mit CV, og jeg havde appetit efter noget nyt. Rygtet er sandt. Så snart man har ‘fysiker’ tatoveret på overarmen, kan man ikke stå i kø i Fakta uden at få tilbudt et gymnasiejob, og jeg havde med frygt og bæveren og en god portion dårlig samvittighed afslået et par stykker. Mest af alt, fordi jeg ikke rigtig vidste, hvad jobbet indebar. Det kan lyde underligt, i og med at jeg engang har været der som elev, men under et af jobinterviewene lagde de vægt på, at jeg helst ikke måtte bruge ligninger. Min fantasi rakte ikke til, hvordan jeg skulle mime Newtons love, så jeg søgte videre. I stedet valgte jeg at fokusere lidt mere på de kompetencer, der gemmer sig under titlen Cand. Scient. fysik og de områder indenfor matematisk modellering, som jeg af ren nysgerrighed havde forvildet mig ud i undervejs i mit studie. I sidste ende var det formentlig en kombination af nogle gode resultater indenfor statistisk fysik, samt et speciale der essentielt omhandlede en Bayesiansk tilgang til tidsserieanalyse, der gjorde, at Danmarks Statistik (DST) fik øjnene op for min ansøgning. Jeg har nu været ansat i lidt over et år ved sektionen for Statistisk Metode, der er en delafdeling for Forskning og Metode, DST. Statistisk Metode består af i alt 8 medarbejdere

96

Hjerneblod l

3/2014

ud af de ca. 500 medarbejdere, der holder til i en murstensfæstning i omegnen af Østerbro. Mine primære arbejdsopgaver består af stikprøve-allokering og opregning. Eller det er i hvert fald, hvad min kontrakt beskriver, men et hurtigt tilbageblik afslører, at jeg nok har brugt halvdelen af tiden på opgaver, der hører ind under kategorien “andre statistiske metoder”. Mere om det senere.

So welcome to the machine

Statistiker siger du? Ja, nu er der nok nogen, der tænker, at jeg har gjort det for pengenes skyld, eller den utæmmelige vildskab, man er i stand til at tænde i enhver kvindes øjne, når man hvisker det til hende på dansegulvet en fredag aften. Men begge er blot en sidegevinst. Min indgangsvinkel har været mere eventyrlysten; gad vide, hvad de egentlige laver derinde? Og du har sikkert gættet rigtigt: overlappet mellem de matematiske metoder, jeg har lært under fysikstudiet, og dem jeg anvender nu, er til at overse. Det har været nødvendigt med en grundig oplæring, både når det kom til den statistiske metode, men også det software, som man anvender til at udføre beregningerne i. Som fysikerstuderende er man typisk skolet i Matlab, og hvis man har haft statistikkurser, er det typisk R, der er blevet anvendt. I DST anvendes SAS, og det kræver nogen tilvænning. I starten er det lidt ligesom at spille fodbold iført badesandaler. Spillets regler er de samme, og det er ikke svært at gennemskue, hvor man gerne vil hen, men man er lidt hæmmet i udførelsen. Sagen er den, at når det kommer til erhvervslivet, så har SAS et fast greb om statistikproduktionens ædlere dele og med


Lars Hervig Jacobsen er 32 år gammel. Lars tog sin bachelor i fysik på RUC og efterfølgende sin kandidat på SDU. Lars arbejder nu for Danmarks Statistik.

97


en god portion kundepleje, samt udsigten til rigtig mange arbejdstimer ved indfasning af ny software, så forbliver det sådan. Jeg må dog indrømme, at efter lidt tilvænning, så er programmet velegnet til nogle af arbejdsopgaverne, især når det drejer sig om at håndtere store datamængder, men når det kommer til matrixoperationer og løkkestrukturer, er det lidt udfordret.

Jeg tror, de glemte rusturen

I har sikkert hørt talemåden: at man som nyuddannet ikke er færdiguddannet, og det bliver selvfølgelig mere aktuelt, når man vover pelsen og bevæger sig udenfor sine vante folder. Ved ansættelsen har jeg i høj grad haft fornemmelsen af at være startet på en ny uddannelse, hvor man trækker på de erfaringer, man har gjort sig omkring det at indhente ny viden, men ellers er man på bar bund. Jeg har nu været igennem en bunke interne kurser, der afholdes på DST for at komme op på niveau, samt et par eksterne, blandt andet i stikprøveteori på polit-uddannelsen på KU. Mantraet lyder: hvis du kan finde et kursus, der er relevant for det, vi

98

Hjerneblod l

3/2014

laver i DST, så tilmeld dig det, og vi betaler. Det skal dog siges, at mængden af arbejdsopgaver, der havner på ens bord ikke nødvendigvis bliver mindre af, at man følger kurser, og derfor sker der en helt naturlig begrænsning på, hvad man tilmelder sig. Ja, fuldtidsstuderende er meget privilegerede. Netop nu har jeg afsluttet et kursus i sæsonkorrektion, der omhandlede metoder til, hvordan man kan fjerne sæsoneffekter fra tidsserier. Jeg er ret imponeret. Mindes ikke, at jeg nogensinde har fået så mange penge for at lære noget nyt.

Stikprøver og alt det jazz

Slagets gang ved en typisk arbejdsopgave forløber ved, at jeg har et møde med en eller flere statistikansvarlige fra en given afdeling i huset. De fortæller lidt om statistikken, populationen (i.e. afgrænsningen af enheder, der indgår i tællingen), stikprøvestørrelse, hvilket niveau resultaterne skal publiceres på osv. Herefter får jeg overleveret et datasæt med populationen, hvorudfra stikprøven skal trækkes. Dette gøres med henblik på at minimere stikprøvestør-


relsen, men samtidig således der er en fornuftig dækningsgrad. Herved anvendes typisk stratifikation, hvorved enheder der “ligner” hinanden grupperes, således at variansen på udvalgte interessevariable indenfor strata minimeres, mens variansen mellem strata maksimeres. Eksempler på stratifikationsvariable i tilfælde af virksomhedsstikprøver kan være branche, omsætning eller antal ansatte. Herefter udvælges et antal enheder indenfor hvert stratum, typisk ved simple tilfældig udvælgelse, og hvor antallet per stratum er propotionel med antallet af enheder eller spredningen i det pågældende stratum. De heldige vindere, får tilsendt et spørgeskema, og deres besvarelser kommer til at opregne for de enheder, som ikke indgik i stikprøven. Det opregnede estimat publiceres med en stikprøveusikkerhed, der er proportionel med stikprøvens størrelse i forhold til populationen, samt variansen af de indsamlede data. Sammenlignet med de kollapsede bølgefunktioner, komplekse algoritmer og det mangedimensionelle univers man har vandret rundt i i løbet af fysikstudiet, så er det teoretiske fundament mere ligetil her. Ofte er det dog mødet med virkeligheden, der gør det svært, så som skævt bortfald i stikprøven, hvor en særlig gruppe af virksomheder/individer ikke har valgt at indberette. Men når det er sagt, så kan man godt krydre det med panel-strukturer og optimeringsmetoder, og straks bliver det mere sexet. I den forbindelse, stødte jeg her den anden dag på en gammel kending, som jeg stiftede bekendskab til under mit speciale. En MCMC algoritme, Simulated Annealing, der netop kan implementeres til formål, at optimere på stikprøvedesignet. Så der er tid til at forske lidt, men selvfølgelig er man forpligtet til at producere og overholde deadlines. Af de “andre statistiske metoder”, som jeg nævnte tidligere, hører de fleste til gruppen af Generaliserede Lineære Modeller. Eksempelvis har jeg deltaget i et pilotprojekt omhandlende Propensity Score Matching, der essentielt er en metode til at beskære en population, således at man har en kontrolgruppe, der er sammenlignelig med en behandlingsgruppe. I dette tilfælde var behandlingsgruppen en gruppe elever, der havde modtaget mentorvejledning under uddannelse, og man ønskede da at finde ud af, om de havde større sandsynlighed for at gennemføre uddannelsen i forhold til elever, der ikke havde fået tildelt en mentor. Den underliggende matematik er logistisk regression analyse, hvori

der indgår udvalgte forklarende variable, der blandt andet er beskrivende for elevens sociale baggrund. Propensity scoren er den betingende sandsynlighed for, at en elev har modtaget vejledning givet de forklarende variable, og er således den størrelse, man foretager matching på baggrund af. Det er en rigtig spændende undersøgelser, der er endnu er uafsluttet.

En gang fysiker, altid fysiker

Flere har spurgt mig, om det ikke er ærgerligt, ikke at arbejde med det fagområde, som jeg er uddannet til, men jeg ser det ikke, som om jeg har forladt fysikken, blot at jeg er ved at lære noget nyt. Selvfølgelig skal det holdes lidt ved lige, så demens ikke fjerner det fuldstændigt, men det er der også tid til, nu hvor man er gået hen og blevet en Joe punch-clock, med en arbejdsuge på 37-42 timer. Spørgsmålet er bare, om man får gjort det? Heldigvis har jeg flere kolleger med samme baggrund, så det er muligt at hive Paulis udelukkelsesprincip frem under frokostsamtalen, uden at man nødvendigvis bliver hadet for det. I hele taget er DST en rigtig god arbejdsplads med masser af dejlige kolleger, der gør hver dag til en fest. Endvidere er jeg heldig at være en del af Metodeafdelingen, der fungerer som serviceorgan for de andre afdelinger i DST. Derved kommer jeg på besøg rundt omkring i huset, i rolle som Georg Gearløs’ Lille Hjælper, som folk tager godt imod, fordi de netop har brug for vejledning og en hjælpende hånd. Og man finder hurtigt ud af, at man kan noget specielt, når man er uddannet fysiker. Det er umiddelbart ikke noget, man bemærker, når man vandrer rundt på studiet, hvor man formentlig blot er endnu en klog studerende, omringet af genier. Uden for studiet findes der dog massere af mennesker, for hvilke algebra er sort magi og programmering grænsen til blasfemi. Så hvis du er afklaret med, hvilken vej du skal gå efter studiet, jamen så er du rigtig privilegeret, men hvis du ikke har sat kursen endnu, er det også helt fint, for der er brug for dig og dine kompetencer på den anden side, uanset om du planlægger det eller ej.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.