11 minute read

Jaak Vilo: andmeanalüüs mõjutab oluliselt kogu bioloogiast arusaamist ja tervishoidu laiemalt

Jaak Vilo:

andmeanalüüs mõjutab oluliselt kogu bioloogiast arusaamist ja tervishoidu laiemalt

Advertisement

Terviseteadus ja andmeanalüüs käivad üha enam käsikäes. Bioinformaatika professor Jaak Vilo ja tema uurimisrühmad aitavad koguda ning analüüsida bioloogia- ja terviseandmeid, mis inimkonda mitme nurga alt abistama hakkavad.

Elame andmete üha kiirema kogunemise ajastul, mil informatsiooni küllus mängib meile kätte olulised trumbid võitlemaks tõsiste haigustega ja aitamaks teha otsuseid, mis meid oluliselt mõjutavad. Nii on bioinformaatikast saanud näiteks koroonaviirusega võitlemisel väga oluline relv nii viirusest arusaamise, vaktsiinide arenduse kui ka epidemioloogiliste arvutuste arendamise seisukohast. Andmeteadlasi läheb aga vaja igas sektoris ja ettevõttes, mis tulevikus soovib olla konkurentsis ning edukas. Jaak Vilol on hea meel tõdeda, et Tartu Ülikooli värske andmeteaduse magistrikava vastuvõtt on kasvanud juba 75 tudengini aastas. See annab lootust, et kümne aasta pärast on meil 500–600 võimekat andmeanalüütikut juures. Neid on vaja eri ettevõtetesse kaubanduses, tööstuses, panganduses, ravimitööstuses ja mujalegi. „Kogu bioloogia on muutunud tänu mahukate andmete analüüsile. Sarnased analüüsimeetodid on aga rakendatavad ka teistes valdkondades, kus andmemahud on kiiresti kasvanud,” ütleb Vilo.

Bioinformaatika tulemusel luuakse meditsiinis tekkivatest andmetest kogud, mis aitavad teadlastel teha olulisi järeldusi ja otsuseid. Professor Vilo toob esimese näite iseenda uurimisgrupi töömailt. Laiapõhjaliste andmete analüüs võimaldab meil teada saada, milline ravim konkreetsele patsiendile millises doosis kõige paremini sobib. Aeg-ajalt kirjutavad arstid patsiendile välja ravimi, mis talle tegelikult ei sobi. See juhtub seetõttu, et meie geneetika mängib ravimite manustamisel olulist rolli.

Võib tunduda kummastav, aga selleks, et teha individuaalne otsus, on vahel tarvis enne analüüsida sadade miljonite inimeste andmeid. Niisiis ei piisa vaid Eesti, Läti, Leedu või Soome teadlaste kogutud terviseandmetest. Koostööd peavad tegema teadlased üle maailma. Sellises rahvusvahelises koostöös osaleb aktiivselt ka Jaak Vilo uurimisrühm nii bioloogiliste kui ka terviseandmete valdkonnas.

Ravimite õige manustamine ja bioloogide töövahendid

„Iga inimene võib osta aspiriini või muud tavalist ravimit, mis peaks justkui sobima kõikidele, või kirjutab arst välja ühe võimaliku antidepressandi kümnest. See võib aga olla vale lahendus, kuna inimese geneetiline eripära võib just seda ravimit lagundada kas liiga aeglaselt või kiiresti. Nii ravim kas akumuleerub liiga suure koguseni, tekitades kõrvalmõjusid või ei jõua üldse mõjuda. Uute vähiravimite puhul on vaja esmalt tuvastada vähi täpne tüüp, millele uus ravim võiks mõjuda. Ravimite manustamisel on küsimus lisaks ravimi kui sellise sobimisele ka doosis, protseduuris ja lõpuks ka sobiva ravimite kokteili määramisel, mida patsient võtab. Kõik see peab aga kokku käima inimese ja vahel ka haiguse (näiteks vähk või viirus) individuaalse geneetikaga.

See eeldab teadmisi terve ja haige inimese bioloogiast, võimalike uute ravimite sihtmärkidest ning ravimite eripäradest. Tõenduspõhine meditsiin vajab häid andmepõhiseid lähenemisi ja tulevikus üha enam ravimite täppissuunamist õigele sihtrühmale. Vilo sõnul on aja jooksul riiulile jäänud palju medikamente. Samas võib mingile grupile patsientidele neist ravimitest oluline kasu olla. Selleks on vaja erinevate bioloogiliste eksperimentide ja geneetika andmete analüüsi, vahendeid, millega neid fenomene uurida.

Nii on Vilo uurimisrühm panustanud tüvirakkude arengu, vähi, immunoloogia ja närvisüsteemi haiguste uurimisse. Uuritakse geenide võimaliku funktsiooni ennustamist, DNA ja selle modifikatsioonide infot, valkude avaldumist eri tingimustel jne. Tööriistad on arendatud enamikus ise ja koostööd tehakse eri valdkondade molekulaarbioloogide ja arstidega.

Nendele programmidele, millele on palju kasutusvajadust, on tehtud ägedad veebiliidesed ja neid kasutavad aktiivselt kümned tuhanded teadlased üle maailma. Kokku saavad Eesti arvutid vatti miljonite päringutega kuus, mille eesmärk on aidata teadlasi ja ettevõtteid oma andmete lihtsama analüüsi võimaldamisel. Rahvusvahelise ELIXIR-i bioinformaatika taristu koostöövõrgustikus luuakse ühiseid andmebaase, tagatakse nende ühilduvus omavahel ja erinevate tööriistadega ning koolitatakse teadlasi, kes puutuvad kokku andmeanalüüsi vajadusega. Vilo ja kaasprofessor Hedi Peterson juhivad selles koostöös Eesti tegevusi.

Tõenduspõhine meditsiin vajab häid andmepõhiseid lähenemisi ja tulevikus üha enam ravimite täppissuunamist õigele sihtrühmale.

Tervishoid peab olema andmekeskne, et olla tõenduspõhine

Bioloogiliste mehhanismide uurimise pealt jõuame peagi ravimite kasutuse ja nende mõju analüüsini. Kuna nüüd on üha enam olemas inimeste DNA infot koos terviseandmetega, näiteks milliseid haiguseid mis vanuses keegi põeb, saab otsida ka neid infokillukesi DNA-s, mis neid protsesse mõjutavad.

Terviseteaduse maailmas on moodne sõna ennetamine ning bioinformaatika ja farmakogeneetika pakuvad ka siin huvitavaid võimalusi. Nende abil võib tulevikus selgeks teha inimese eelsoodumuse mõne

haiguse tekkeks, näiteks südamehaiguste ennetamiseks saab vajadusel juba varakult võtta vajalikke ennetavaid ravimeid. „Sedalaadi ravirežiimid tulevad. Küünikud võivad nüüd öelda, et ravimifirmad suruvad meile ravimeid peale, aga tervise eest hoolitsemine on pikaaegne protsess ja vahel on kõrge geneetilise riskiga inimestel kolesterooli või vererõhu kontrolli all hoidmine vajalik,” tõdeb Jaak Vilo.

Jõuame oma jutuga praeguse globaalse teemani number üks, milleks on koroonaviirus. Tänu Eesti teadlaste kompetentsile suudeti väga kiiresti luua kohalikud andmeanalüüsi töövood ja avalikud visuaalsed vaated, mis aitavad viiruse levikut paremini prognoosida ja selle abil otsusteni jõuda. „See ei ole tingimata keeruline andmeteadus, aga just tänu meie varasematele kogemustele suutsime need kiirelt luua,” räägib Vilo.

Võtmeteema – andmete ühtlustamine

Kui võtame geneetiliste eripärade arvestamise, koroonaviiruse uurimise või mis tahes tervise uurimisega seotud teema, siis on alati vaja võimalikult hästi võrreldavaid andmeid. Vaid siis on tulemused sellised, et neist saab tõesti teha kvaliteetseid järeldusi. Tähtis on ka andmete hulk. Kui Eestis analüüsida tuhande inimese andmeid, ei ole see tingimata piisav, et teha haiguse kohta lõplikke järeldusi, näiteks millised ravimid neile võiks sobida või prognoosida nende terviseriske. Sageli ei joonistu peamised geneetilised tendentsid sel moel veel usaldusväärselt välja, vaja on tulemusi võrrelda ka teiste riikide vastavate andmetega. Kui samad tunnused on tuvastatud kümnetest ja sadadest miljonitest andmeühikutest, siis tekib aga tõeline väärtus kogu inimkonnale. „Eri riikides peaks analüüs toimuma omavahel võrreldavalt, sõltumata kasutatud keelest või meditsiinisüsteemi eripäradest. Terviseandmeid ei ole aga paljudel põhjustel võimalik ega otstarbekas lihtsalt ühte suurde süsteemi kokku tuua. Niisiis peavad kohapeal kogutavad andmed olema riikide lõikes ühesugused. Aga ega ka meie, Eesti arstide poolt kirja pandud andmed ei ole ju alati sarnaselt kogutud ega infosüsteemi kirja pandud,” ütleb Vilo.

Terviseinformaatika töörühmas nähakse Eestis Jaak Vilo, Sulev Reisbergi ja Raivo Kolde eestvedamisel vaeva, et siinsed andmed oleksid võrreldavad Hollandi, Taani või ükskõik millise teise Euroopa riigi terviseandmetega. Teistes riikides teevad sealsed teadlased sarnast tööd, arendades ühtseid andmemudeleid ja tööriistu nende andmete analüüsiks. „Eesti ei mõtle siin midagi eraldi üksi ainult enda jaoks välja. Kõik riigid peavad koos töötama ühiste standardite ja vahendite nimel. Suurandmete abil saame väga palju rohkem olulist infot meie haiguste, ravimite ning raviprotsesside kohta,” rõhutab professor Vilo.

Andmekaitse väga tähtsal kohal

Suurandmete, eriti tervishoius kogutu puhul on üheks kriitilisemaks teemaks andmekaitse – et üheski töötlemise etapis ei lekiks isiklikud delikaatsed andmed. Meil on e-tervise keskkond, digiretseptuur ja haigekassa raviarved. See on Vilo sõnul hea kombinatsioon. Kuid alles andmete turvalise ühendamise ja tulevikus nende eri andmete kooskasutuse kaudu saab luua uusi paremaid teenuseid. Andmete analüüsi ajal on need loomulikult täiesti anonüümsed. Selliste turvalisemate lahendus-

te loomisse, mis kaitsevad andmeid lekete eest ja ka andmete analüüsijate eneste eest, on panustanud ka Vilo uurimisrühm. Professor Vilo teab, millest ta räägib. Ta naasis Eestisse 2002. aastal just selleks, et panna alus Eesti geenivaramu loomisele, nii selleks vajaliku bioinformaatika suuna käivitamise kui ka esimese vajaliku sammuna terviseinfo koondamise lahenduste väljatöötamisele. „Teaduses tekib peamine kasu siis, kui olulised andmed kokku tuua ja võimaldada lisada ka teiste riikide koondatud vaade,” tõdeb ta siiski ning lisab, et loomulikult on terviseandmete töötlemise üheks oluliseks tahuks just andmete turvaline käitlemine. Toorandmed ega isiku kaupa andmed ei liigugi ühest riigist teise. Kuid samu analüüsimeetodeid kasutades saab omavahel kokku tuua ja võrrelda tulemusi. Samuti saab treenida tehisintellekti ühes riigis ja seda siis otse rakendada teises. Inimese genoomi ei saa lõpuni peita, kuid DNA info ei tohi niisama kusagile lekkida, eriti koos isikut tuvastava infoga, sest ka sugulaste DNA on omavahel sarnane. Kui tegemist on aga näiteks meid rünnanud viiruse RNA segmendiga, siis ei pea muretsema – see on piisavalt anonüümne, kinnitab professor.

Selguse mõttes peab mainima, et tervise- ja genoomiandmeid kasutavaid teadustöid tehakse ainult eetikakomiteedele esitatud uuringukavatsuste ja nendele antud lubade baasil. Seal vaadatakse ka elementaarseid printsiipe andmehalduse ja -kaitse kvaliteedi kohta. Andmekaitse inspektsioon ja andmekaitse üldmäärus on olulised just laiemate suuniste alal, kuid need ei keela vajalike teadustööde tegemist, vaid pigem soodustavad seda. Loomulikult ei käi andmete küljes ei nimed ega isikukoodid, need eemaldatakse enne andmete uurimisrühmale väljastamist.

Tehisintellekti otsuse tõlkimine inimkeelde

Viimasel ajal on järjest kasvanud tehisintellekti ja masinõppe meetodite arendus. Eriti popiks said need piltide analüüsis. Mikroskoop on aga arstide üks tööriistu olnud enam kui sada aastat. Seda kasutatakse, et analüüsida vähi koeproove või loendada eksperimendi jooksul mingeid teatud tüüpi rakke. See on alati olnud töömahukas protsess. Ehkki programme, mis rakke automaatselt loevad, on tehtud varemgi, siis tõelise hüppe sai kogu valdkond siis, kui plahvatuslikult kasvas fotode analüüsimise võimekus. Tehisintellekt tunneb fotodelt ära kassi, mootorratturi või Bill Clintoni. See osundab, et masinõpe on piisavalt kvaliteetne, et seda saaks ka meditsiini hüvanguks tööle panna. Jaak Vilo üks uurimisrühm tegeleb Leopold Partsi ja Dmytro Fishmani juhtimisel just pildianalüüsiga.

Kassipiltide õpetamine arvutile

Teaduses tekib peamine kasu siis, kui olulised andmed kokku tuua ja võimaldada lisada ka teiste riikide koondatud vaade.

on ühelt poolt oluliselt lihtsam kui raku nägemine, sest tehisintellekti saab väga paljude erinevate kassipiltide abil treenida. Inimestele meeldib kasse pildistada ja neid internetti panna, kirjutades juurde sõna „kass”. Rakkude piltidega on veidi teised lood. „Et õpetada masinat, on vaja treenimiseks näidisandmeid,” kinnitab Vilo. Hoolsa käsitööga ette näidatud piirkondi markeerides või varem välja töötatud aeglaseid programme kasutades saab siiski piisavalt treeningandmeid kiire tehisintellekti õpetamiseks. Tehisintellekt teeb edaspidi ise ära selle töö, mis patoloogil või bioloogil muidu liiga kaua aega võtaks. Samuti on arvuti väsimatu ja annab iga kord samu, omavahel korratavaid ja võrreldavaid vastuseid.

Pildianalüüsi on nüüd omakorda võimalik kombineerida terviseandmete ja tekstianalüüsiga ning tulemus on taas killuke lähemal uutele kvaliteetsematele lahendustele.

Tehisintellekti kasutamise ga kaasneb sageli veel üks oluline probleem. Seda kutsutakse n-ö musta kasti efektiks, kus arvuti, tehisintellekt, ütleb arstile, et tema otsus on selline ja sellega info piir-

EUROOPA TEADLASTE ANDMED JA TÖÖRIISTAD ÜHES KOHAS

Euroopa bioloogiliste andmete valdkonna ühine võrgustik ELIXIR arendab ja haldab üliolulist infrastruktuuri suurte andmemahtude jagamiseks. Eesti on selle aktiivne asutajaliige. ELIXIR-i raames luuakse ja hoitakse käigus suuri teaduses kogunevaid andmebaase, mida kõik maailma teadlased ja ettevõtted saavad oma töös kasutada. Samuti arendatakse ja liidestatakse tööriistu, mida läheb vaja andmeanalüüsi töövoogudes, näiteks praegu viiruse RNA sekventsi analüüsiks. ELIXIR on rahvusvahelise lepingu alusel ellu kutsutud pikaajaline koostöö, mis jääb toimima aastakümneteks. Teadlane saab nii interneti kaudu ligi varasamatele andmestikele ja ise oma andmeid teistele kasutamiseks ja võrdluseks üles laadida. Nii on avaliku teadusrahastuse toel loodud andmed kõikidele parimal viisil tasuta ligipääsetavad ja kasutatavad. Kõige tähtsam on, et nii saab andmeid omavahel võrrelda, teiste saadud tulemusi valideerida ja oma ideid edasi arendada. Lisaks luuakse ühiseid standardeid, formaate ja liidestusi tööriistade vahel ning tehakse koolitusi kasutajatele kõigist ettevõtetest ja teadusasutustest. Euroopa teadlased tegutsevad ikkagi ühiste eesmärkide nimel, edendades nii meie kõigi tervishoidu, ravimifirmasid kui ka erinevaid põllu- ja biomajanduse ettevõtteid.

dubki. Kuidas aga teha kindlaks, mis on selle otsuse taga? Jaak Vilo rühma üheks tuleviku ülesandeks on andmeanalüüsi tulemus inimesele ka lahti seletada ehk vastata küsimusele, miks tehisintellekt just sellise tulemuseni jõudis või kui kindel see otsus on. „See on väga oluline. On suur vahe, kas otsus on täiesti kindel või 50/50. Meil tegeleb otsustuse kalibreerimisega kaasprofessor Meelis Kulli töörühm,” ütleb Vilo ja lisab, et teadus liigub sel teemal edasi veel küllalt väikeste sammudega. Samuti on tehisintellekti ja sügavate närvivõrkude alal koostöö professor Raul Vicente Zafra töörühmaga ning äriprotsesside alal professor Marlon Dumas’ töörühmaga.

Andmeanalüüs igas valdkonnas

Jaak Vilo toob välja, et bioinformaatika jaoks välja töötatud erinevaid meetodeid saab tihti kasutada ka teistes valdkondades alates meediatekstide analüüsist kuni ärimaailmas tarvis olevate analüüside ja isejuhtivate autodeni välja. Vilo uurimisrühma vilistlane, Wise’iga maailma vallutav Kristo Käärmann on öelnud, et just teaduses omandatud analüüsioskuseid ja teadmisi on tal vaja läinud ta enda äris, milles on väga suur rõhk just andmepõhisusel. See on selge näide, et tegemist on valdkondadeülese distsipliiniga. Andmeteadlased, keda Tartu Ülikoolis suuremas mahus koolitatakse, võivad nii tuua muutusi kaasa kõikjal, kus vähegi mingeid andmeid kogutakse.

Selleks, et andmed oleks kasutatavad ja kasulikud,

peab nende halduses järgima FAIR-printsiipi: nad on leitavad (findable), ligipääsetavad (accessible), ühilduvad (interoperable) ja taaskasutatavad (reusable).

MIDA TOOB TULEVIK ISALE JA TÜTRELE?

Isa Toomas (30) ja tütar Emma (5)

Personaalmeditsiin läheb aina detailsemaks. Arstid saavad Toomase ja Emma terviseseisundi kohta automaatseid ohuteateid enne, kui nad hakkavad välja kirjutama tegelikkuses mitte mõjuvaid ravimeid. Professor Vilo juhtimisel on Tartu Ülikooli poolt ehitamisel riiklik infrastruktuur, mis peaks geneetilist andmestikku hoidma ja arstidele kättesaadavaks tegema. Andmeteadlased on muutunud ettevõtete, riikide ja organisatsioonide tähtsaimateks tegelasteks – Emma on võib-olla üks neist tähtsatest inimestest. Kõiki olulisi statistilisi andmeid täiendatakse dünaamiliselt Toomase ja Emma digiloos. Digilugu suudab paremini lugeda nii inimene ise kui ka tehisintellekt. DNA on saanud tervisekontrolli ja testimeetodite valikulise rakendamise kõige olulisemaks tahuks. Andmed on omavahel märkamatult ühenduses ning varajasi ohusignaale saavad nii Toomas ja Emma kui ka nende arstid. Õnnetuspaikadelt ja kiirabist liigub kogu oluline andmestik kohe haiglatesse. Eetika ja tehnoloogia käivad sünkroonis, otsides parimaid viise, kuidas edendada tõenduspõhist meditsiini. Eesti andmeteadlased loovad ettevõtteid, mis pakuvad usaldusväärseid teenuseid teiste riikide tervishoiusüsteemidele. Isale ja tütrele on rahustav teada, et globaalseid pandeemiaid hoiab tulevikus paremini ära ultrakiire ja dünaamiline vaktsiinide tootmine. Uue viiruse ja iga tema uue variandi vastu leitakse bioinformaatika meetoditega uus RNA sekvents, mis sünteesitakse tootmistsehhis ja pakendatakse sarnasesse „kesta” nagu praegu Pfizeri vaktsiin koroonaviiruse vastu. Tartu Ülikooli teadlastega koostöös luuakse uusi immuunsüsteemi aktiveerivaid vaktsiine kõigi sagedasemate vähkide vastu. Toomasele on tähtis, et nii kasvab Emma tervena elatud eluaastate arv vähemalt 80-ni.

This article is from: