6 minute read

TEcHNoLogIE I ZDRoWIE

„Podaruj Dane”, czyli jak w bezpieczny sposób zapewnić dostęp do danych dla rozwoju AI

Co się stanie, jeśli niepowstrzymana siła napotka nieporuszalny obiekt? Ten paradoks filozoficzny zajmuje myślicieli od czasów starożytnych (Arystoteles) do współczesnych (Stephen Hawking). Nigdy jeszcze udzielenie odpowiedzi na to klasyczne pytanie nie było tak ważne – od tej odpowiedzi zależeć może los sztucznej inteligencji w zdrowiu.

Advertisement

LIGIA KORNOWSKA, Dyrektor Zarządzająca Polskiej Federacji Szpitali WOJCIECH SIEROCKI, Wiceprezes Data Lake

niepowstrzymana siła Nie ulega wątpliwości, że sztuczna inteligencja jest przyszłością w medycynie – udowodniliśmy to sobie w dwóch poprzednich artykułach. Korzystanie z algorytmów sztucznej inteligencji o zbadanej przydatności jest nie tylko rozsądne. Jest wręcz moralnym imperatywem, jeśli tego rodzaju narzędzia są skuteczniejsze niż obecnie stosowany najlepszy standard diagnostyczny. Nieskorzystanie

»Czy sztuczna inteligencja przestanie się rozwijać z powodu braku jakościowych danych?«

z czułych, swoistych, szybkich i relatywnie tanich algorytmów sztucznej inteligencji wkrótce może być w praktyce lekarskiej takim samym błędem w sztuce, jak niewykonanie podstawowych badań lub nieskonsultowanie pacjenta ze specjalistą. Za rozwojem sztucznej inteligencji w medycynie jednoznacznie przemawiają też trendy ekonomiczne i demograficzne, takie jak starzejąca się populacja obciążona coraz większym bagażem chorób, niedobór wykwalifikowanej kadry lekarskiej czy niedofinansowanie systemów ochrony zdrowia. Postęp sztucznej inteligencji, ale także szerokorozumianych nowoczesnych technologii i innowacji w medycynie, już teraz jest niebagatelną siłą. Siłą, która wymaga danych medycznych, a której nie jesteśmy w stanie i nie chcemy powstrzymać. Możemy za to dobrze ją ukierunkować i wykorzystać do utylitarnych celów.

nieporuszalny obiekt Dwoma kluczowymi czynnikami masowej adopcji algorytmów AI w ochronie zdrowia jest ich koszt oraz jakość. Algorytmy sztucznej inteligencji muszą być kosztowo efektywne. Wpływ na ich ostateczną cenę dla klienta ma wiele czynników, z których możemy wyróżnić dwa kluczowe: koszt stworzenia (wytrenowania) algorytmu oraz konkurencję między dostawcami (wysoka podaż algorytmów). Oba te czynniki są ograniczone przez dostęp do jakościowych i wystarczająco dużych repozytoriów danych medycznych, na których algorytmy AI mogą być uczone. Obecnie dostęp do takich repozytoriów jest przywilejem jedynie największych korporacji lub najlepiej dofinansowanych startupów. Taka sytuacja może doprowadzić do stworzenia monopolu nacechowanego agresywnymi politykami cenowymi, a algorytmy AI dostępne będą jedynie dla nielicznych w najbogatszych państwach świata. Kluczowym aspektem tworzenia algorytmu jest jego czułość i swoistość. Zgodnie ze znanym dogmatem GIGO – Garbage In, Garbage Out – skuteczność i jakość algorytmów AI zależna jest w dużej mierze od danych, na których algorytmy są uczone. Tylko jakościowe i kompletne dane zagwarantują, że stworzone algorytmy AI nie będą stronnicze, nie będą dyskryminowały niedoreprezentowanych w zbiorach danych grup społecznych oraz będą się cechować zadowalającą czułością i swoistością w przypadku zdecydowanej większości pacjentów, w stosunku do których są stosowane. Wydaje się zatem zasadne stwierdzenie, że najważniejszym czynnikiem, który spowalnia rozwój sztucznej inteligencji, jest dostęp do repozytoriów danych medycznych (jezior danych – data lakes), które byłyby dostępne dla każdego zainteresowanego w przystępnej cenie oraz zawierałyby wyłącznie jakościowe dane medyczne, gwarantując tym samym skuteczność algorytmów AI tworzonych na ich bazie. Dwie istotne przeszkody stoją na drodze do utworzenia tego rodzaju zbiorów danych: ochrona prywatności i silosowanie danych.

ochrona prywatności Z udostępnieniem danych przez pacjenta na rzecz instytucji badawczych wiążą się oczywiste ryzyka i obawy pacjenta. Paneuropejskim trendem znajdującym umocowanie w RODO jest podkreślanie roli pacjenta jako dysponenta swoich danych – w tym medycznych. Liczne skandale związane z wyciekami danych i inwigilacją społeczeństwa zwiększają czujność pacjentów co do udzielania zgody na udostępnianie danych sensytywnych. Niejasna legislacja, również w Polsce, dotycząca przekazywania danych zanonimizowanych pacjentów do celów badawczo-rozwojowych oraz wysoka percepcja ryzyka takiego procesu sprawiają, że de facto dane medyczne pacjentów nie są wykorzystywane na szeroką skalę poza badaniami klinicznymi prowadzonymi w dużych ośrodkach akademickich. Przekazywanie danych medycznych – zarówno personalnych, jak i anonimowych – do celów związanych z rozwojem algorytmów AI związane jest z dużą ilością obaw i barier zarówno po stronie pacjenta jak i placówek ochrony zdrowia.

Silosowanie danych Głównym punktem agregacji kompletnej dokumentacji medycznej dotyczącej danego pacjenta jest najczęściej sam pacjent, który zbiera swoją dokumentację medyczną przeważnie w formie papierowej. Dokumentacja medyczna przechowywana jest w większości przypadków w niepołączonych ze sobą repozytoriach szpitali. Jednocześnie, strona trzecia ma znacznie utrudniony dostęp do danych gromadzonych i kompletowanych w systemach centralnych, nawet jeśli byłyby to dane anonimowe. Trend ochrony prywatności, brak zachęty do szerokiej integracji oraz nieuporządkowanie danych w istniejących repozytoriach stanowią niebagatelne przeszkody do pokonania na drodze do rozwoju i demokratyzacji algorytmów AI. Do dziś kraje Unii Europejskiej próbują rozwiązać powyższe problemy. Co się zatem stanie, jeśli niepowstrzymany pęd rozwoju sztucznej inteligencji, podsycany głodem danych medycznych, napotka nieporuszalną przeszkodę jaką jest trend do chronienia naszych danych i ich mierna jakość? Czy sztuczna inteligencja przestanie się rozwijać z powodu braku jakościowych danych? Czy pacjenci zostaną zmuszeni do zrzeczenia się prawa do dysponowania swoimi danych dla większego dobra ogółu?

Fundacja „Podaruj dane” Wierzymy, że istnieje inna droga, czerpiąca z dziedzictwa i postępu cywilizacyjnego oraz kapitału solidarności społecznej, który wypracowaliśmy przez ostatnie lata. Rozwiązaniem, które proponujemy, jest stworzenie zaufanej trzeciej strony – Fundacji „Podaruj Dane”, która tworzyć będzie jakościowe repozytoria danych dostępne dla badaczy i twórców algorytmów AI pozyskując dane medyczne w procesie dawstwa danych, analogicznego do dawstwa krwi czy szpiku. Pacjentów i badaczy łączy jeden wspólny cel – obu grupom zależy na opracowaniu metod skutecznej diagnostyki i terapii schorzeń. Tę wspólnotę interesów dzieli ogromna bariera zaufania. Fundacja „Podaruj Dane”, współtworzona przez Polską Federację Szpitali, znosi tę barierę poprzez dwie główne zasady jej działalności: • Fundacja o charakterze non-profit jest współtworzona przez szeroką koalicję

instytucji zaufania publicznego, które gwarantują jej niezależność od partykularnych interesów rządów czy korporacji. • Fundacja korzysta z rozproszonej bazy danych – technologii blockchain – do odnotowywania oświadczeń woli pacjenta, a także zapisywania każdej transakcji, jaka zaszła na poszczególnych rekordach pacjenta. Taka architektura IT skutecznie uniemożliwia manipulowanie danymi pacjenta (w tym też przez Fundację). Dodatkowo, każdy pacjent oraz instytucje zaufania będące w sieci blockchain będą mogły kontrolować poprawność zachodzących procesów w czasie rzeczywistym na swoim koncie on-line.

Dawstwo danych w swojej istocie będzie złożeniem oświadczenia woli – upoważnienia do przetwarzania danych medycznych na rzecz Fundacji „Podaruj Dane”. Pacjent w każdej chwili będzie mógł zmienić parametry oświadczenia woli bądź je wycofać, jak również dokonać audytu oświadczenia woli w węzłach sieci blockchainowej kontrolowanych przez zaufane podmioty współpracujące z Fundacją (organizacje pacjenckie, uniwersytety, inne organizacje non-profit), co uczyni pacjenta faktycznym dysponentem swoich danych, dając mu pełną kontrolę nad nimi. Fundacja pozwoli zarówno na szczodre dzielenie się swoimi danymi, jak i na niewyrażenie zgody co do udostępniania jak i przetwarzania danych. Takie podejście stawia pacjenta w rzeczywistej roli dysponenta swoich danych i umożliwia mu podjęcie świadomej decyzji. Fundacja „Podaruj Dane”, na podstawie oświadczeń woli złożonych przez pacjentów i zapisanych w niezmienialny, nieusuwalny i audytowalny sposób na blockchainie, pobierać będzie dane z repozytoriów szpitalnych, kompletować je z różnych źródeł, anonimizować i przekazywać na cele badawczo-rozwojowe. Zachętą do integracji szpitali z repozytorium Fundacji „Podaruj Dane” będzie fakt, iż Fundacja istotną część środków pozyskiwanych z tytułu udostępnienia anonimowych danych instytucjom badawczo-rozwojowym przekazywać będzie świadczeniodawcom, co umożliwi pokrycie kosztów prac integracyjnych. Dobrym sposobem na zapewnienie rozliczalności całego systemu może być stworzenie tokena w standardzie ERC-20 przekazywanego interesariuszom systemu dawstwa danych – w tym pacjentom – celem zapewnienia zachęt i korzyści z udziału w systemie wszystkim zainteresowanym stronom. Wierzymy, że zaufana trzecia strona, na rzecz której pacjenci przekazują dane, wykorzystywane później w celach badawczo-rozwojowych, może być rozwiązaniem problemów opisanych wyżej. Obecność takiego zaufanego podmiotu sprawia, że wykorzystanie danych medycznych staje się bezpieczne zarówno dla pacjentów jak i dla świadczeniodawców, promuje demokratyczny dostęp do danych medycznych a przede wszystkim – stawia pacjenta w centrum całego procesu, czyniąc go dysponentem swoich danych medycznych, a równocześnie ostatecznym beneficjentem innowacji wypracowanych dzięki jego dobrej woli. 

Fundacja „Podaruj Dane” planuje tworzyć jakościowe repozytoria danych dostępne dla badaczy i twórców algorytmów AI pozyskując dane medyczne w procesie dawstwa danych, analogicznego do dawstwa krwi czy szpiku.

This article is from: