4 minute read
STREfA START-uP
from OSOZ Polska
by OSOZ Polska
Głos jako marker zdrowia
Advertisement
Jak zrodził się pomysł na stworzenie systemu do diagnozy chorób na podstawie analizy głosu?
Stało się to w trakcie wydarzenia Top 500 Innovators zorganizowanego na Stanford University. Jego uczestnicy byli zachęcani do generowania nowych pomySubtelne, niesłyszalne dla ludzkiego ucha zmiany w głosie mogą świadczyć o rozwoju niektórych chorób. Polski startup Techmo pracuje nad algorytmami, dzięki którym będzie można wstępnie rozpoznać wczesne objawy m.in. dolegliwości psychicznych, w tym neurodegeneracyjnych. I to zaledwie na podstawie próbki głosu lub rozmowy telefonicznej. O innowacji opowiada Mariusz Ziółko, profesor Akademii Górniczo-Hutniczej im. Stanisława Staszica w Krakowie.
słów i współpracy międzydziedzinowej. W ten sposób, profesor medycyny Karol Kamiński i inżynier informatyk Bartosz Ziółko opracowali koncepcję, która wiele lat później stała się fundamentem projektu VAMP (Voice Analysis for Medical Professionals) realizowanym przez Techmo sp.z o.o.
Jak działa technologia? Jaka jest jej dokładność?
Narządy zaangażowane w proces generowania mowy są wrażliwe zarówno na dolegliwości fizyczne jak i psychiczne. Dysponujemy oprogramowaniem umożliwiającym wszechstronną analizę syg-
nałów akustycznych. Możliwe jest wyznaczanie kilkuset cech głosu, z których komputer wybiera cechy symptomatyczne dla zmian głosu wywołanych przez różnorodne choroby. Porównanie cech głosu osoby diagnozowanej z cechami osób chorych i osób pozbawionych tych dolegliwości, czyli z tzw. grupy kontrolnej, dokonują klasyfikatory. Oprogramowanie do tworzenia klasyfikatorów jest dostępne, dlatego głównym zadaniem jest wybór efektywnego algorytmu. Aby stworzyć skuteczny system komputerowy, konieczne jest posiadanie nagrań głosów osób dotkniętych danym schorzeniem. Najtrudniejszym elementem jest uzyskanie odpowiednio dużej liczby nagrań do szkolenia oraz walidacji i testowania systemów diagnozowania. Rozwój korpusów mowy jest czasochłonny i kosztowny, a dobrej jakości nagrania mają kluczowe znaczenie. System VAMP nie zastąpi wizyt lekarskich, ale może usprawnić wczesną diagnostykę chorób cywilizacyjnych, schorzeń psychicznych i zmian neurodegeneracyjnych. Kontakt z lekarzem określonej specjalności będzie wciąż niezbędny do postawienia diagnozy. Stan zdrowia użytkowników można będzie analizować między innymi podczas rozmów telefonicznych. Pozwoli to na wcześniejsze zasygnalizowanie objawów chorobowych, co może mieć decydujący wpływ na efektywność leczenia. Dokładność rozpoznania najczęściej rozumiemy jako odsetek poprawnych diagnoz. Tak jak i w innych ośrodkach badawczych, na ogół osiągamy poprawne rozpoznania dla ok. 75% nagrań testowych. Wyniki poniżej 60% są traktowane jako niezadowalające.
Jak przebiegają obecne prace nad innowacją?
Uniwersytet Medyczny w Białymstoku (UMB) zajmował się rejestracją głosów i diagnozowaniem nagrywanych pacjentów, a zebrane nagrania zostały przesłane do Techmo sp. z o.o, czyli partnera ana-
»Głos człowieka posiada kilkaset cech, których parametry mogą świadczyć o rozwoju określonej choroby.«
litycznego. W ten sposób stworzyliśmy bazę łączącą nagrania mowy ze szczegółowymi charakterystykami medycznymi pacjentów reprezentujących określone zaburzenia chorobowe. Dla wybranych chorób można badać cechy akustyczne mowy, np. bazujące na analizie częstotliwościowej. Szkolenie komputera rozpoczyna się od wprowadzania nagrań głosów, zarówno osób cierpiących na określoną dolegliwość, jak i osób z grupy kontrolnej. Następnie oprogramowanie do wyznaczania tzw. klasyfikatorów porównuje cechy charakteryzujące obie grupy, wyszukuje cechy, które są symptomatyczne dla danej choroby i dobiera najbardziej efektywny sposób podejmowania decyzji w oparciu o analizę wyznaczonych cech. W efekcie uzyskuje się system, który po otrzymaniu próbki głosu analizuje ją, wyznaczając odpowiednie cechy, a następnie stawia diagnozę szukając podobieństwa swoistych cech zarówno z cechami charakteryzującymi głosy osób chorych, jak i z cechami głosów grupy kontrolnej. Dodatkowo, dla chorób psychicznych i neurodegeneracyjnych, można posługiwać się analizą lingwistyczną. Metody te wymagają zastosowania systemu konwersji zarejestrowanych wypowiedzi na tekst pisany. Oznacza to, że trzeba dysponować tzw. systemem automatycznego rozpoznawania mowy. Jedną z najbardziej efektywnych i łatwych w im-
reklama plementacji metod jest analiza liczności przekonwertowanych na rdzenie wyrazów zawartych w wypowiedzi w postaci monologu. Osoby chore wyróżniają się na ogół uboższym słownictwem w stosunku do wypowiedzi osób z grupy kontrolnej. Można dodatkowo wyznaczyć rdzenie słów, które zarówno wyraźnie częściej jak i znacząco rzadziej występują w mowie patologicznej w stosunku do mowy grupy kontrolnej. Uzyskane w ten sposób obserwacje można wykorzystać przy badaniach przesiewowych.
Jakie wyzwania stoją na drodze dalszego rozwoju systemu?
Przeprowadzone testy pokazały, że jakość nagrań ma duży wpływ na efektywność badań przesiewowych. Zebrany przez UMB materiał był nagrywany w optymalnych warunkach akustycznych przy pomocy dobrych mikrofonów. W oparciu o te nagrania zostały wyszkolone systemy do badań przesiewowych. Do testowania otrzymujemy często próbki głosu nagrane przy pomocy telefonów komórkowych. Warunki akustyczne, jakość mikrofonów i stratna kompresja sieci telefonicznych są często poważnym utrudnieniem.
Czy technologia ma szansę trafić do pacjentów w najbliższym czasie? Jak wpłynie na ochronę zdrowia?
Niezaprzeczalną zaletą jest nieinwazyjność, łatwość użycia i szeroka dostępność procesu diagnostycznego. Pozytywne wyniki badań i rosnące zainteresowanie opinii publicznej pozwalają sądzić, że już niedługo dostępne będą zaawansowane technologicznie systemy głosowego diagnozowania. Akustyczne metody analizy głosu umożliwiają zastosowanie opracowanego systemu również dla wypowiedzi w językach obcych. W lecie 2022 roku spodziewamy się udostępnić nasz system do badań przesiewowych tych chorób, dla których uzyskamy najlepsze efektywności.
Zaprezentuj swoją innowację dla ochrony zdrowia w oSoZ Polska!
Zapraszamy instytucje naukowe, startupy, zespoły badawcze do publikacji swoich prac, przedstawienia wynalazków oraz technologii� Czekamy na zgłoszenia: redakcja@osoz�pl
SYSTEM SZPITALNY (HIS)
Jednym z najpopularniejszych systemów klasy HIS na rynku, jest KS-MEDIS,
Aplikacje Mobilne KS-ASW (apteka KS-MediVeris, oraz mZZL KS-SOLAB
SYSTEMY GABINETOWE
eZLA, e-Skierowania, . Dla KS-SOMED KS-PPS Mediporta (chmura).
Z SYSTEMAMI GABINETOWYMI
Aplikacje mobilne on-line Telewizyty VisiMed on-line KS-SOLAB
POZNAJ SYSTEMY KAMSOFT
, które
KS-AOW, w jednej z kato KS-HFW oraz leczniczych MediVeris dla aptek, przychodni, hurtowni i szpitali.
KtoMaLek.pl oraz LekarzeBezKolejki.pl. VisiMed, która ponadto
OSOZ-NEWS i . W ramach których eksperci KAMSOFT w przy wanych stronach: news.osoz.pl .