Voice Technologies
RAPORT RAPORTÓW
D
PARTNERZY TECHMO
rodzy Państwo, przez większość minionego roku co miesiąc wysyłaliśmy naszym Partnerom Raporty Rynkowe. Każdy z nich był efektem skrupulatnego przeglądu wiadomości z polskiego i światowego rynku rozwiązań głosowych, i sze-
rzej - sztucznej inteligencji. Prezentowaliśmy fakty, prognozy i opinie
oraz opracowania naukowe. Każdorazowo materiał miał ograniczoną
grupę odbiorców. Chcieliśmy w ten sposób wyróżnić Partnerów Techmo, a przede wszystkim ich informować i inspirować. Dziś, w formie pewnego podsumowania, dzielimy się z szerszym gronem odbiorców tym, co elektryzowało branżę w 2020 roku. Wybraliśmy najciekawsze wpisy,
2020
które mogą być początkiem kluczowych transformacji dla zastosowania technologii głosowych. To może być wiele spełnionych przepowiedni. Nieprzypadkowo większość wybranych treści pochodzi z zagranicznych serwisów, co jest świadectwem kierunku wiatru zmian*. Zapraszamy do lektury. P i ot r S ta n k i e w i c z
* Choć, jak Państwo zobaczycie, Polska nie ma się czego wstydzić jeśli zapytać o sukcesy minionego roku i plany na kolejny przedstawicieli 15 firm z naszej branży http://bit.ly/Voiceboty-i-ludzie
Kraków, styczeń 2021 r.
2020
« KWIECIEŃ
RAPORT ROCZNY
Chińska cyfryzacja sądownictwa
IVR na pytania o koronawirusa
W Szanghaju transkrybowane są nagrania z rozpraw sądowych z uży-
Czatbot funkcjonujący na Portalu Pacjenta został przygotowany na py-
ciem technologii głosowej. Chiny już od kilku lat przystosowują całe są-
tania związane zkoronawirusem. Rozwiązanie oparte jest o NLP IBM
downictwo do wdrażania automatyzacji. Podejmowane są kolejne kroki
Watson, dostępne również w wersji głosowej na Telefonicznej Infolinii
tak, aby AI zastąpiło urzędników w przedstawianiu zdigitalizowanych
Pacjenta.
dowodów czy przepisywaniu dokumentów. źródło: nfz.gov.pl
źródło: thestar.com.my
Kaszel i termowizja do szukania chorób
Asystenci głosowi z podatnościami
Powstała platforma sprzętowa FluSense wykorzystująca obraz termo-
Dynamicznie zmieniają się wektory ataków hakerskich. Niedawno
wizyjny i dźwięk kaszlu do prognozowania chorób grypopodobnych
producenci inteligentnych głośników poznali słaby punkt swoich pro-
(w tym koronawirusa).
duktów. Okazuje się, że bezpieczeństwo i prywatność konsumentów są zagrożone poprzez zastosowanie wielu nowych, nieznanych dotąd
źródło: pap.pl
technik.
Biometria głosowa w statystykach dano informacje, co dzieje się z uzyskanymi nagraniami z prób visihingu Więcej o Techmo: www
(voice phishing). Temat wyłudzeń telefonicznych został przedstawiony przez firmę SiSoft podczas Techmo Day edycji 2019.
techmo.pl
Newsletter
bit.ly/NewsletterTechmo
/company/techmo-sp.-z-o.o.
/TechmoVoice
/Techmo_Voice
źródło: thisismoney.co.uk
Starość słychać w głosie
źródło: cpomagazine.com
« MAJ
Brytyjski bank HSBC przybliża dane dotyczące autoryzacji głosowej. Po-
Start-upowy voicebot dla szpitali Akcelerator Accelpoint uruchomił dwa programy wsparcia dla obiecujących projektów technologicznych. Jednym ze wspartych pomysłów branży medtech jest voicebot Medai. Według opisu to usługa służąca do zarządzania jakością świadczeń medycznych poprzez oce-
Badania Uniwersytetu w Tokio wykazały, że dane głosowe stanowią
nę stanu pacjentów oraz weryfikację możliwości leczenia z użyciem
znaczący biomarker do określania funkcji poznawczych. Wskazano, że
telemedycyny.
mowa może pomagać w wykrywaniu chorób związanych z podeszłym
źródło: brief.pl
wiekiem (demencja). W Techmo od początku 2019 roku w ramach projektu VAMP prowadzimy badania nad tymi zagadnieniami. źródło: openaccessgovernment.org
Youtube
/techmovoice
ciąg dalszy na następnej stronie
2
Obawy wynikające z bycia podsłuchiwanym przez asystentów głoso-
RAPORT ROCZNY
wych stają się powszechnym zjawiskiem wśród amerykańskich konsumentów. Co trzecia badana osoba ma wątpliwości odnośnie poufności danych i własnej prywatności. Grono respondentów podzielających to zdanie z roku na rok rośnie. Autorzy przeprowadzonego badania wskazali, że zaniepokojenie może prowadzić do malejącego zainteresowania inteligentnymi głośnikami. Czy rozwiązania on-premise zyskają na
2020 Więcej o Techmo: www
techmo.pl
Newsletter
popularności?
« CZERWIEC
Czy inteligentne głośniki są bezpieczne?
Niebezpieczne zabawki UODO (Urząd Ochrony Danych Osobowych) wystosował komunikat o realnym zagrożeniu ze strony produktów dla dzieci. Zabawki posiadające funkcje połączenia z Internetem i wchodzące w interakcję z dzieckiem mogą bez wiedzy opiekuna przechowywać i przekazywać informacje. To pokazuje, że technologia otacza nas bardziej niż kiedykolwiek i konsumenci potrzebują znać i rozumieć zasady działania posiadanych przez nich urządzeń.
źródło: voicebot.ai
źródło: prawo.pl
AI wspiera seniorów
Łotwa cyfryzuje się ze środków na COVID-a
W maju 2020 roku minął rok od premiery południowo-koreańskiego
Łotewski rząd przedstawił plan, jak rozdysponuje środki z UE na skutki
inteligentnego głośnika do opieki nad samotnymi seniorami. Choć na
łagodzenia kryzysu. Część pieniędzy zostanie wykorzystana na opraco-
opublikowanie szczegółowego raportu trzeba jeszcze poczekać, to
wanie rozwiązań AI dla administracji. Jednym z pomysłów jest wprowa-
już wiemy, że odnotowano pozytywny wpływ urządzenia na samo-
dzenie rozpoznawania mowy, które zapewni automatyczne przygoto-
poczucie i komfort psychiczny osób starszych, a także poprawę zdol-
wanie dokumentów i transkrypcję plików audio. Gratulujemy pomysłu,
ności poznawczych. Twórcy chcą rozwijać produkt o kolejne funkcjo-
a współpracującej z łotewskim rządem firmie Tilde, życzymy owocnych
nalności.
rezultatów w pracy nad rozwiązaniem. źródło: businesskorea.co.kr
źródło: eng.lsm.lv
bit.ly/NewsletterTechmo
Mowę ciała wyczytasz z głosu
Wyłudzenia głosowe przybierają na sile
Istnieje możliwość „usłyszenia” języka ciała rozmówcy. Zauważono
Wraz z nowymi kanałami oraz narzędziami do obsługi klienta rośnie
korelację pomiędzy procesem gestykulacji a parametrami akustycz-
liczba socjotechnik umożliwiających „bezpodstawne wzbogacanie się
nymi głosu. Okazuje się, że czynniki takie jak przyjęta postawa mówcy
cudzym kosztem”. Najnowsze dane pokazują przerażającą skalę proce-
czy układ mięśni wpływa na to, jak rezonuje aparat mowy człowieka.
deru. Wiemy już, że przez pandemię odnotowywany jest wzrost połą-
/company/techmo-sp.-z-o.o.
/TechmoVoice
/Techmo_Voice
Youtube
/techmovoice
źródło: neurosciencenews.com
czeń telefonicznych, który wystawia branżę contact center na próbę. ciąg dalszy na następnej stronie
3
go oszustwa typu vishing (voice phishing). Gwałtowny rozwój syntezy
Biometria głosowa higienicznie najbezpieczniejsza
głosu to może być nowy wektor ataku. Zmusi specjalistów bezpieczeń-
Amerykańska firma Pindrop sprawdziła jaka forma weryfikacji biome-
stwa do znalezienia narzędzi, aby weryfikację głosową uczynić odpor-
trycznej traci na skuteczności przy stosowaniu środków ostrożności.
ną na nowe wyzwania.
Wyniki wskazują jasno – głos jest najlepszą formą weryfikacji na czas
W ubiegłym roku syntezowany głos dokonał po raz pierwszy udane-
2020
wpływa na rozpoznanie mowy oraz identyfikację użytkownika. Kolejny
Wyciek danych medycznych z aplikacji
niezaprzeczalny atut dla technologii głosowej, która odnajdzie się w po-
Babylon Health, czołowy dostawca oprogramowania AI, przyznał się
stpandemicznej rzeczywistości.
do błędu w swojej aplikacji. Pacjenci w sposób nieautoryzowany mieli możliwość uzyskania danych medycznych innych osób. Sytuacja mogła przejść bez echa, gdyby nie fakt, że treści zaczęły trafiać na platformy społecznościowe. Choć incydent został szybko naprawiony, jego zaistnienie poruszyło istotny problem aplikacji dla branży medycznej. Oczywiście mamy to na względzie tworząc w Techmo aplikację VAMP. źródło: itpro.co.uk
Więcej o Techmo:
społecznego dystansowania się, gdyż posiadanie maseczki marginalnie
źródło: business-reporter.co.uk
Strzeż się żarówek!
źródło: pindrop.com
« LIPIEC
RAPORT ROCZNY
Izrael usłyszy COVID w USA Izraelskie Ministerstwo Obrony rozpoczęło kolejny etap prac w wykrywaniu koronawirusa na podstawie głosu. Vocalis Health, firma utworzona i kierowana przez izraelski rząd, zbiera dane od obywateli USA. Mając milion nagrań głosowych przedsiębiorstwo w dalszym ciągu potrzebuje kolejnych 100 000 do wzbogacenia bazy danych. W budowaniu finalnego
Badacze z izraelskiego uniwersytetu znaleźli sposób na podsłuchiwa-
produktu uczestniczy NeuroLex Laboratories, którzy niedawno zbierali
techmo.pl
nie na odległość. Specjalnie przygotowana aparatura i zaawansowa-
fundusze dla swojej platformy głosowej na platformie Indiegogo. Rezultat
Newsletter
ny algorytm potrafią odczytać rozmowy w pomieszczeniu z żarówką.
prac poznamy pod koniec 2021.
www
bit.ly/NewsletterTechmo
/company/techmo-sp.-z-o.o.
/TechmoVoice
Okazuje się, że żarówka może działać jak mikrofon i zbierać informacje z otoczenia. Jakość dekodowania sygnału pozwala na identyfikację śpiewanej piosenki lub zrozumienie rozmowy. Uspokajamy, że działa to
Prawo jazdy „wysłyszysz” w głosie
jedynie ze swobodnie wiszącymi źródłami światła :)
Okazuje się, że informacje zawarte w głosie skrywają nasze nabyte
źródło: cyfrowa.rp.pl
/Techmo_Voice
Youtube
/techmovoice
źródło: mintpressnews.com
umiejętności. Uniwersytet Tokijski opublikował podsumowanie badań, w których określano zdolność prowadzenia pojazdów w oparciu o naciąg dalszy na następnej stronie
4
zarejestrowanie odpowiednich wypowiadanych fraz oraz wykorzystanie
RAPORT ROCZNY
odpowiedniej metodologii, pozwoliło na zbudowanie modelu do oceny umiejętności jazdy. źródło: openaccessgovernment.org
Baza audio do wykrywania Alzheimera Głos wzbudza zainteresowanie badaczy w zakresie jego potencjału jako
2020
Bezpieczniej z technologią głosową Obecnie w Polsce technologia głosowa najwięcej zastosowań znajduje w systemach obsługi klienta. Warto poznać nieszablonowe projekty z wykorzystaniem rozpoznawania mowy. Jednym z nich jest głosowy wyłącznik bezpieczeństwa, który będzie zastosowany w przemyśle. Letus Capital, we współpracy z Softblue, opracuje prototyp, przetestuje i wprowadzi na
biomarkera wielu chorób. Po licznych eksperymentach zakończonych
rynek produkt komercyjny. Urządzenie bazować będzie na rozwiązaniu
sukcesem, w środowisku akademickim pojawiła się inicjatywa zbudo-
ETOS. To pierwszy na świecie system zabezpieczeń, który wykrywa ludzki
wania bazy danych do kolejnych projektów. Uniwersytet w Pensylwanii
krzyk z dźwięków otoczenia.
już teraz zbiera wolontariuszy, który zechcą udzielić zanonimizowanych odpowiedzi na zdefiniowane pytania. Przekazane dane mają umożliwić stworzenie narzędzia, które pozwoli wykryć Alzheimera za pomocą gło-
źródło: wysokienapiecie.pl
Precyzja i poufność mogą iść w parze Dostarczenie skutecznego rozwiązania głosowego, przy zachowaniu wy-
su i analizy odpowiednich fraz. źródło: medicalxpress.com
Więcej o Techmo:
« SIERPIEŃ
grania ludzkiego głosu. Przeprowadzenie symulacji jazdy samochodem,
sokich standardów poufności, to duże wyzwanie dla firm. Z pomocą przychodzą wyniki prac Imperial College London. Naukowcy połączyli dane
Sztucznym głosem już nie oszukasz
głosowe i preferencje prywatności jako informacje pomocnicze. Taki me-
W odpowiedzi na zjawisko vishingu (voice phising), powstała nowa for-
chanizm pozwala odfiltrować wrażliwe atrybuty z zarejestrowanej mowy,
techmo.pl
ma ochrony konsumentów przed omawianą formą oszustwa. Naukowcy
które często stanowią sposób na złamanie zabezpieczeń. Zasada działania
Newsletter
z firmy CSIRO opracowali rozwiązanie uniemożliwiające fałszerstwo
technologii jest wyjaśniona w artykule w linku poniżej.
www
bit.ly/NewsletterTechmo
/company/techmo-sp.-z-o.o.
/TechmoVoice
/Techmo_Voice
Youtube
/techmovoice
z wykorzystaniem cudzego głosu. VOID, gdyż tak nazywa się rozwiązanie, identyfikuje różnice widma częstotliwości sygnału „żywego” głosu
źródło: venturebeat.com
z nagraniem odtwarzanym przez głośnik. Twórcy deklarują, iż oprogra-
Kto jest celem vishingu?
mowanie wykazuje wysoką dokładność oraz responsywność i niską za-
Zjawisko voice phishingu jest bliższe, niż może nam się wydawać. Od
sobożerność w porównaniu do modeli opartych na DNN.
początku lipca ma miejsce seria wyłudzeń w serwisie Twitter. Włamania
źródło: helpnetsecurity.com
na konta wielu znanych osobistości stanowią wierzchołek góry lodowej ciąg dalszy na następnej stronie
5
schemat działania: hakerzy podszywają się pod nowych pracowników,
RAPORT ROCZNY
2020
w celu uzyskania z działów IT dostępu do prywatnych sieci przedsiębiorstwa. Problem staje się na tyle poważny, że interwencje podejmują agendy rządu amerykańskiego. źródło: krebsonsecurity.com
Co trapi telemedycynę? Na łamach serwisu Forbes pojawił się wpis o roli telemedycyny w popra-
www
techmo.pl
Newsletter
bit.ly/NewsletterTechmo
/company/techmo-sp.-z-o.o.
/TechmoVoice
/Techmo_Voice
COVID wzmaga automatyzację Prof. Andrzej Sobczak, redaktor serwisu Robonomika.pl opowiedział o przyspieszeniu robotyzacji i automatyzacji procesów w gospodarce. Choć zostały wymuszone przez pandemię, ich skutki odczujemy dopiero za kilka lat. Istotny element stanowi transformacja w call center: włączanie voicebotów w proces obsługi klienta. Cieszy nas wskazanie wdrożeń z technologią Techmo jako najciekawszych tego typu. źródło: wnp.pl
wie służby zdrowia. Obecnie narzędzie w głównej mierze służy do pro-
Wyzwanie voice-AI w branży gier
wadzenia działań przesiewowych, zapewniając tym samym szybsze roz-
Stały rozwój syntezowanego głosu sprzyja możliwościom zastosowania
poznanie określonych pacjentów. Jednocześnie dostrzega się potrzebę
go w kolejnych gałęziach biznesu, które poszukują nowych sposobów pod-
znacznego podniesienia pewności identyfikacji dzwoniących, w kontek-
noszenia jakości usług. Obecnie studia tworzące gry komputerowe coraz
ście wykrywania nadużyć w dostępie do służby zdrowia. Rozwiązaniem
odważniej operują narzędziami przetwarzania tekstu na mowę. Wprowa-
według autora artykułu są systemy typu multifactor.
dzenie nowych technologii w proces produkcyjny jest szansą na zautomatyźródło: forbes.com
Więcej o Techmo:
« WRZESIEŃ
procederu. W ostatnim czasie liczne korporacje odnotowują taki sam
Telefoniczne nękanie w Państwie Środka
zowanie tysięcy godzin pracy z głosem. źródło: venturebeat.com
Telemarketing w Chinach osiągnął nowy poziom działania. Firmy świad-
Wszystko w porządku?
czące takie usługi zostały wyposażone w rozwiązania oparte na sztucz-
W Światowy Dzień Zapobiegania Samobójstwom (10 września) w Sydney
nej inteligencji. Nowi asystenci telefoniczni wykonują tysiące połączeń
rozpoczęła się nietypowa kampania OOH. Interaktywna tablica, z modu-
dziennie, posługując się wieloma chińskimi dialektami. Nie okazują zmę-
łem rozpoznawania mowy, odpowiada na pytanie „Czy wszystko w porząd-
czenia ani irytacji. Nie można tego powiedzieć o ich rozmówcach. Chiń-
ku?”. W dalszej konwersacji udziela informacji co powiedzieć i zrobić, gdy
czycy każdego dnia otrzymują po kilka telefonicznych ofert pożyczek,
usłyszymy od znajomych czy rodziny odpowiedź „nie”. Ma to pomóc Austra-
nieruchomości, zajęć fitness, a nawet fałszywych certyfikatów. W prak-
lijczykom w rozmowach z osobami dotkniętymi depresją.
tyce niemal niemożliwe jest zablokowanie takich połączeń.
źródło: graphicdisplayworld.com
źródło: asiaone.com
Youtube
/techmovoice
ciąg dalszy na następnej stronie
6
RAPORT ROCZNY
Więcej o Techmo: www
techmo.pl
Newsletter
mal tak dokładnie, jak wynikało to samooceny i kwestionariuszy wypeł-
Naukowcy z Georgia Institute of Technology opracowali urządzenie,
nianych przez samych badanych.
które można nazwać stetoskopem XXI wieku. Zadaniem chipa jest rejestrowanie dźwięków z serca i płuc, niesłyszalnych dla ludzkiego
Chorobo, daj się usłyszeć
pracę narządów. Chociaż główna zasada inżynieryjna jest prosta, to
Magazyn Nature pochyla się nad obecnymi osiągnięciami w wykorzy-
10 lat trwało wypracowanie czujnika, który jest sprawny i gotowy do
staniu głosu jako biomarkera. Już teraz na świecie wiele niezależnych
produkcji.
projektów osiągnęło realne sukcesy w diagnozowaniu chorób. Analiza
/company/techmo-sp.-z-o.o.
/TechmoVoice
/Techmo_Voice
cech głosu w warunkach laboratoryjnych pozwala na klasyfikowanie autyzmu z 80% skutecznością, Alzheimera z 82%, a test mowy dla osób z Parkinsonem uzyskuje skuteczność na poziomie 99% procent. Głos
Finowie wspierają głos
powoli staje się wiarygodnym wskaźnikiem do codziennego użytku me-
Skompletowanie odpowiednio dużej, zróżnicowanej bazy danych to
dycznego.
kluczowy element w prowadzeniu badań. Opracowywanie technologii głosowej nie jest wyjątkiem, szczególnie gdy celem jest zbudowanie
źródło: nature.com
kompleksowego rozwiązania. Finlandia, poprzez przedsięwzięcie „Do-
Głos może pomagać na niebie
nate Your Speech”, dąży do opracowania narzędzia do rozpoznawania
Zakończył się projekt VOICI (Voice Crew Interaction) realizowany ra-
mowy różnych dialektów fińskich i stylów mówienia. Badacze chcą po-
mach europejskiego programu Czyste Niebo 2 (będącego częścią Ho-
zyskać 10 000 godzin mowy. Całe przedsięwzięcie jest finansowane
ryzont 2020). W oparciu o warunki odwzorowujące pracę w kokpicie
z pieniędzy publicznych.
Falcona 2000, postawiono za cel opracowanie inteligentnego „naturalźródło: sztucznainteligencja.org.pl
bit.ly/NewsletterTechmo
źródło: dailymail.co.uk
ucha. Uzyskane sygnały są poddawane analizie, która pozwala ocenić
źródło: machinedesign.com
« PAŹDZIERNIK
2020
Nanobot wysłyszy stan zdrowia
AI usłyszy samotność
nego asystenta załogi” na poziomie TRL 3 (poziom gotowości technicznej). W głośnym środowisku możliwe jest przechwytywanie głosu przy mówieniu bezpośrednio do mikrofonu. Dla systemu działającego w ar-
Pracownicy z Uniwersytetu Kalifornijskiego w San Diego podzielili się
chitekturze on-premise wykazano współczynnik WER (word error rate)
z rezultatami analiz wypowiedzi osób starszych. Okazało się, że sztucz-
w warunkach lotu na poziomie 5%.
na inteligencja może zostać wykorzystana do identyfikacji poczucia osa-
źródło: cordis.europa.eu
motnienia. W badaniach zostało zastosowane narzędzie IBM Watson. Algorytm analizował wyrażenia i przerwy w rozmowie. W rezultacie AI
Youtube
/techmovoice
oceniała objawy samotności z 94-procentową dokładnością, czyli nie-
ciąg dalszy na następnej stronie
7
RAPORT ROCZNY
Więcej o Techmo: www
techmo.pl
twierdzenia pacjentów zakażonych. Jednocześnie prawidłowo wska-
Accenture oraz Revenue (irlandzka agenda rządowa) przybliżyło rezul-
zał 100% osób zakażonych, lecz bez widocznych objawów.
taty wdrożenia dla Irlandzkiego Urzędu Skarbowego. System voicebota jest złożony z ponad 200 unikalnych kroków dialogowych, obejmu-
Higieniczny głos
21 intencji. W ciągu pierwszych sześciu tygodni bot obsłużył już ponad
Firma Adobe przedstawiła wyniki ankiety przeprowadzonej na 1000
2000 połączeń. Obecnie 55% połączeń jest obsługiwane całkowicie
użytkowników technologii głosowych w USA. Pytania dotyczyły do-
przez agenta wirtualnego.
świadczeń i zachowań z aplikacjami wykorzystującymi mowę. Wykaza-
Bezpieczny głos tylko dla wojska Zespół naukowców z Wydziału Elektroniki WAT opracował mikro-
/TechmoVoice
/Techmo_Voice
restrykcji sanitarnych. 86% respondentów zgodziło się ze stwierdzeniem, że technologia głosowa może przyczynić się do bardziej higienicznego uczestnictwa w wydarzeniach lub wizyt w firmach.
telefon, który potwierdzi tożsamość rozmówcy. Urządzenie działa podczas rozmów przez telefon, komunikator internetowy i radio-
źródło: venturebeat.com
stację. Uzupełnieniem technologii jest token znaku wodnego, który
Komputer lepszy w mowie spontanicznej
rozpoznaje tożsamość w mediach cyfrowych poprzez unikalny PIN.
Naukowcom z Karlsruhe Institute of Technology (KIT) udało się
Aparaturę wyprodukowano w ograniczonej liczbie egzemplarzy
opracować algorytm, który przewyższa umiejętności ludzi w rozpo-
i nie jest dostępna na rynku usług komercyjnych ani sprzętu elek-
znawaniu mowy spontanicznej w czasie rzeczywistym. System ten
tronicznego.
osiąga współczynnik błędów na poziomie 5%, czyli o 0,5% mniej niż źródło: naukawpolsce.pap.pl
bit.ly/NewsletterTechmo
/company/techmo-sp.-z-o.o.
no, że użytkownicy korzystają chętniej z technologii głosowej na więcej sposobów. Istotną kwestią okazała się również możliwość utrzymania
Newsletter Linkedin
źródło: news.mit.edu
jących 18 możliwych przypadków użycia. Ma zdolność do rozpoznania
źródło: accenture.com
« LISTOPAD
2020
Irlandzki voicebot skarbowy
COVID znaleziony w głosie W ostatnich miesiącach na świecie prowadzone są prace nad możliwością wykrywania koronawirusa z nagrania audio z smartphone’a.
człowiek. Badacze przyznają, że rozwój tej “umiejętności” dla AI ma szansę zapewnić lepszą interakcję głosową z maszynami w postaci swobodnej komunikacji czy precyzyjnego tłumaczenia symultanicznego. źródło: kit.edu
Pracownicy MIT jako jedni z pierwszych podzielili się wynikami. Jak czytamy we wpisie, do wytrenowania modelu wykorzystano 4000 nagrań kaszlnięć, w tym około połowa osób z pozytywnym wynikiem
Youtube
/techmovoice
COVID-19. W rezultacie algorytm wykazał 98,5% skuteczności po-
ciąg dalszy na następnej stronie
8
2020
« GRUDZIEŃ
RAPORT ROCZNY
pominają o kwestiach bezpieczeństwa danych. To obszar do pojawienia
Asystent głosowy dla policji
się kolejnych innowacji.
Krakowski oddział Motoroli pracuje nad asystentem głosowym ViQi, dedykowanym policjantom. Produkt jest już gotowy, trwa jego udoskonala-
źródło: sifted.eu
nie i pozyskiwanie klientów. Rolą technologii jest udzielanie informacji
Analiza zyskuje na znaczeniu
znajdujących się w wewnętrznych zasobach, np. czy samochód jest kra-
W wyniku współpracy amerykańskiego NICE oraz Enacomm ogłoszo-
dziony. Co ważne, system obsługiwany jest głosowo. Ma to być wsparcie
no powstanie narzędzia do automatycznego wykrywania oszustw, de-
dla funkcjonariuszy podczas patroli, którzy w praktyce często pracują
dykowanego dla branży contact center. Produkt został zbudowany na
w pojedynkę. Póki co rozwiązanie jest przeznaczone na rynek amerykań-
złożonym modelu o wysokiej zdolności predykcji oraz interpretacji, któ-
ski. Czekamy na wersję polską.
ry skanuje miliony interakcji głosowych jednocześnie w celu wykrycia źródło: biznes.lovekrakow.pl
nietypowych i ryzykownych zachowań, w tym żądań zmiany adresów lub metod uwierzytelniania. Pierwszym partnerem została firma Boku,
Izrael testuje COVID w Indiach
dzięki której powstaną nowe reguły pomagające wykrywać niepożąda-
Firma Vocalis Health zakończyła w Mumbaju w Indiach trzymiesięcz-
ne zdarzenia.
ny program pilotażowy rozpoznawania COVID-19 w głosie. W wyniku
źródło: biometricupdate.com
działań przeprowadzonych z lokalnymi władzami firma uzyskała ponad 2000 nagrań do analizy pomiaru skuteczności i niezawodności testu Więcej o Techmo: www
głosowego na obecność wirusa. Podjęte działania stanowią część prac R&D mających na celu stworzenie aplikacji mobilnej, która na podstawie
techmo.pl
30-sekundowych nagrań oraz AI oceni pacjenta pod kątem obecności
Newsletter
koronawirusa.
bit.ly/NewsletterTechmo
/company/techmo-sp.-z-o.o.
/TechmoVoice
/Techmo_Voice
źródło: voicebot.ai
Popularyzacja za wszelką cenę? W serwisie sifted.eu pojawił się tekst o ochronie danych w świetle rozwoju technologii głosowych. Obecnie wiele wiodących firm potrafi rozpoznawać głos na wysokim poziomie dokładności, co według autora jest dopiero początkiem rozwoju zbudowanych na tym narzędzi. Przy rosną-
Youtube
/techmovoice
cej wygodzie korzystania z technologii głosowej, użytkownicy łatwo za-
Techmo Sp. z o.o., ul. Torfowa 1/5, 30-384 Kraków Teksty i opracowanie: Hubert Onisk, Piotr Stankiewicz, Iwona Jendernal, Bartosz Ziółko Opracowanie graficzne: Piotr Słota Kraków, styczeń 2021 r.
9