10 minute read

ARANTZA DEL POZO

Next Article
ERRAMUN OSA

ERRAMUN OSA

ETORKIZUNEKO INTERAKZIO-INTERFAZEAK

ARANTZA DEL POZO

Advertisement

AHOTS ETA HIZKUNTZA TEKNOLOGIEN ZUZENDARIA VICOMTECH

NOLAKOA IZANGO DA ETORKIZUNEKO GIZARTEA?

Gailu digitalek garrantzi handia dute gure egunerokotasunean. Gure eguneroko bizitza gero eta digitalagoa da eta gero eta gailu eta prozesu digital gehiago erabiltzen ditugu elkarrekin konektatzeko. Eta ez bakarrik lanean, baita gure bizitza pribatuan eta espazio publikoa deritzogunean ere. Gaur egun, gizartean informazio trukea oro har interfaze digitalen bidez egiten dugu. Tren, autobus edo metroan sartzerakoan, jendea bere mugikorra, tableta edo ordenagailua begiratzen ari da. Plataforma digitalak mundu osoko milioika pertsonen egunerokotasunean txertaturik daude, mundu globalean erosketak egiteko (Amazon, Alibaba), eduki digitalak kontsumitzeko (Netflix, Youtube, Spotify) edota informazioa partekatzeko (Facebook, Twitter) erabiltzen ditugularik, gehienbat. Asko dira joera honen onurak. Datu kopuru astronomikoak berehala eskura ditugu. Berehala jar gaitezke harremanetan gure lagun eta maiteekin. Lan konplexuak azkarrago eta errazago egiteko gai gara. Gure finantzak eta negozioak hatz batekin kudea ditzakegu. Administrazio publikoari konektatuta gaude. Emankorragoak, lehiakorragoak, berritzaileagoak izan gaitezke. Gure bizitza sare sozialen bidez dokumentatu dezakegu, informazioa hodeian gorde, komunikazioa kontrolatu… Gailu eta plataforma horiek guztiek interakzio-interfazeak dituzte. Interfaze bat teknologiarekin nahi dugun emaitza lortzeko elkarrekin eragiteko dugun modua da. Behar bezala diseinatuta badago, erabiltzailea eroso sentituko da makinarekin elkarreraginean. Historikoki, interfaze mota asko erabili ditugu. XX. mende amaieran, teklatuak konputazio teknologiarekiko giza elkarrekintza menderatzen zuen. Hala ere, teklatua hobekuntza handia izan zen 1940 eta 1950eko hamarkadetan ordenagailu goiztiarrak programatzeko erabiltzen ziren punch-txartelen gainean. 1980ko hamarkadaren hasieran erabiltzaile interfaze grafikoak eta saguak izugarri aldarazi zuen ingurunea, bi berrikuntza horiek gertaera sismiko bat sortu zutelarik eremu teknologikoan. Apple etxeak milioi bat Macintosh salduta zituen 1988 urtean eta IBM, Compaq eta beste batzuek ildo berdina jarraitu zuten euren ordenagailuetako saguei esker. 1990eko hamarkada hasi zenean, ordenagailu eramangarriak mahai gaineko ordenagailuei aurrea hartzen hasi ziren. Hortik aurrera, aldaketa inkrementalak etorri ziren sagu eta teklatu interfazeetan, hala nola

sagu optikoa edo korritze-gurpila, informatikak miniaturizatzen jarraitzen zuen bitartean. 2000ko hamarkadaren bukaerak jauzi handia ekarri zuen interfazeen diseinuan. Puntu anitzeko ukimenak erabiltzaileei eduki digitalekin sagurik gabe modu berrietan elkarrekin eragiteko aukera eman zien. Eta hurrengo urteetan, telefono mugikor eta tableten fabrikatzaile guztiek ukimen interfazeak integratu zituzten. Gaur egun, ukimena eduki digitalekin elkarrekintzan aritzeko modua da, ez bakarrik telefono mugikor eta tabletetan, baizik eta kiosko, kutxazain automatiko eta etxetresna elektrikoetan ere1 . Interfaze guztien gakoa elkarrekintza naturala egitea da. Beraz, etorkizuneko interakzio-interfazeek pertsona batekin hitz egitea bezain naturalak izan beharko lukete. Elkarrekintza, gehienbat, ahotsaren, keinuen, aurpegi-adierazpenen eta marrazkien bidez eginez. Atzera begiratuta, ikus dezakegu teklatuak eta saguak benetan hizkuntza naturalaren eta informatika-gailuen arteko aldea estaltzeko asmoarekin sortu zirela. Eta ondo funtzionatu dutela 30 urte baino gehiagotan. Orain, berriz, gure ahotsa, atzamarrak eta gorputzak kontutan hartzen dituzten interfaze naturalagoetara itzultzeko bidean gaude. Gaur egun, ahots interfazeak eta aplikazioak edonon aurki daitezke jada: telefono mugikorretan, telebistetan, etxe adimendunetan, bozgorailuetako ahots-laguntzaileetan eta beste hainbat gailutan. Eta hori bakarrik hasiera da: ahots-teknologien merkatua 11.000 milioi dolarrera iritsi zen 2019. urtean Estatu Batuetan eta 2025erako % 17 inguru handitzea espero da2. Ahots-elkarrekintzarako ahalbideen garapen azkarrak argi uzten du ahots eta hizkuntza teknologiak interfaze grafiko tradizionalen aukera bihurtzen ari direla.

ZER DIRA AHOTS ETA HIZKUNTZA TEKNOLOGIAK?

Ahots eta Hizkuntza Teknologiek giza hizkuntza, ahozkoa zein idatzia, prozesatzea helburu duten teknika, metodo eta algoritmo multzoak osatzen dituzte. Erraldoi teknologikoek (Google, Amazon, Microsoft, IBM, Facebook) urte batzuk daramatzate teknologia horietan inbertitzen. Eta horrek, besteak beste, oso azkar aurreratzea eta jendarteratzea lortu du. Nork ez ditu txatbotak eta ahots-laguntzaileak ezagutzen? Bestalde, ikaskuntza sakonak irauli egin ditu. 2017an Microsoftek giza zehaztasuna gainditu zuen telefono bidezko elkarrizketak transkribatzeko sistema bat garatu zuen3. Agian konturatuko zineten GoogleTranslate-ko itzulpenak duela urte batzuk baino askoz ere naturalagoak direla. Hori horrela da oraingo itzulpen automatikoko teknologia ikaskuntza sakonean oinarrituta dagoelako. Are gehiago, eredu neuronalak ohiko hizkuntza naturalaren prozesamenduko tekniken emaitzak hobetzen ari dira oinarrizko zereginetan, hala nola izendatutako entitateen detekzioan edo sentimenduen azterketan4. Emaitza hauek guztiak arkitektura neuronal berriei esker lortu dira, bai eta erabilgarri dauden datu kopuru handiei eta horiek prozesatzeko garatu diren hardware azpiegiturari esker: Microsoften ezagutzailea 2.000 ordu eta 165 mila hitzeko hiztegiarekin entrenatu zen; itzulpen neuronaleko sistema batzuk dozenaka milioi esaldi paralelorekin entrenatzen dira; modeloak GPU (ingelesetik, Graphical Processing Unit) ugari dituzten zerbitzarietan entrenatu ohi dira. Zehazkiago, Ahots eta Hizkuntza Teknologiak honako multzoetan sailka daitezke: • Ahotsaren Prozesamendua: audiotik informazio baliagarria eskuratzeko balio duten algoritmo eta teknikak,

1. Asher, Mark “The History of User Interfaces – And Where They Are Heading, CMO by Adobe, 2017

2. H. Tankovska “Voice technology – Statistics & Facts, Statista, August 2020

3. Xuedong Huang, “Microsoft researchers achieve new conversational speech recognition milestone”, Microsoft Research Blog, August 2017

4.Young et al. “Recent Trends in Deep Learning Based Natural Language Processing”, IEEE Computational Intelligence Magazine 13(3):55-75, 2018

hala nola, ahotsaren ezagutza eta sintesia edo aplikazio biometrikoak. • Hizkuntza Naturalaren Prozesamendua: testuen esanahia deszifratzeko erabiltzen diren metodoak, hala nola, informazio erauzketa, sentimenduen analisia, galderen erantzuna edo testuen laburpena. • Itzulpen Automatikoa: hizkuntzen arteko mugak apurtzeko erabiltzen diren algoritmo eta metodologiak, hala nola, testuen itzulpena, ahotsaren itzulpena, hauek entrenatzeko behar diren datuak ustiatzeko teknologia eta emaitzen kalitatearen neurketa. • Elkarrizketa Sistemak: pertsona eta makinen arteko interakzio naturalak lortzeko teknikak, hala nola, hizkuntza naturalaren ulermena, elkarrizketaren kudeaketa, hizkuntza naturalaren sorkuntza edo elkarrizketa multimodalak.

EUSKARA ERABILTZEKO EREMU BERRIAK

Ahots eta Hizkuntza Teknologien emaitzarik onenak aplikazio-eremura egokitzen direnean lortzen dira. Horretarako, datuak behar dira eta zehazki, audioak eta testuak. Ahots eta Hizkuntza Teknologien aplikazio eremu zuzenena Hizkuntzen Industriarena da, hau da, hizkuntzen tratamenduarekin zerikusia duten produktu eta zerbitzuak diseinatzeaz, ekoizteaz eta komertzializatzeaz arduratzen den jarduera sektorea. Itzulpengintza, irakaskuntza eta edukien inguruan zerbitzuak ematen dituzten enpresek osatzen dute. Euskarak presentzia handia du eremu honetan5: giza itzulpengintza, bikoizketa eta interpretazio zerbitzuak euskaraz eskaintzen dituzten enpresak badaude; hizkuntzen ikaskuntzan, ikaskuntza arautuan, master eta doktorego programa askotan euskara da komunikazio hizkuntza; eta edukien industria bat ere badago euskararen inguruan. Alor horretan, Ahots eta Hizkuntza teknologiak itzulpen-, bikoizketa- eta interpretazio-prozesuak laguntzeko, ariketak sortzen eta zuzentzen laguntzeko edota ikus-entzunezko edukiak azpititulatzen eta bikoizten laguntzeko erabili daitezke. Hala ere, beste aplikazio eremu batzuetan ez da horrelakorik gertatzen. Industria eta Fabrikazioaren alorrean, adibidez, oinarrizko informazioa eta kudeaketa sistemek oraindik gaztelania erabiltzen dute gehienbat, nahiz eta euskararen presentzia hemen ere areagotzeko ekimenak sortzen hasi diren. Hauen artean, INDEUS Industriaren Euskal Plataforma6 aipagarria da, euskaraz lan egitea erabaki duten hogeitik gora enpresek osatzen dutena. Ahots eta Hizkuntza teknologiek balioa eman diezaiokete sektore industrialari honako lau ildo nagusietan: (1) kudeaketa sistemekin, business intelligence tresnekin edo makina eta robotekin interfaze naturalagoak garatzen laguntzeko; (2) dokumentazio teknikoaren koherentzia bermatzen laguntzeko, kalitate handiko domeinuko itzulpen automatikoak lortzeko eta eskuliburuetan dagoen informazioaren kontsultak errazteko; (3) egiturarik gabeko testu libreetan gordetako informazioa aztertu ahal izateko eta datuen analisietatik eratorritako txostenak sortzen laguntzeko; edo (4) bezeroen ohiko kontsultak erantzuten laguntzeko eta erabiltzaileen autozerbitzua sustatzeko. Hau dena ez bakarrik gaztelaniaz, euskaraz ere bai. Orain dela gutxi abiarazi da makinekin eta automatismoekin interakzioan aritzeko euskarazko terminologia eta korpusa formalizatzea helburu duen Eusko Jaurlaritzak finantzaturiko EKIN ikerketa proiektua, sektorean elkarrizketa-interfazeak euskaraz ere garatu ahal izateko helburuarekin, besteak beste7 .

5. Langune, Hizkuntza Industrien Elkartea Euskal Herrian, 2020ko Azaroak 23an ikusia, <https://www.langune.eus>

6. INDEUS, Industriaren Euskal Plataforma, 2020ko Azaroak 23an ikusia, <https://www.euskadi.eus/eusko-jaurlaritza/-/albistea/2020/indeus-industriaren-euskal-plataformak-2020rako-helburuak-aztertu-ditu-euskara-industriaren-arloan-sustatzeko>

7. Vicomtech-eko I+G+b Proiektuak, 2020ko Azaroak 23an ikusia, https://www.vicomtech.org/eu/igb-egiaztagarria/proiektuak?tecnologia=8

Euskararen erabilera oraindik txikia den beste eremu bat osasunaren esparrua da. Gaur egun pazienteen eta medikuen arteko kontsulta-elkarrizketak batzuetan euskaraz egiten diren arren, osasun-kudeaketako sistemetan informazioa gaztelaniaz gordetzen da, euskaldunak ez diren beste osasun-langileek ulertu ahal izateko. 2019an, osasun-txostenak gazteleratik euskarara eta baita euskaratik gaztelerara ere itzuliko dituen itzultzaile automatiko neuronal bat garatzeko eta ezartzeko proiektua hasi zuen Osakidetzak8. Itzultzailea hobetu ahal izateko, osasun-langileak osasun-txosten erreal elebidunak idazten ari dira. Testuinguru honetan ere, ahots eta hizkuntza teknologiak baliogarriak izan daitezke osasun-sektorearentzat: historia kliniko elektronikoetako testu libreak egituratuz big datako aplikazioetan ere erabili ahal izan daitezen; ohar klinikoak automatikoki transkribatuz; osasun prozesuetan lagun dezaketen elkarrizketa-interfazeak garatuz; edo kontsultetan trukatutako informazioa automatikoki transkribatu eta egitaratuz, medikuek pazienteekin egoten denbora gehiago eman ahal dezaten. Euskararen erabilerako beste eremu berritzaileak Energia, Garraiobideak edota Administrazio Publikoko bestelako alorrak izan daitezke, hala nola, Justizia, Herritarren Arreta edo Segurtasun Digitala – berri faltsuen inguruan, adibidez, ahots eta hizkuntza teknologiarekiko interes handia erakusten ari dena. Azkenik, ahaztu behar ez dugun beste eremu garrantzitsu bat, lehen aipatu ditugun eta gure egunerokotasunean hainbeste erabiltzen ditugun gailu eta plataforma digitalak dira. Gailu gehienak merkatu globalari heltzen dioten atzerriko fabrikatzaileek sortzen dituzte. Merkatu horretan, hizkuntza gutxituek kuota txikiagoak dituzte, eta, beraz, euskara ez dute denek maila berdinean bermatzen. Microsoft-ek eta Google-k bai, baina Apple-k, adibidez, ez du oraindik euskara aldez aurretik instalatuta datozen hizkuntzen artean sartzen. Plataformekin ere gauza berdina gertatzen da eta askok ere ez dute euskara beren hizkuntzen artean sartzen. Facebook, Twitter eta Youtube-k bai, baina ez litzateke ondo egongo Amazonen erosketak euskaraz egin ahal izatea edo Netflixen edozein eduki euskaraz ikusi ahal izatea etorkizunean?

Aurrerapen teknologikoen ondorioz, azken urteotan euskarazko ahots eta hizkuntza teknologia aurreratuak gizarteratzen hasi dira. Horien artean, itzulpen automatikoa eta ikus-entzunezko edukien transkribapena dira aipagarrienak. Itzultzaile neuronalek jauzi handia eman dute itzulpen automatikoen kalitatean euskara eta beste hizkuntzen artean. Hori dela eta, euskararako hainbat itzultzaile neuronal garatu dira. Vicomtech-eko itzulpen automatiko neuronaleko teknologia honako ekimen hauetan transferitu eta integratu dugu: Eusko Jaurlaritzaren Itzuli itzultzaile neuronalean9, MondragonLingua enpresaren Lingua. eus itzultzailean10 eta gure itzultzaile Batuan11 . Azken horren helburua erabilera errealeko datuak biltzea da, oinarrizko teknologia hobetzen jarraitu ahal izateko. Transkribapen neuronalari dagokionez, jauzi kualitatibo handia egin da kalitateari dagokionez hizkuntza guztietan, euskara barne. Ikus-entzunezko eduki batzuetan, hizketak aurrez aldetik definitutako gidoi bat jarraitzen duenean eta soinu-efektu edo zarata askorik ez dagoenean, transkripzio- eta azpititulaketa-prozesuak bizkortzea ahalbidetzen hasi da. Vicomtech-eko transkripzio automatiko neuronaleko teknologia honako ekimen hauetan transferitu eta integratu dugu: Euskadiko gobernu irekiaren Irekia plataforman sortzen dituzten bideoak azpititulatzeko12, Eusko Legebiltzarrak bilkurak

8. Osakidetza Kontratatzailearen Profila, 2020ko Azaroak 23an ikusia, https://www.osakidetza.euskadi.eus/kontratatzailearen-profila// contenidos/anuncio_contratacion/exposakidetza30315/eu_doc/eu_arch_exposakidetza30315.html

9. Itzuli itzultzaile neuronala, 2020ko Azaroak 23an ikusia, https://www.euskadi.eus/itzuli/

10. Lingua.eus itzultzaile automatikoa, 2020ko Azaroak 23an ikusia, https://lingua.eus/eu/itzultzailea

11. Batua, 2020ko Azaroak 23an ikusia, https://www.batua.eus/

12. Irekia, Azpititulatutako bideoak (betan), 2020ko Azaroak 23an ikusia, https://www.irekia.euskadi.eus/eu/web_tv/closed_captions

eta batzordeak transkribatzen laguntzeko NaturalVox enpresaren eskutik13, eta EITBren ikus-entzunezko edukien azpititulaketa prozesuetan laguntzeko.

EUSKARAREN ETORKIZUNAREKIN LOTUTAKO HAUSNARKETA

Hurrengo lerroetan, orain arte deskribatutako testuinguruan euskarak izango duen etorkizunari buruzko hausnarketa azalduko dugu.

Lehenik eta behin, garrantzitsua da kontuan hartzea euskarari onura handia egiten diotela beste hizkuntzetarako garatzen ari diren aurrerapen teknologikoek. Azken hamarkadek adimen artifizialaren garapenaren eta onarpenaren abiadura ikaragarri azkartzen ikusi dute eta erritmoak hurrengo urteetan ere jarraituko du. Ahots, hizkuntza eta keinuetan oinarritutako interakzioen naturaltasuna lehenetsiko duten interfazeak garatzeko bidea hasi da. Txipen errendimendua hobetzen jarraitzen ari da adimen artifizialaren teknologiaren garapenarekin batera eta fabrikatzaileek algoritmoak mugikorretan, sare ertzean edo/ eta hodeian exekutatu ahal daitezen dabiltza lanean. Datuak eta adimen artifiziala elkartzen ari dira eta gero eta datu kopuru handiagoak daude eskuragarri ahots eta hizkuntza teknologien garapenerako. Gainera, hizkuntza baterako aldez aurretik entrenatutako algoritmoak erabiltzen hasi dira emaitza onekin beste hizkuntzetarako, esploratzen hasi berri den algoritmia honek euskara bezalako hiztun gutxiko hizkuntzei onura handiak ekar diezazkiokeelarik.

Bigarren hausnarketa, teknologiari oraindik geratzen zaizkion erronken ingurukoa da. Hizkuntza bakoitzaren ahoskera kokapenaren, taldearen edo bakoitzaren idiosinkrasien arabera alda daiteke, azentuak, gramatika eta hiztegiaren erabilera barne. Aldaketa horiek hizkuntza bereko hiztunei elkar ulertzea galaraz diezaieke eta ahotsaren ezagutzarako erronka esanguratsua aurkezten dute. Azentuei, dialektoei eta hizkuntzako beste eskualde-aldaketei aurre egiteko, hizkuntza-pakete espezialistak garatzen dira normalean emaitza fidagarriak bermatzeko. Euskalkien kasuan, ildo horretan lan handia geratzen da oraindik egiteko. Bestalde, hizkera espontaneoa ahots ezagutza sistemek aurre egin beharreko beste erronka garrantzitsu bat da. Hizkera mota horren ezaugarririk nagusiak geldialdiak, errepikapenak eta hasiera faltsuak dira. Funtsean, testutik ezberdina da eta pertsonen arteko komunikaziorako optimizatua dago, ahots teknologia garatzeko erabiltzen diren datuetatik urruntzen delarik. Hurrengo urteotan, aurrerapausoak eman beharko lirateke lan ildo honetan ere bai.

Azkenik, datorkigun mundua benetan hemen dagoela jada ohartarazi behar dugula eta esparru berrietan euskara bermatzeko estrategia teknologiko bat beharrezkoa dela. Gure eguneroko bizitzan gailuak eta plataformak erabiltzen ari gara. Industria eta Osasungintza bezalako sektore estrategikoetan euskara bultzatzeko ekimenak martxan jartzen ari dira. Euskarazko ahots eta hizkuntza teknologia aurreratuak garatzen eta erabiltzen hasi dira. Euskara ere erabilera eremu berri guztietan egon dadin, estrategia teknologiko bat definitzea beraz ezinbestekoa da. Euskaraz dauden datu guztiak nola bildu, biltegiratu, kudeatu, partekatu eta erabili daitezkeen aztertzeko. Eta datu horiek euskarazko ahots eta hizkuntza teknologiak entrenatzeko behar den moduan etiketatu ahal izateko. Erronka polita dugu aurrean, eta horri ekiteko lankidetza publiko-pribatu eraginkorra ziurrenik beharrezkoa izango da.

13. Eusko Legebiltzarra Kontratatzailearen Profila, 2020ko Azaroak 23an ikusia, https://www.euskadi.eus/web01-tramite/es/contenidos/anuncio_contratacion/expjaso14765/es_doc/es_arch_expjaso14765.html

This article is from: