Vox cordis 1/2021

Page 14

Tekoälyn uudet kielimallit hämmästyttävät Tekoälyn vallankumous lähti liikkeelle kuvan analysoinnista ja konenäön hyödyntämisestä, mutta nyt parin viimeisen vuoden aikana on kohistu etenkin tekstianalyysista. Kehittyvien koneoppimismallien myötä on syntynyt hyvinkin fiksulta vaikuttavia chatbotteja ja tekstitiivistelmiä, jotka tekoäly on laatinut omia lauseita käyttäen. Laskentatoimen tutkijatohtori Mikko Ranta kertoo, että Open-AI:n kehittämä vallankumouksellinen kielimalli GPT-3 sisältää jopa 175 miljardia parametria. – Se on jo käsittämättömän suuri määrä. Kielimalli on hyvin monimutkainen, sen harjoitusdata sisältää kaikkea mahdollista, mitä internetistä on löydetty aina Reddit-keskusteluista lähtien. Mallin avulla voidaan laittaa vaikkapa Alan Turing keskustelemaan Harry Potterin kanssa aidon kuuloisesti, runoilemaan, koodaamaan, säveltämään uusi kappale tai arvaamaan pikseleistä, mitä puuttuvassa kohdassa kuvaa on. – Vaikka oikeasti tuntuu, että siinä olisi älyä mukana, niin kyseessä on silti vain automaattisen täydentämisen järjestelmä. Takana on valtava tietomassa, jonka perusteella se ymmärtää, miten lauseen tai laulun pitäisi jatkua.

Rannan mukaan mallin massiivinen harjoitusdata tuo mukanaan haasteen. Esimerkiksi englanninkielinen Wikipedia käsittää vain 0,6 prosenttia aineistosta, joten mukaan on ollut pakko kerätä hyvin erityyppisiä lähteitä kuten vaikkapa tekstejä internetin keskusteluryhmistä. – Kun mallia on harjoitettu kaikella mahdollisella, mitä netistä löytyy, niin mukaan on tullut myös esimerkiksi rasistista materiaalia. Aineistossa ja sitä kautta myös mallissa näkyvät ihmisten ennakkoasenteet ja ajattelun vinoumat.

Sittenkin tyhmä kuin ihminen? Alkuinnostuksen jälkeen on huomattu, että vaikka malli kykenee hienoihin saavutuksiin, käytännön sovellusten kannalta malli voi olla vielä liian arvaamaton. Asiakaspalvelijana se voi pahimmassa tapauksessa möläytellä kuin ihminen pitkälle venyneessä baari-illassa. Aineiston heterogeenisyyden vuoksi GPT-3 voi vaikuttaakin Rannan mukaan kuin opiskelijalta, joka ei ole tehnyt kunnolla läksyjään. Mukana saattaa olla tarkkoja faktoja, mutta myös puolitotuuksia tai jopa puutaheinää. Ongelmia voi aiheuttaa myös tulkittavuus. Rannan mukaan koneoppimis-

Käytännön sovellusten ”kannalta kielimalli voi

olla vielä liian arvaamaton. Mallia on harjoitettu kaikella mahdollisella, mitä netistä löytyy. Aineistossa näkyvät ihmisten ennakkoasenteet ja ajattelun vinoumat.”

14

VOX CORDIS 1/2021

mallit ovat jo niin monimutkaisia, että ne ovat eräänlaisia mustia laatikoita, joiden antamien ennusteiden mekanismia ei täysin tunneta. Jos tekoäly hylkää vaikkapa pankin lainahakemuksen syrjivästi, tällainen pitää havaita ja pystyä poistamaan. – Tekoälytutkijat ovatkin keskustelleet siitä, että onko harjoitusdatan ja parametrien jatkuva lisääminen oikea polku älykkäämpään tekoälyyn, vai pitäisikö keksiä jokin aivan uusi, vallankumouksellinen menetelmä. Rannan oma tutkimus liittyy yliopiston digitaalisen talouden tutkimusalustan teemoihin. Hän on kiinnostunut etenkin siitä, miten tekoälyä ja data-analyysia voi hyödyntää laskentatoimen tutkimuksessa. – Minua kiehtoo tekoälyn teknologia, kuten koneoppiminen itsessään, mutta etenkin tekoälyn soveltamismahdollisuudet. Mitä uutta tekoäly voi tuoda esimerkiksi laskentatoimen ja rahoituksen tutkimukseen? Mitä esimerkiksi yritysten tilinpäätöksien tekstiosista voidaan saada irti uusia kielimalleja käyttämällä, pohtii Ranta.


Turn static files into dynamic content formats.

Create a flipbook

Articles inside

Opiskelijat oppivat startupien arviointia

3min
page 27

Urapolulla kohti professuuria

2min
page 45

Akateeminen yrittäjä auttaa kansainvälistymään

2min
pages 42-43

Urapolulla kohti professuuria

1min
page 45

Väitökset: Inhimillinen pääoma tuo kilpailukykyä

1min
pages 40-41

Verkko-opetus haastaa ja innostaa

1min
page 44

Energiaa IoT-laitteisiin ilman paristoja ja sähköjohtoja

1min
page 39

Vetyä ja tuulta tulevaisuuden laivoihin

1min
page 38

Kansainvälisten kontaktien solmiminen kannattaa

2min
pages 34-35

Etätyötutkimus vuorovaikutteisesti esiin

1min
page 37

Arpapeliä kryptovaluuttamarkkinoilla

1min
page 36

Menestyksen polkuja rakentamassa

2min
pages 28-29

Kestäviä askeleita huomiseen

4min
pages 32-33

Viisi syytä puulle

3min
pages 24-27

Blogi: Julkishallinto digitalisoituu - miten käy virkavastuun?

2min
pages 22-23

Bloomberg Lab tuo taitoja työmarkkinoille

2min
pages 20-21

Tekoälyn uudet kielimallit hämmästyttävät

2min
page 14

Kuluttaja datan armoilla

1min
page 18

Kolumni Tiina Helenius: Ennustamisessa on tärkeintä tietää, missä olemme juuri nyt

2min
page 19

Avaruusdata kiihdyttää automatisaatiota

1min
page 15

Tutkimus tuo tekoälyä sähköverkkoihin

2min
pages 16-17

Visuaalisen datan ja 3D-mallinnuksen kehitys etenee vauhdikkaasti

1min
page 13

Datasta uusi sampo?

4min
pages 8-12
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.