2 minute read
Big datan hyödyntäminen koulutuksen kehittämisessä
Älykäs ennakointi -hankkeessa lähestytään ennakointia erityisesti yritysten tarpeiden ja maakunnan työmarkkinoiden näkökulmasta. Yritysten ja toimialojen kasvu sekä muutokset heijastuvat myös varsinaissuomalaisiin koulutusorganisaatioihin, joissa pohditaan jatkuvasti, millaisia valmiuksia tulevien ammattilaisten ja korkeakoulutettujen tulisi hallita menestyäkseen uudenlaisessa työelämässä.
Teksti | Marko Kortetmäki, yliopettaja ja koulutusvastaava, Turun AMK ja Sakari Koivunen, lehtori, Turun AMK
Hankkeessa saatuja tietoja hyödynnetään opintopolkujen ja koulutusten suunnittelussa sekä yritysten uudistumisessa ja liiketoiminnan kehittämisessä.
EU ESR-rahoitteinen Älykäs ennakointi -hanke kohdistuu meri- ja valmistavan teknologiateollisuuden yrityksiin Varsinais-Suomessa.
Lisäksi hankkeessa kerätään data-analytiikan keinoin tietoa osaamisen kysynnän ja tarjonnan tasapainosta Varsinais-Suomessa. Tätä tietoa hyödynnetään koulutusorganisaatioiden koulutussuunnittelun, opintopolkujen profiloinnin sekä työelämäohjauksen tukena yhdessä yritysten kanssa. Hankkeessa hyödynnetään tekoälyä, mikä helpottaa yritysten tarpeiden ja oppilaitosten tuottaman osaamisen kohtaamista.
Opinnäytetyöt louhinta-aineistona
Älykäs ennakointi -hankkeessa louhittiin Theseus-tietokantaa. Theseus on Ammattikorkeakoulujen rehtorineuvosto Arene ry:n tarjoama palvelu, jonne tallennetaan lähes kaikki ammattikorkeakouluissa tehtävät opinnäytetyöt. Louhinta-aineistona käsiteltiin yli 120 000 suomenkielistä opinnäytetyötä eri aloilta. Analysoitujen opinnäytetöiden metadataan liitettiin tieto valmistumisvuodesta, korkeakoulusta ja koulutusalasta. Myös linkki alkuperäiseen työhön säilytettiin siltä varalta, että louhinnan aikana halutaan tutustua kokotekstiversioon opinnäytetyöstä.
Aineistosta tunnistettiin käsitteitä ja käsitteiden verkostoja. Niiden avulla voidaan helposti hakea esimerkiksi kestävää kehitystä, teollisuusrobotiikkaa tai tekoälyä käsittelevät opinnäytetyöt tarkempaan analyysiin. Käsiteverkot muodostettiin älykkään kielimallin avulla niin, että temaattisesti toisiaan lähellä olevat käsitteet esiintyvät ryppäinä. Esimerkiksi koulutussuunnittelussa voidaan tunnistaa tiettyyn alaan liittyviä keskeisiä käsitteitä teollisuudelle tehtyjen opinnäytetöiden sisällön perusteella.
Tekoälyn tunnistamat termit voidaan analysoida myös suhteessa aikaan. Tällöin on mahdollista hakea nousevia trendejä – termejä, jotka ovat viime aikoina alkaneet esiintyä teollisuudelle tehtävissä opinnäytetöissä aiempaa enemmän. Vastaavasti nähdään ne ilmiöt, joita aiemmin on käsitelty paljon, mutta joiden esiintymistaajuus on laskusuunnassa.
Mihin louhintatietoa käytetään?
Louhinnan tuloksia voidaan muun muassa hyödyntää opetussisältöjen kehittämisessä, jatkuvan oppimisen opintokokonaisuuksia suunniteltaessa, yritysyhteistyön syventämiseen ja opinnäytetöiden aiheiden suunnitteluun. Opinnäytetyöt kuvaavat hyvin yritysten tämän hetken kehitysprojekteja ja niissä vaadittua osaamista.
On tärkeää pysyä tietoisena siitä, mitä osaamista yritykset valmistuvilta opiskelijoilta odottavat. Opinnäytetöiden massa on kuitenkin niin suuri, että niiden käsittely manuaalisesti ei ole realistista. Koneellisen louhinnan avulla voidaan kartoittaa isompia trendejä ja sukeltaa tarvittaessa syvällisemmin kiinnostavien teemojen sisälle. Yksi kiinnostava esimerkki louhinnan tuloksista on eri osaamisalueiden välinen vertailu, esimerkiksi robotiikan esiintymistä on kiinnostava tarkkailla ristiin sekä konetekniikan että terveyden alan opinnäytetöissä.
On kuitenkin hyvä huomioida se, että tuloksia saadakseen tulee tehdä raakaa analyysiä louhitusta datasta. Eli itse louhinta ei vielä tuo kuuta taivaalta, mutta louhinta mahdollistaa sen, että pystytään käsittelemään valtavan suuria datoja. Louhitun datan analysoinnissa käytämme Power BI -ohjelmistoa.
Tekoäly auttaa hahmottamaan suurta tietomäärää
Louhittu tietomäärä on valtava, yli 120 000 opinnäytetyötä. Sellaisesta massasta ei voi ilman koneen apua irrottaa merkityksiä ja ilmiöitä. Helpon katsauksen isoon datajoukkoon saa esimerkiksi sanapilvien avulla. Sanapilvessä nousee esiin aineistossa eniten esiintyvät käsitteet.
Sanapilven esittämien yksittäisten trendikäsitteiden jälkeen on mielenkiintoista pureutua eri käsitteiden välisiin yhteyksiin. Käsiteverkostot antavat tämän näkymän massiiviseen aineistoon. Yhteen käsiteverkkoon voidaan rajata esimerkiksi konetekniikan käsitteitä niin, että valitaan kaksi keskuskäsitettä: 3D-mallinnus ja robotiikka. Kummankin keskuskäsitteen ympärille muodostuu temaattisesti näitä lähellä olevia käsitteitä ja keskelle syntyy joukko käsitteitä, jotka yhdistävät 3D-mallinnusta ja robotiikkaa. Vastaava analyysi voidaan tehdä myös koulutusaloittain. Näin voidaan vertailla vaikkapa elektroniikan ja automaatiotekniikan koulutuksia. Käsiteverkon ulkokehälle piirtyy kummankin koulutuksen avainkäsitteitä. Keskuskäsitteiden väliin jäävä yhteinen osuus kuvaa termejä, jotka ovat kummallakin koulutusalalla aineiston perusteella tärkeitä.