Asiantuntija pohtii: Osaako tekoäly ymmärtää työtapaturmia? Vertailimme vahinkokuvauksia ja tilastoituja muuttujia

Tekoälyn kyky ymmärtää vapaata tekstiä on nykyään jo hyvällä tasolla. Mutta miten se pärjää, kun sille syötetään kymmeniätuhansia, usein puhekielisiä ja joskus hyvinkin epäselviä työtapaturmakuvauksia?

Paluu vuoteen 2019: IBM Watson nikotteli

Ajatus tapaturma-aineistojen automatisoidusta analysoinnista ei ole uusi. Jo vuonna 2019 tutkimusyksikön johdolla kokeiltiin, voisiko IBM:n Watson-tekoäly lukea työtapaturmien kuvaustekstejä ja päätellä niistä itsenäisesti, mikä kehonosa tilanteessa todellisuudessa loukkaantui.

Tuolloin vastaus oli: Ei ihan.

Vuonna 2019 kielimallit olivat kankeita. Suomen kieli osoittautui Watsonille kompastuskiveksi. Kun tähän yhdistettiin tekstin annotointiin tarkoitettu hankala käyttöliittymä, projekti osoitti, ettei tekniikka ollut vielä riittävän kehittynyttä.

Vuodet vierivät ja tekoälyteknologia kehittyy nyt viikoissa enemmän kuin aiemmin vuosikymmenissä. Oli uuden kokeilun aika.

Uusi kokeilu: Vapaa kuvausteksti vs. vakuutuslaitoksen tilastokoodi

Asetelma uudessa kokeilussa oli periaatteessa hyvin saman suuntainen kuin vuonna 2019. Halusimme selvittää, vastaako tilastoitu vahingoittunut kehon osa vahinkokuvauksessa mainittua vahingoittunutta kehonosaa. Aineisto sisälsi yhteensä 46 870 kuvausta vuodelta 2023.

Tulokset: 97 prosentin osumatarkkuus ja 30 euron hintalappu

Tekoäly löysi selkeän kehonosamaininnan 87 prosentissa tapauksista. Kun aineistosta siivottiin pois tapaukset, joissa oli loukattu useita eri kehonosia tai joita ei voitu luokitella (niin tekoälyn kuin tilastojenkaan toimesta), jäljelle jäi 35 608 vahinkotapahtumaa vertailtavaksi.

Osuus tapauksista, joissa vakuutuslaitoksen tilastoima kehonosa vastasi tekoälyn tekstistä päättelemää kehonosaa, oli 97 prosenttia. Tulos kertoo, että tilastoitu kehonosa oli melkein aina linjassa sen kanssa, mitä vahinkokuvauksessa kerrotaan.

Analyysi toteutettiin Python-skriptillä, joka luki SAS-aineistoa ja lähetti datan erissä Azure OpenAI:n GPT-5.1 -kielimallille. Koko yli 46 000 rivin aineiston analysointi maksoi käytettyjen tokeneiden perusteella vain noin 30 euroa.

Miten tämä tehtiin? Kuri ja järjestys tarkalla ohjeistuksella

Jotta tekoäly ei arvaile vaan tulkitsee tekstiä mahdollisimman kurinalaisesti, mallille annettiin tarkat toimintaohjeet. Tekoälyn tehtävänä oli keskittyä itse vamman tunnistamiseen. Sen piti etsiä tekstistä nimenomaan vahingoittunut kehonosa, eikä antaa hämätä itseään sellaisilla kehonosilla, joilla vain tehtiin jotain.

Kun oikea vammakohta oli selvillä, vuorossa oli anatominen luokittelu. Tekoäly oli ohjeistettu koodaamaan tarkatkin kehonosat, kuten sormi, varvas, ranne, nilkka tai poski, aina oikeaan ylempään anatomiseen yläluokkaan, jolloin vaikkapa varvas koodattiin suoraan alaraajoihin. Lopuksi tekoäly palautti rakenteellisen tulosteen siistinä JSON-dokumenttina. Tämä tekninen valinta mahdollisti useamman kuvaustekstin sujuvan käsittelyn yhdellä kertaa, mikä piti analyysin kustannukset tehokkaasti kurissa.

Loppupäätelmät

Tämä kokeilu vahvisti uskoa siihen, että työtapaturmien tilastoaineiston laatu on hyvällä tasolla. Se osoitti myös, että nykyaikaiset laajat kielimallit ovat valmiita käyttöön laadunvarmistuksessa. Se, mikä vuonna 2019 oli tekoälylle tuskallisen vaikeaa, on tänä päivänä halpaa ja nopeaa.

Tekoäly ei ehkä vielä osaa estää työtapaturmia, mutta se ymmärtää niitä paremmin kuin koskaan aiemmin.

Lyhyesti kirjoittajasta

Jussi Laatunen työskentelee TVK:ssa aktuaari- ja tilastoyksikössä data-analyytikkona.