Asiantuntija pohtii: Voiko työtapaturmien määrää ennustaa tekoälyagenttien avulla?
Laadimme TVK:ssa syksyisin ennusteen kuluvan vuoden työtapaturmista. Ennuste pohjautuu ensisijassa pikatilastoon ja erilaisiin sää- ja talousennusteisiin ja Tilastokeskuksen keräämiin tietoihin palkansaajien tekemien työtuntien määrän kehityksestä. Taustalla on tehty aikasarjoihin perustuvia ennusteita käyttäen useita eri malleja. Tänä vuonna halusimme kokeilla tekoälyn ja tekoälyagenttien hyödyntämistä ennusteen laadinnassa. Työkaluksi valikoitui Copilot, koska se on käytössämme niin, että pystymme, tietosuoja huomioiden, käyttämään sitä suljetussa M365-ympäristössä liitetiedoin.
Taustalla kokeiluja neuroverkkomalleilla ja tekoälyllä
Loppukeväästä 2025 aloitimme analyysin laadintakokeilut Microsoftin M365 copilot-agentilla ”Researcher” (nyk. suomeksi Tutkija), joka löytyy valmiina M365 Copilotin agenttikategoriasta. Tavoitteena oli alusta asti tukea työtapaturmien 2025 vuosiennusteen laskentaa - aiemmat yritykset laatia aikasarjaennusteita Copilotin perusversiolla ja Coplotin avulla taulukkolaskentaohjelmassa Excelissä eivät ole olleet kovin onnistuneita.
Kokeilut aloitettiin ensin vain yhdellä aikasarjalla ja suppeana. Kierros kierrokselta syötettyyn aineistoliitteeseen lisättiin taustatoteamuksia, indikaattoritietoja, painokerroinaikasarjoja, työtuntidataa jne. Samalla kehitettiin ja tarkennettiin tekoälyagentille annettavaa syötettä eli promptia. Kierrosten väleissä aloitettiin aina uusi keskustelu, jotta aiempi ajokerta ei vaikuttaisi tuloksiin. TVK:n asiantuntijat eri yksiköistä sparrasivat ja antoivat kehitysideoita uusiin ajokokeiluihin.
Jo aiemmin ennusteen tukena on käytetty monimuuttujaista LSTM-mallia teollisuuden työpaikkatapaturmien ennustamiseen ilman tekoälyagenttia. Silloin aineistona on ollut kuukausittain askeltava sarja noin 220 kuukaudelta työtuntitietoja, korvattujen työpaikkatapaturmien lukumäärät ja teollisuuden uudet tilaukset trendisarjana. Toisena ennustemenetelmänä viime vuonna käytettiin GRU-mallia, sitä aiemmin mm. VAR- ja SARIMA-malleja.
Tekoälyagenttia käytettiin eristetyssä IT-ympäristössä ja itse koostetuin lähtötiedoin, mutta kokeiluita tehtiin myös tekoälyagentin valitsemilla web-tietolähteillä. Osaan kokeiluista pyydettiin siis tekoälyagenttia olemaan vain liitetyn tiedon varassa ja osaan liittämään muitakin tietolähteitä kuin syötetyt aikasarjat ja tunnetut ennusteen olettamat. Suureen osaan tekoälyagentin ajokerroista pyydettiin aikasarjaennusteen menetelmäksi LSTM-mallia.
Millaisia ennusteita tekoälyn avulla saatiin?
Kokeilujen edetessä tehtiin useita eri promptien ja syöttödatan kokeiluversioita, joiden ajokerroista muodostui ennustejoukko tai -parvi. Suurin osa kokeiluista antoi varsin samansuuntaiset tulokset kuin pikatilastoon, sääennusteisiin ja talousennusteisiin pohjautuva perinteinen ennustemenetelmä. Useimmiten lukumääräennuste oli tasolla 108000-110000 työpaikkatapaturmaa ja taajuus 25. Osa ajoista antoi selvästi epäuskottavia tuloksia, esimerkkeinä vuositason 117000 työpaikkatapaturmaa ja työpaikkatapaturmien taajuusennuste 32. Todennäköisesti tekoälyagentti päätyi tällaisiin tuloksiin, koska mallin validointi oli tehty ensin vuodelle 2024 ja validointikierroksen vuoden 2024 tulosta oli käytetty toteuman sijaan ennusteen ajamiseen vuodelle 2025, sekä se, että taajuusennuste sisälsi työmatkatapaturmat.
Samalla syötteellä ei siis aina saatu samaa lopputulosta ja välillä tekoälyagentti jäi tuntikausiksi työstämään vastausta. Ilman tekoälyagenttia samoin syöttein testattu Copilot-tekoälykielimalli selaimen kautta suljetussa ympäristössä antoi selvästi vaihtelevammin tuloksia.
Copilot Researcher -agenttia pyydettiin myös vertailun vuoksi käyttämään samoilla syöttötiedoilla GRU-neuroverkkoa, jolla ennusteeksi saatiin noin 110000 työtapaturmaa vuodelle 2025. XGBoost puolestaan antoi tekoälyagentilla ja samalla syötteellä ennusteeksi 112000 työtapaturmaa, saman tuloksen tuotti myös SARIMA, joka keskittyy ennustettavaan ja voimakkaasti kausiluonteiseen työtapaturmien määrään itseensä. Lisäksi Copilotin Analyst (Analyytikko) tekoälyagentti ennusti samoilla syötteillä, mutta menetelmänä visuaalinen imputointi, vuoden 2025 työtapaturmien määräksi 112014.
Kokemuksia tekoälyagentin käytöstä
Tekoälyagentin luomissa teksteissä ja luvuissa oli alkuvaiheen ajokierroksilla havaittavissa ”eriparisuutta”, mikä luo epäilystä siitä, että luvut oli laskettu tai ns. oikeat vastaukset luettu promptaajan tiedostoista löydettävissä olevista muista tiedoista erikseen ja teksti oli tuotettu laskennasta riippumattomasti ja pyynnön mukaan kielimallilla. Tätä testattiin ajamalla prompti liitteineen työkaveri Otto Veijolan koneelta suljetussa ympäristössä niin, että hänen tiedostoissaan ei ollut muita ennusteen taustamateriaaleja, tulokseksi LSTM-mallilla saatiin 109000 työtapaturmaa vuonna 2025. Lisäksi tilastoyksikössä Jussi Laatunen ajoi uudemmalla GPT-5 kielimallilla vastaavat ajot, joissa saatiin menetelmäselosteen lisäksi ajettava python-koodi, joka varmistaa pyydetyn neuroverkkomenetelmän käyttöä. Ennusteen varmistuksena Henrik Grönblom ajoi ilman tekoälyagenttia ennusteet LTSM ja GRU -malleilla työpaikkatapaturmille yhteensä käyttäen viimevuotisia menetelmiä.
Kokonaisuutena tekoälyagentin vahvuutena on nopeuden lisäksi kyky vaativallakin pyydetyllä mallilla soveltaa esimerkiksi eri askelpituuksin eteneviä aikasarjoja samanaikaisesti, mikä olisi muuten työlästä. Prompteja ja liitettyjä aikasarjoja on helppo kehittää aiempien kokeilujen perusteella aina paremmiksi. Tekoälyagentti on lisäksi osannut soveltaa annettua tekstimuotoista päättelytietoa analyyttisen lähestymistavan tulosten tarkentamisessa. Tekoälyagentti osasi hienosäätää tuloksia ns. hybridimalliksi jolla saadaan tekoälyagentille syötteessä ohjeistetun asiantuntijatiedon ja matemaattisen mallin edut yhdistettyä. Yleisesti ottaen kokeilut ovat antaneet intoa jatkaa testailua työkalulla.
Tekoälyagentteja voi hyödyntää työtapaturmien määrän ennustamisessa, se vähintään antaa tukea manuaalisesti lasketuille ennusteille ja on nopea tekemään keskenään vaihtoehtoisia tulevaisuusskenaarioita. Paras lopputulos todennäköisesti saadaan, kun malleja ajetaan useita kertoja ja sparrataan asiantuntijoiden kanssa yhdessä, vaiheittain tai ryhmätyönä. Tekoälyagenttia kannattaa pyytää perustelemaan ja esittää tausta- ja jatkokysymyksiä. Tekoälyagentin vahvuus on etenkin nopeus, teoriamalleja kun voidaan kokeilla monia ja useita kertoja.
Kiitos kokeiluihin osallistuneille: Mika Tynkkynen, Jussi Laatunen, Henrik Grönblom & Otto Veijola!
Lisätietoja:
Janne Sysi-Aho, janne.sysi-aho@tvk.fi
Marja Kaari, marja.kaari@tvk.fi
Tapaturmavakuutuskeskus, TVK
Liite: Miten tekoälyagentti vastasi?
Esimerkkinä yhden Researcher ennusteajon sitaatti: ”Nykyisessä ennusteessa hyödynnetään kattavaa historiallista dataa ja Long Short-Term Memory (LSTM) -neuroverkkomallia, joka on soveltuva monimutkaisten aikasarja- ja kausivaihtelumallien oppimiseen. Lisäksi mukaan on otettu toimialakohtaisia indikaattoreita (teollisuus, rakentaminen, kauppa) kuvaamaan taloudellista aktiivisuutta ja työmäärän muutosta eri sektoreilla. Nämä indikaattorit on painotettu kunkin toimialan osuuden mukaan, mikä auttaa ennustetta huomioimaan esimerkiksi teollisuuden laskusuhdanteen tai rakentamisen vilkastumisen vaikutuksen työtapaturmien määrään. Ennusteen taustalla on oletus, että loppuvuoden (elo–joulukuu) kuukausijakauma noudattaa aiempien vuosien normaalia kausiprofiilia ilman poikkeuksellisia shokkeja – paitsi että syksyn 2025 leutojen säiden odotetaan vähentävän liukkaudesta johtuvia tapaturmia hieman keskimääräisestä.” (kts. kuva alla) Ja saman ajokerran toinen osa sitaattina: "Merkillepantavaa on, että tapaturmataajuus (tapaturmien suhteuttaminen tehtyihin työtunteihin) on pysynyt melko stabiilina tai jopa loivasti laskenut – tämä viittaa siihen, että työturvallisuudessa on tapahtunut parannusta pitkällä juoksulla. Vuonna 2024 tapaturmataajuus oli noin 25,0, mikä on samaa luokkaa kuin 2021–2023 ja alempi kuin 2010-luvun keskiarvot (noin 26–27). Ennusteemme mukaan vuonna 2025 tapaturmataajuus pysyy tällä hyvällä tasolla (~25) tai laskee aavistuksen, olettaen ettei työn kokonaismäärä muutu dramaattisesti."