Siirry sisältöön
Liiketoiminta
Luonnollisen kielen analyysimenetelmät asiantuntijatyön apuna

Osallistuessaan AI-TIE-kiihdyttämöön Medfilesin tiimillä oli useita ideoita kehityskohteiksi, joihin tekoälyä voisi soveltaa. Tärkein lähtökohta oli tarvelähtöisyys, eli ideoinnissa keskityttiin sellaisiin sovelluksiin, joilla olisi mahdollisimman suuri vaikutus jokapäiväiseen liiketoimintaan.

Kirjoittajat:

Janne Kauttonen

senior researcher
Haaga-Helia ammattikorkeakoulu

Jesse Salonen

Oy Medfiles Ltd

Julkaistu : 16.06.2023

Nykyiset kehittyneimmät tekoälyratkaisut perustuvat pitkälti syvien neuroverkkojen ja suurten datamassojen hyödyntämiseen. Syvä neuroverkko on ihmisaivojen toimintaa jäljittelevä koneoppimismenetelmä, joka pystyy mukautumaan lähes mihin tahansa tehtävään, mikäli opetusdataa on tarpeeksi.

Neuroverkkojen lopullinen läpilyönti tapahtui vuonna 2012, kun koneoppivat mallit saavuttivat ihmisen suorituskyvyn kuvantunnistuksessa ImageNet-haasteessa, jossa tavoitteena on luokitella kuvia. Pian tämän jälkeen syviä neuroverkkoja alettiin kehittää myös tekstin analysointiin. Nykyisin neuroverkkopohjainen tekstianalyysi on konenäön ohella yksi nopeimmin kehittyvistä tekoälyn osa-alueista, johtuen muun muassa ChatGPT:n räjähdysmäisestä suosiosta. Kaupallisten mallien ohella myös valmiita, ilmaisia malleja on saatavissa runsaasti erilaisiin sovelluksiin.

Lähtökohdat olivat siis hyvät, kun lääkealan tutkimuspalveluyritys Medfilesilla alettiin etsiä asiantuntijatyötä helpottavia ratkaisuja tekoälyn ja erityisesti luonnollisen kielen analyysin sovelluksista.

Turvallisuusprofilointi kirjallisuusseurantoineen kattaa valtavia tietoaineistoja

Vuonna 1987 perustettu Medfiles on alansa ensimmäinen yksityinen tutkimuspalveluyritys eli CRO-yritys (Contract Research Organisation) Suomessa. Medfiles tarjoaa palveluita lääkkeiden koko elinkaaren ajalle aina tuotekehityksestä kliinisiin tutkimuspalveluihin, myyntilupien ylläpitoon ja lääketurvaan. Medfiles tarjoaa myös kattavasti lääkealan käännöspalveluita.

Medfilesin keskeisiin palveluihin kuuluvat muun muassa ihmis- ja eläinlääkkeiden ja lääkinnällisten laitteiden lääketurvatoimintaan liittyvät toimet, kuten turvallisuusprofilointiin liittyvä kirjallisuusseuranta. Sekä kirjallisuusseuranta että turvallisuusprofilointi ovat olennainen osa lääketurvatoimintaa, ja molemmissa käydään läpi valtavia tekstiaineistoja. Aineistojen haussa tavoite on paitsi tunnistaa yksittäisiä henkilöitä koskevia haittatapahtumia myös havaita mahdollisia muita hyöty-riskisuhteen arvioimisen kannalta oleellisia turvallisuusongelmia.

Lääketurvaan liittyvään kirjallisuusseurantaan kuuluu ns. turvasignaalien havaitseminen ja arviointi. Tähän käytetään muun muassa maailmanlaajuista lääketurvatietokantaa tieteellistä kirjallisuutta (kuten kliiniset tutkimukset ja tutkimusraportit) ja viranomaisilta saatuja tietoja. Lääketurvatiimi seuraa myös sosiaalisen median alustoja ja muita verkkosivustoja.

Tiedonhaun apurobotti ja konekäännin asiantuntijatyön tehostamiseksi

Osallistuessaan AI-TIE-kiihdyttämöön Medfilesin tiimillä oli useita ideoita kehityskohteiksi, joihin tekoälyä voisi soveltaa. Tärkein lähtökohta oli tarvelähtöisyys, eli ideoinnissa keskityttiin sellaisiin sovelluksiin, joilla olisi mahdollisimman suuri vaikutus jokapäiväiseen liiketoimintaan. Kiihdyttämön edetessä päädyttiin kahteen sovellukseen: automaattiseen tiedonhakurobottiin ja konekääntimeen.

Tiedonhakurobotin hyödyntämisessä tavoite oli, että hakurobotti kävisi itsenäisesti läpi sille osoitetut tekstilähteet, esimerkiksi tieteelliset artikkelit, ja poimisi niistä sellaiset, jotka todennäköisesti sisältävät toimeksiannon kannalta oleellista tietoa. Tämän jälkeen ihminen kävisi tiedot läpi. Täydelliseen automaatioon ei pyritty, vaan jo pelkkä tietomassan karsiminen voisi tuoda merkittävää ajansäästöä asiantuntijatyöhön.

Tiedonhaun apurobotin tapauksessa on mahdollista hyödyntää eräänlaista kyllä/ei-tyyppistä luokittelumallia, joka opetetaan robotille käyttämällä aikaisemmista toimeksiannoista syntynyttä tietokantaa eli hakuparametreja ja niille löytyneitä aineistoja. Nykyaikaisia kielimalleja (esim. BLOOM, LLaMa ja GPT-4) hyödyntämällä voidaan saada tekoälysovellus hahmottamaan tekstin konteksti ja semanttinen sisältö.

Haussa voidaan käyttää kuvailevaa kieltä, eikä hakutermien tarvitse löytyä sellaisenaan kohdetekstistä, vaan malli toimii syvemmällä tasolla. Malli osaa kontekstin perusteella tunnistaa esimerkiksi sen, tarkoitetaanko termillä ”induktio” synnytyksen käynnistämistä, sähkövirran syntymistä, nukutuksen vaihetta vai aineenvaihdunnan kiihtymistä. Kyse on siis huomattavasta edistysaskeleesta verrattuna klassiseen, ei-kontekstiriippuvaiseen sanahakuun.

Tietokoneohjelman suorittama automaattinen kääntäminen eli konekääntäminen tuottaa nykyisin verrattain laadukasta jälkeä. Myös konekääntämisessä kontekstilla on huomattava merkitys, eikä tekstiä voi kääntää vain yksittäisten, erillisten sanojen kautta. Konekäänninsovellukset ovat nykyisin monessa ohjelmistossa jo valmiina tai erillisenä lisäosana. Voi kuitenkin olla tarpeen hienosäätää kääntimen malleja siten, että ne toimivat paremmin myös esimerkiksi lääketieteellisen tekstin kääntämisessä.

Mallin selitettävyys ja läpinäkyvyys on tärkeää

Lääkealan toiminta on erittäin säädeltyä, eli lainsäädäntö asettaa reunaehtoja ja vaatimuksia työn toteuttamiselle. Siksi on tärkeää, että myös mahdolliset työssä käytettävät tekoälysovellukset ovat mahdollisimman läpinäkyviä.

Esimerkiksi tiedonhaun apurobotin on oltava sellainen, että sen päätöksien perusteet ovat käyttäjän nähtävissä ja tarkasteltavissa. Miksi robotti luokittelee tietyn dokumentin tärkeäksi mutta toisia ei? Vastaavasti konekääntimen olisi hyvä ilmoittaa, kuinka varma malli on käännöksen oikeellisuudesta.

Epävarmoissa tapauksissa lopullinen päätös on kuitenkin aina ihmisellä, joka tarkistaa lopputuloksen. Tämä asettaa reunaehtoja toteutukselle, ja mallien kehityksessä tulosten tarkkuus ei voi olla ainoa kriteeri. Samoin tekoälyratkaisun käyttöliittymä on suunniteltava siten, että se mahdollistaa käyttäjän ja tekoälymallin välisen vuorovaikutuksen, kuten manuaaliset korjaukset.

Päätavoitteena sisäisten toimintojen tehostaminen ja uudet tuotteet APIn kautta

Medfilesin tavoite on kehittää tekoälyratkaisuja, jotka tehostavat päivittäisiä toimintoja ja auttavat asiantuntijatyössä. Kehitettyjä ratkaisuja on toisaalta myös mahdollista myydä muille alan toimijoille hyödyntämällä API-rajapintaa. Tämä on hyvin tyypillinen liiketoimintamalli, jota erityisesti AI-alan toimijat käyttävät yrityksen koosta riippumatta.

API-rajapintaa hyödyntämällä omaa tekoälymallia ei tarvitse avata kilpailijoille, vaan asiakkaat lähettävät pilvipalvelun kautta syötteitä ja saavat valmiit tulokset käyttöönsä. Jokainen mallin kutsu voidaan asettaa maksulliseksi, jolloin ratkaisu tuottaa tasaista tulovirtaa.

AI-TIE tekoälykiihdyttämö toteutui osana Tekoälyinnovaatioekosysteemillä kilpailukykyä PK-yrityksille, eli AI TIE -hanketta. Euroopan aluekehitysrahaston ja Uudenmaan liiton tuella hankkeessa on edistetty PK-yritysten liiketoiminnan kehittämistä ja kasvua tekoälyratkaisuja hyödyntäen osana Euroopan unionin covid-19-pandemian johdosta toteuttamia toimia. Hankkeen toteuttavat Haaga-Helia ja Laurea ammattikorkeakoulut yhdessä tiiviin partneriverkoston kanssa. Lisää yritysten tekoälytarinoita osoitteesta www.aistories.fi.

Kuva: www.shutterstock.com