Miten puheentunnistus voi helpottaa maarakennusyrityksen arkea? Haaga-Helia ammattikorkeakoulun opiskelijat yhdessä yrityksen ja asiantuntijoiden kanssa ovat luoneet sovelluksen, jonka avulla kaivinkoneen kuljettaja voi sanella tilauksen suoraan ohjaamosta – ilman näppäimistöä tai lomakkeita – ja tiedot siirtyvät automaattisesti yrityksen toiminnanohjausjärjestelmään.
Maatop Oy:lle kehitetty sovellus avaa uusia näkymiä toiminnanohjauksen automatisointiin koko maanrakennusalalla.
Yrityksen tarpeet kehityksen keskiössä
Maatop Oy on suomalainen maarakennusalan toiminnan automatisointiin ja sen prosessien ohjaukseen ja tukemiseen keskittynyt ohjelmistoyritys. Maatop on helppokäyttöinen toiminnanohjausjärjestelmä ja toimistotyökalu maansiirtoalalle. Sen tavoitteena on auttaa yrittäjiä hoitamaan toimiston rutiinit mahdollisimman helposti toiminnanohjausjärjestelmässä, vaikka kaivinkoneen ohjaamosta käsin.
Tässä projektissa tavoitteena oli hyödyntää tekoälyä, jotta tietojen syöttö olisi mahdollista tehdä puheohjauksen avulla esimerkiksi suoraan kaivinkoneen ohjaamosta.
Projekti toteutettiin Haaga-Helian Softala-opintojaksolla, jossa TKI, yritysyhteistyö ja oppiminen yhdistyvät luontevasti. Softalassa opiskelijatiimit toteuttavat kehitysprojektit tiiviissä yhteistyössä tilaajayritysten kanssa. Opiskelijat suorittavat projektin omatoimisesti, mutta tilaajan toivomusten mukaisesti. Työn tilaajaan pidetään yhteyttä koko projektin ajan ja kehitettävä työ on aina tilaajan nähtävillä.
Projekti on osa AI skaalaajat -hanketta, joka tukee Uudenmaan pk-yrityksiä tarjoamalla asiantuntijapalveluita. Hankkeessa autetaan pk-yrityksiä tunnistamaan ja kehittämään tekoälyä hyödyntäviä uusia ratkaisuja ja skaalaamaan niitä osaksi liiketoimintaansa. Korkeakoulujen opiskelijoille tarjotaan mahdollisuus päästä mukaan hankkeen kautta syntyvään kehitystoimintaan, jossa opitaan aitoa yritysyhteistyötä.
Hanketta rahoittavat Euroopan aluekehitysrahasto ja Uudenmaan liitto.
Tavoitteena mahdollisimman helppokäyttöinen sovellus
Projektin aluksi tekniset ja toiminnalliset vaatimukset määriteltiin yhdessä asiakkaan kanssa. Sen jälkeen analysoitiin nykyisen ratkaisun tekniset reunaehdot ja määriteltiin tarvittavat uudet teknologiat, data ja API-rajapinnat. Ratkaisussa lähtökohtana oli toteuttaa erillinen web-sovellus, jota käytetään kuitenkin pääasiassa mobiililaitteilla.
Toteutettavassa sovelluksessa käyttäjä sanelee tilauksen, ja sovelluksen tulee poimia puheesta tilauksen tekemistä varten tarvittavat tiedot, kuten asiakas, tilattava tuote ja käytetty ajoneuvo. Tämän jälkeen käyttäjällä on mahdollisuus tarkistaa tiedot ja lopuksi tallentaa tilaus ERP-järjestelmään.
Projektissa tavoitteena oli selvittää, millä teknologioilla tämän voisi toteuttaa ja onko idea yleensäkään toteuttamiskelpoinen.
Projektin tuloksena syntyi proto, jolla pystyttiin sanelemaan tilaus ja tallentamaan se ERP-järjestelmään rajapinnan kautta. Puheen tunnistamiseen käytettiin OpenAI:n Whisper -rajapintaa. Kun puhe saatiin tunnistettua, käytettiin eri kielimalleja tilausten tietojen tunnistamiseen tekstistä. Sovellusta testattiin melko kattavasti erilaisilla puhetavoilla ja eri kielillä. Sovellus tunnisti hyvin tilaukseen liittyvät avainasiat, ja tunnistamatta jääneet asiat on helppo lisätä manuaalisesti.
Projektissa seurattiin myös puheen tunnistamisen ja kielimallien käytön kustannuksia. Ne pysyivät projektin aikana todella pieninä, vaikka palveluja käytettiin toteutuksen testaamiseen melko paljon.
Jotta sovelluksen toimivuudesta saataisiin enemmän kokemusta, se tulisi testata myös käytännön olosuhteissa. Taustamelu (esim. liikenne, ihmisjoukot) voi heikentää tunnistustarkkuutta merkittävästi. Samoin mikrofonin laatu ja sijoitus vaikuttavat tuloksiin. Myös eri aksentit, murteet ja ääntämisvaihtelut voivat aiheuttaa virheitä. Keräämällä kokemusta sovelluksen käytöstä todellisissa kenttäolosuhteissa sitä voidaan jatkokehittää.
Projektikokemusten reflektointia
Yrityksen aitoon tarpeeseen keskittyvä tekoälytekniikoita soveltava ohjelmistoprojekti on monipuolinen oppimiskokemus opiskelijoille, opettajalle, hankkeen asiantuntijoille ja yritykselle itselleen.
Vaikka projekti keskittyi puhtaasti teknisen prototyypin mahdollisuuksiin ja rajoituksiin, siinä sivuttiin monia muitakin asioita. Projektissa opittiin määrittelemään ja suunnittelemaan ratkaisuvaihtoehtoja yhdessä yrityksen edustajien kanssa.
Myös datan käsittelyn reunaehdot nousivat esille. Tietosuojaa ja lainsäädäntöä koskevia näkökohtia ei voinut olla huomioimatta, vaikka niiden yksityiskohdat eivät olleet kehitystyön pääpainona. Kehitysprojektissa on tärkeää huomioida, että äänidatan tallennus ja käsittely voivat sisältää arkaluonteisia henkilötietoja, kuten äänen perusteella tunnistettavia tietoja tai keskustelujen sisältöjä. Siksi niitä ei voi käsitellä huolimattomasti ja ladata minne tahansa.
Euroopan unionin yleinen tietosuoja-asetus (GDPR) ja muu soveltuva lainsäädäntö asettavat tiukat vaatimukset sille, miten tällaisia tietoja saa kerätä, käsitellä, säilyttää ja jakaa. Käyttäjiltä on saatava selkeä ja informoitu suostumus puheentunnistusjärjestelmän käyttöön, ja heidän tulee ymmärtää, mihin tarkoituksiin heidän puhedataansa hyödynnetään.
Hankkeen tuloksena syntyi toimiva protoratkaisu, jonka avulla ääniohjauksen ottaminen mukaan osaksi toiminnanohjausta on entistä nopeampaa. Näin maanrakennusalan toiminnanohjaukseen olisi nopeampaa syöttää puheentunnistuksen avulla uutta tietoa osana työprosesseja. Tämän projektin tuloksena yritys ja hanke saivat uutta tietoa ja kokemusta ja samalla opiskelijat pääsivät tekemään mielenkiintoista projektia.