Jokainen yritysjohtaja tietää, miten hankalaa tulevaisuuden arviointi on ja miten kalliiksi huonot päätökset voivat tulla. Tekoälystä on muodostunut monille aloille tehokas liiketoiminnan apuväline, mutta valitettavasti tekoälymalleja käytetään usein sellaisiin tarkoituksiin, joihin niitä ei ole kehitetty. Tällaisia ovat erityisesti sellaiset tilanteet, jotka vaativat vahvaa kausaalista syy-seuraus -päättelyä ja mallinnusta.
Tyypilliset tekoäly- ja tilastolliset mallit pohjaavat oletukseen, että jokin ilmiö pysyy samanlaisena tulevaisuudessa, jolloin yllättävissä ja muuttuvissa tilanteissa nämä mallit voivat johtaa harhaan. Näihin tilanteisiin kannattaa käyttää kausaalista laskennallista mallia, joka perustuu aitojen syy-seuraussuhteiden ymmärtämiseen.
Tässä artikkelissa käyn läpi mitä on kausaalinen päättely ja data-analyysi, ja miksi sitä kannattaa käyttää. Lisäksi käsittelen sitä, miten generatiivista tekoälyä (suuria kielimalleja) voidaan hyödyntää kausaalisessa analyysissä ja miksi tämä voi olla erityisen hyödyllistä pk-yrityksille. Kirjoitus on osa Tekoälykäs PK-yritys -hanketta, jonka tarkoitus on edistää pk-yritysten ja niiden työntekijöiden tekoälyn käyttöönottoa.
Data-analytiikan ja kausaalisen analytiikan kolme tasoa
Liiketoiminnassa data-analytiikka on perinteisesti jaettu karkeasti seuraaviin kolmeen tasoon.
- Kuvaileva ja diagnostinen analyysi, jossa selvitetään mitä menneisyydessä tapahtui. Voidaan käyttää perinteisiä tilastollisia analyysejä ja kuvaajia.
- Ennustava analyysi, jossa selvitetään mitä tulee todennäköisesti tapahtumaan. Voidaan käyttää sekä perinteisiä tilastollisia että uusimpia koneoppimismenetelmiä. Oletetaan että toimintaympäristö pysyy samanlaisena tulevaisuudessa.
- Preskriptiivinen analyysi, jossa selvitetään, miten jokin asia saadaan tapahtumaan ja mitä muutoksesta seuraa. Sovelletaan kausaalisen analyysin menetelmiä. Oletetaan tietyt syy- ja seuraussuhteet, mutta sallitaan toimintaympäristön muutokset.
Tässä kausaalinen analyysi sijoittuu tasolle 3. Tyypillinen analytiikka tasoilla 1 ja 2 toimivat hyvin erilaisten assosiaatioiden ja tulosten ennustamisessa, mikäli toimintaympäristössä ei tapahdu merkittäviä muutoksia, mutta ne eivät riitä ymmärtämään syvällisemmin, mikä tuloksia ohjaa. Esimerkiksi ennustava malli saattaa kertoa, että tietyt tuotteet ostavat asiakkaat todennäköisesti lopettavat asiakkuutensa, mutta malli ei voi yleensä kertoa miksi näin tapahtuu ja voitaisiinko se estää jollakin interventiolla.
Kausaalisen analyysin eräs pioneeri, professori Judea Pearl (2020) puolestaan jakaa tilastollisen ja kausaalisen päättelyn seuraaviin kolmeen tasoon ns. kausaation tikapuilla.
- Porras 1: Havainnointi eli assosiaatiot, joka keskittyy havaintojen välisiin yhteyksiin. Esimerkiksi, jos havaitsemme, että jäätelön myynti ja hukkumiset lisääntyvät samanaikaisesti, voimme vain todeta niiden olevan yhteydessä toisiinsa ilman, että teemme johtopäätöksiä syy-seuraussuhteesta.
- Porras 2: Toimiminen eli interventiot, jossa tarkastellaan, mitä tapahtuu, kun teemme aktiivisia muutoksia järjestelmässä ja mittaamme sen vaikutuksia. Emme pelkästään havainnoi tilannetta ulkopuolelta, vaan vaikutamme siihen aktiivisesti. Esimerkiksi jaamme asiakkaat ryhmiin ja kohdistamme niihin erityyppistä mainontaa.
- Porras 3: Kuvitteleminen eli kontrafaktuaalit, joka käsittelee hypoteettisia skenaarioita ja vastakkaisia tapahtumia, joita ei ole tapahtunut mutta saattaisi tapahtua. Ymmärrämme systeemiä niin hyvin, että voimme simuloida luotettavasti mitä tapahtuisi, jos muutamme sen parametreja. Esimerkiksi voimme arvioida, olisiko asiakas jatkanut palvelun käyttöä, jos hänelle olisi tarjottu alennus, vaikka todellisuudessa alennusta ei annettu.
Portaalla 1 voimme ainoastaan tunnistaa, että asioilla voi olla yhteys, mutta emme voi sanoa mitään tämän yhteyden laadusta tai syy-seuraussuhteista. Portaalla 2 voimme tunnistaa ja mitata kausaaliset yhteydet, mutta emme pysty mallintamaan vaihtoehtoisia tilanteita. Vasta portaalla 3 pääsemme käsiksi aitojen syy-seuraussuhteiden mallintamiseen ja vastaamaan kaikkiin ’miksi’ ja ’entä jos’ kysymyksiin, jotka ovat tyyppiä ’Kun tunnemme asian X, mikä aiheutti lopputuloksen Y? ja ’Mitä Y:lle tapahtuisi, jos tekisimme yhden tai useamman muutoksen X:ään?.
Klassisten ja kausaalisten tekoälymallien erot voidaan tiivistää seuraavasti.
- Klassinen tekoälymalli maksimoi ennusteiden tarkkuuden. Malli hyödyntää kaikkia datassa olevia assosiaatioita riippumatta siitä, onko niillä syy-seurausyhteyttä. Oletus on, että toimintaympäristö pysyy samanlaisena myös tulevaisuudessa.
- Kausaalinen tekoälymalli maksimoi datanmallin tarkkuuden. Malli perustuu aitojen syy-seuraussuhteiden tarkkaan mallintamiseen. Sallii toimintaympäristön muutoksen ja erilaisten skenaarioiden ja vaihtoehtoisten ’entä jos’ -tilanteiden tutkimisen.
Data on luonnollisesti kaiken mallintamisen ja tekoälyn tärkein osa. Kun siirrymme tasolle 3 ja portaalle 2, on tärkeää ymmärtää havainnoivan ja kokeellisen datan välinen ero.
- Havainnoiva data on kerätty ilman, että muuttujia on manipuloitu. Tällaista dataa ovat esimerkiksi asiakasostohistoriat, yleisimmät kyselytutkimukset ja sähköiset potilastiedot. Tällaista dataa on helppo kerätä ja sitä on yleensä runsaasti saatavilla, mutta tallainen data on rajoittunut portaalle 1.
- Kokeellinen data syntyy kontrolloitujen interventioiden, kuten perinteisen A/B-testauksen tai satunnaistettujen kliinisten kokeiden, tuloksena. Tällaisen datan kerääminen on suunniteltava hyvin ja se voi olla aikaa ja resursseja vievää ja se on usein rajallista kattavuudeltaan. Tämä data on kuitenkin välttämätöntä portaille 2 ja 3 pääsemisessä.
Liiketoiminnassa on yleistä jäädä portaalle 1 ja löytää vahvoja korrelaatioita tapahtumien X ja Y välillä ja tehdä virheellinen johtopäätös, että X aiheuttaa Y:n (tai päinvastoin). Esimerkiksi jos lanseerattu tuote tai palvelu ei menesty, syytä voidaan hakea heikosta markkinoinnista, tuotteen ominaisuuksista tai väärin valitusta kohderyhmästä. Meillä on taipumus keksiä uskottavalta kuulostavia selityksiä tapahtumien näennäisille korrelaatioille ja miksi jokin asia tapahtui tai jäi tapahtumatta. Pelkkiin havaintoihin perustuvat kausaaliset väitteet ovat yleensä harhaanjohtavia.
Kausaalinen mallinnus portailla 2 ja 3 tarkoittaa syy-seuraussuhteen selvittämistä tietyn toimenpiteen eli ’intervention’ ja sen seurauksen eli ’interventiovaikutuksen’ välillä. Tässä yhteydessä satunnaiskokeet ovat ns. kultainen standardi ja sitä on hyödynnetty jo pitkään erityisesti terveydenhuollossa. Tunnetuimpana esimerkkinä tästä lääkkeiden vaikuttavuuden arviointi placebo-lääkkeillä. Tässä kontekstissa lääkkeen antaminen on interventio, ja potilaan tilan muutos on interventiovaikutus.
Yritysmaailmassa satunnaiskokeita kuitenkin sovelletaan harvoin ja ne eivät ole aina edes mahdollista (Takeda 2024). Syynä voivat olla paitsi resurssien puute, myös lakitekniset ja eettiset syyt. Esimerkiksi turvalaitteita valmistava yritys ei voi tehdä tuotekehitystä siten, että se vaarantaisi asiakkaiden terveyden testaamalla satunnaisesti jotkin turvalaitteen kriittisen osan vaikutusta. Asiakkaita ei myöskään voi pakottaa ostamaan tuotteita tai palveluita, joten oikeaoppisia satunnaiskokeita ei voi sellaisenaan toteuttaa. Moderni kausaalinen mallinnus ei kuitenkaan vaadi täysimittaisia satunnaiskokeita, vaan myös osittaiset ja epätäydelliset interventiot ovat mahdollisia.
Kausaalisen analyysin seitsemän askelta
Käytännössä kausaaliset kysymykset voidaan jakaa kahteen eri tyyppiin (Gelman 2011).
- Suorat kysymykset: Mitä voisi tapahtua, kun jos teemme asian X? Esimerkiksi, mikä on mainoskampanjan vaikutus myyntiin tai kalliin investoinnin vaikutus yrityksen tuottavuuteen.
- Käänteiset tulkinnat: Mikä johti lopputulokseen Y? Esimerkiksi, mikä aiheutti yrityksen tuloksen romahduksen tai miksi tuotteen myynti kasvoi räjähdysmäisesti.
Useimmat vastaantulevat kysymykset ovat jälkimmäistä tyyppiä. Yrityksen on esimerkiksi helppo seurata mainonnan kustannuksia, kattavuutta ja myyntiä, mutta ei kaikkia niitä tekijöitä, jotka vaikuttavat kuluttajien käyttäytymiseen. Jos suuri mainoskampanja ei kasvatakaan myyntiä, halutaan yleensä selvittää, miksi näin tapahtui.
Varsinainen kausaalinen analyysi voidaan jakaa seitsemään työvaiheiseen. Askeleet ovat monelta osin samat kuin missä tahansa data-analyysissä, pois lukien ensimmäiset askeleet ja käytetyt laskennalliset mallit. Askeleet 1 ja 2 ovat sellaisia, että ne eivät vaadi teknistä osaamista ja niihin pitäisi osallistua kaikki organisaatiot omat ja ulkoiset asiantuntijat. Vaihe 3 on automaattinen. Näiden työvaiheiden läpikäyminen on hyödyllistä jo itsessään, vaikka prosessia ei jatkettaisi vaihetta 3 pidemmälle. Askeleet 4-6 sisältävät varsinaisen data-analyysin ja mallinnukset ja vaativat teknistä asiantuntemusta. (Molak 2023; Liotsiou 2023.) Käyn seuraavassa läpi kaikki askeleet pääpiirteittäin.
Askel 1: Syy ja seuraussuhteiden kartoitus
Kausaalisen analyysin ensimmäinen askel on tutkittavaan ilmiöön liittyvien muuttujien kartoitus. Tähän voi käyttää Taulukon 1 nelikenttää (Taylor 2024). Mitkä muuttujat (X) liittyvät seuraukseen (Y)? Ovatko X ja Y jo tiedossa vai pitääkö lähteä liikkeelle teorian kehityksestä? Ideaalitilanteessa X ja Y on määritelty. Muissa tapauksissa joudumme turvautumaan ilmiön opiskeluun, organisaation alan asiantuntemukseen ja eksploratiiviseen data-analyysiin, joita ovat mm. korrelaatioanalyysit ja ennustavat mallit, jotka voivat auttaa tilanteen hahmottamisessa. Tässä kohtaa myös generatiivinen tekoäly voi olla suureksi avuksi, mistä lisää kappaleessa 5. Kun meillä on kohtuullisen hyvä käsitys mitä X ja Y ovat, voidaan siirtyä seuraavaan askeleeseen.
Taulukko 1. Erilaisten syiden ja seurausten kartoittaminen on keskeinen osa kausaalista analyysiä.
Askel 2: Suunnatun graafin hahmottelu
Kun ilmiöön liittyvät muuttujat on tiedossa, kausaalisen analyysi etenee syklittömien graafien eli DAGien (Directed Acyclig Graph eli DAG) hahmottelulla, jonka avulla kausaalisuhteet voidaan esittää. DAG on välttämätön varsinaista data-analyysiä tehdessä, mutta se on myös itsessään hyödyllinen ajattelun ja ilmiön hahmottamisen apuväline.
Mieti, mitkä muuttujat voisivat olla suorassa kausaalisuhteessa toisiinsa ja mihin suuntaan vaikutus kulkee. Tuottaako muuttuja A muuttujan B vai toisinpäin (ks. kuvio 1)? Yhdellä muuttujalla voi olla useita kausaalisia yhteyksiä muihin muuttujiin. Jos olet epävarma yhteyden olemassaolosta, sisällytä se, sillä yhteyden puuttuminen on vahvempi oletus.
Kuvio 1. Vuorovaikutuksen suunta on oleellinen.
Otetaan kaikki muuttujat, joille on määritelty tuleva tai lähtevä kytkentä ja muodostetaan niistä graafi (ks. kuvio 2). Jos graafiin muodostuu sykli, palaa takaisin edelliseen askeleeseen niiden muuttujien osalta, jotka ovat osa sykliä ja mieti uudelleen niiden vuorovaikutussuhteita. DAG ei sovellu sellaisten prosessien kuvaamiseen, jossa on syklejä.
Kuvio 2. Suunnattu, ei-syklinen graafi (DAG) ilmiöstä.
Tässä prosessissa on hyödynnettävä kirjallisuutta ja kaikkea käytettävissä olevaa, alakohtaista asiantuntemusta, joka organisaatiosta ja/tai omasta asiantuntijaverkostosta löytyy. Myös generatiivisen tekoälyn hyödyntäminen on erittäin hyödyllistä. Jos jotakin dataa on jo olemassa, voidaan lisäksi hyödyntää perinteistä tilastollista analyysiä ja erityisiä graafien oppimisalgoritmeja (ks. lisää Molak 2023). Nämä analyysit voivat auttaa tunnistamaan mahdollisia linkkejä ja tukea omaa analyysiä. Automatisoidut menetelmät ovat kuitenkin epäluotettavia, eikä niillä voi korvata manuaalista asiantuntijatyötä.
Askel 3: Kausaalisen vaikutuksen tunnistaminen graafista
Analysoi kehitetty graafi tai graafit ohjelmallisesti käyttäen esim. DoWhy ohjelmistoa (ks. Molak 2023). Ohjelmat hyödyntävät kausaalisen analyysin matemaattista teoriapohjaa ja erityisesti sekoittavien muuttujien vaikutusta. Tällä analyysillä varmistetaan, että graafin perusteella voidaan tunnistaa halutut kausaaliset vaikutukset, sekä mitkä muuttujat on otettava malliin mukaan. Ennen datan analyysiä, on varmistuttava, että efekti voidaan sen perusteella tunnistaa. Mikäli graafi on sellainen, että kausaalisen vaikutuksen tunnistaminen ei ole mahdollista, on palattava askeleisiin 1 ja 2.
Askel 4: Datankeräys
Kun muuttujat tunnetaan, voidaan siirtyä varsinaisen datan keräämiseen. Kuten edellä on mainittu, jotta analyysissä päästään kausaalisen analyysin portaille 2 ja 3, datan on oltava kokeellista eli interventiotyyppistä. Meidän täytyy manipuloida sitä muuttujaa, jonka kausaalisesta vaikutuksesta olemme kiinnostuneita. Vain tällä tavalla voimme varmistua, että saatu data kattaa riittävästi erilaisia tilanteita. Jos tarkoitus on tutkia mainoksen vaikutusta tai jonkin uuden palvelun lanseerausta, voidaan niitä kohdistaa/tarjota satunnaisesti asiakkaille.
Askel 5: Kausaalisen mallin sovittaminen
Kun dataa on kerätty riittävästi. Voidaan valita ja sovittaa laskennallisia malleja dataan. Tähän voidaan käyttää niin ikään ilmaisia DoWhy ja EconML ohjelmakirjastoja tai kaupallista CausaLens alustaa (ks. Infolaatikko 1). Kuten yleensä, mallinnuksessa kannattaa aloittaa yksinkertaisesti (lineaarinen malli) ja edetä tarvittaessa kohti monimutkaisempia (epälineaariset mallit).
Askel 6: Sovitetun mallin validointi
Sovitettu malli tai mallit on validoitava, eli testata kuvaavatko ne riittävän hyvin dataa. Jos malli ei sovi dataan hyvin, sitä ei voi analysoida.
Askel 7: Tulosten arviointi ja päätelmät
Tehdään loppupäätelmät mallin antamista ennusteista. Tässä on hyvä olla mukana sekä tekninen, että muut asianosaiset päättäjät. Löytyikö merkittävää kausaalista vaikutusta? Jos ei löytynyt, liittyykö tämä datan puutteisiin vai onko kyseessä aito ilmiö? Jos haluttua kausaalista vaikutusta ei ole, mitä tästä seuraa ja mitä muita keinoja voidaan kokeilla? Joka tapauksessa, olemme saaneet tärkeää kvantitatiivista tietoa päätöksenteon tueksi.
Otan seuraavaksi yksinkertaistetun esimerkin siitä, miten nämä askeleet voitaisiin toteuttaa kuvitteellisessa yrityksessä.
Esimerkki: Yrityksen myynnin lisääminen uutiskirjeellä
Kuntosaliyrittäjä alkoi tarjoamaan jäsenilleen päivittäisiä kuntoiluvinkkejä sähköpostitse. Noin 10 % jäsenistä ilmoittautui saamaan nämä sähköpostit. Asiakasdataa analysoimalla nähtiin, että uutiskirjeen tilanneista jopa 53 % kävi salilla useammin kuin muut. Yrittäjälle heräsi kysymys, että tarkoittaako tämä sitä, että sähköpostikampanja on tehokas ja sitä kannattaa jatkaa, vaikka sen toteuttaminen vie työaikaa. Vai olisiko niin, että sähköpostien tilaajat olivat jo valmiiksi aktiivisempia kuntoilijoita? Toisin sanoen, onko sähköpostien sisältö syy suurempaan käyntimäärään, vai houkutteleeko tämä palvelu lähinnä jo valmiiksi aktiivisia jäseniä?
Tilanne vaatii kausaalista analyysiä ja kokeellista dataa, pelkkä passiivinen asiakasdatan tarkkailu ei anna meille vastausta kysymyksiin, koska emme voi sen perusteella erottaa uutiskirjeen ja jäsenen aktiivisuuden roolia kuntosalilla käymiseen. Jos teemme analyysimme oman vääristyneen datamme perusteella, päädymme hyvin todennäköisesti Simpsonin tai Berksonin paradokseihin (ks. infolaatikko 2).
Askel 1: Yrittäjä päättelee henkilökunnan kanssa, että ilmiön tarkasteluun tarvittavat muuttujat ovat: (A) Uutiskirjeen tarjoaminen asiakkaalle, (B) Asiakkaan uutiskirjeen tilaaminen, (C) asiakkaan yleinen kuntoiluinnostus, ja (D) asiakkaan käyntimäärä salilla viikon aikana. Tavoitteena on selvittää, onko muuttujilla B ja D kausaalista yhteyttä.
Askel 2 ja 3: Muuttujista hahmotellaan kuviossa 3 näkyvä graafi, jossa asiakkaan yleinen innostus (muuttuja C) vaikuttaa sekä halukkuuteen tilata uutiskirje, että käyntimäärään salilla. Tässä muuttuja C on potentiaalinen sekoittava tekijä, koska se vaikuttaa sekä uutiskirjeen tilaamiseen että kuntosalilla käymiseen. Uutiskirjeen kohdennettu tarjoaminen/mainostaminen (muuttuja A) on interventiomuuttuja, johon yritys voi vaikuttaa suoraan. Se on satunnaistettu ja näin ollen riippumaton mistään. Tämä graafi läpäisee askeleen 3, eli siitä voidaan tunnistaa kausaalinen vaikutus.
Kuvio 3. Neljän muuttujan DAG esimerkki.
Askel 4: Yritys aloittaa datankeräyksen. He valitsevat uusia tai jo olemassa olevia jäseniä satunnaisesti saamaan päivittäiset sähköpostit automaattisesti (mahdollisuus kieltäytyä), kun taas toiset jäsenet eivät saa postia oletuksena. Satunnaisotannalla pyritään varmistamaan, että kahden ryhmän välillä ei ole etukäteen suuria eroja (esimerkiksi motivaatiotasossa), vaan ero johtuu nimenomaan sähköpostien saamisesta. Datankeräys kestää 3 kuukautta, joka riittää varmistamaan riittävän otannan. Uutiskirjeen tilaus ja uutiskirjeen avaamistapahtumat tallentuvat tietojärjestelmään. Salilla käyntien määrä saadaan myös ulos suoraan yrityksen asiakastietojärjestelmästä.
Askeleet 5-6: Kerätty data analysoidaan ilmaisilla DoWhy ja EconML ohjelmakirjastoilla. Koska yrityksellä itsellään ei ollut tarvittavaa data-analyysiosaamista, Analyysi toteutettiin yhteistyössä paikallisen korkeakoulun kanssa ja innokas opiskelija teki aiheesta opinnäytetyönsä.
Askel 7: Analyysin tuloksena löydettiin, että uutiskirjeen kasvattava vaikutus salilla käyntiin oli keskimäärin 9 % (luottamusväli 5-13 %), eli selvästi alempi kuin naiivi analyysi (53 %) antoi ymmärtää, mutta kuitenkin niin hyvä että uutiskirjeen tuottamista päätettiin jatkaa. Kävijämäärän kasvu oli riittävä, jotta uutiskirjeen tuottamiseen menevät resurssit olivat perusteltuja. Yrityksessä päätetään ilmoittaa uudet jäsenet automaattisesti mukaan uutiskirjeeseen, tietysti niin että siitä on aina mahdollisuus kieltäytyä.
Todellisuudessa tilanne on harvoin yhtä suoraviivainen kuin tässä esimerkissä. Muuttujia on yleensä enemmän kuin neljä ja prosessi menee harvoin ”kertalaakista” alusta loppuun, ilman että joudutaan palamaan edellisiin askeliin ja iteroimaan. Se miksi data-analyysiä tehdään pääosin diagnostisella ja ennusteiden tasoilla (tasot 1-2), rajoittuen kausaalisuuden portaalle 1, johtuu siitä, että kausaalinen analyysi on haastavampaa kuin perinteinen analyysi. Tämä johtuu muuttujien tunnistamisesta ja graafin rakentamisesta, sekä analyysin teknisestä toteutuksesta (esim. Python ohjelmointi). Kausaalinen data-analyysi ei kuulu edes useimpien data-analyytikkojen vakiokalustoon. Keskeiset haasteet kausaalianalyysissä voidaan tiivistää seuraavasti.
- Sekoittavat muuttujat: Sekoittavat muuttujat ovat tekijöitä, jotka vaikuttavat sekä syyhyn että lopputulokseen (esimerkissämme muuttuja C). Ne ovat hyvin yleisiä todellisen maailman ilmiöissä, joissa monet asiat limittyvät yhteen. ja hankaloittavat kausaalisen efektin tunnistamista.
- Tuntemattomat muuttujat: Myös erilaiset tuntemattomat tekijät ovat tavallisia; emme välttämättä osaa listata kaikkia muuttujia. Nämä piilevät muuttujat voivat vaikuttaa ilmiöön. Esimerkiksi asiakkaiden todelliseen ostokäyttäytymiseen voivat vaikuttaa makrotaloudelliset tekijät, joita ei ole mukana omassa datassa.
- Liian suuret graafit: Muuttujien määrä voi kasvaa helposti suureksi, esimerkiksi useisiin kymmeniin. Tämä on tyypillistä etenkin prosessiteollisuudessa. Tämä tekee kausaalianalyysistä haastavaa ja myös laskennallisesti raskasta. Erilaisten kausaalisten graafien määrä kasvaa eksponentiaalisesti muuttujien lukumäärän kasvaessa, joten tasapainoilu skaalautuvuuden ja mallin tarkkuuden välillä on vaikeaa.
- Tekninen osaaminen: Vaikka kausaalianalyysi muistuttaa monin tavoin perinteistä koneoppimista ja tilastollista analyysiä, se edellyttää erilaista ajattelutapaa sekä uusien käsitteiden ja laskennallisten mallien ymmärrystä. Tämä voi muodostaa oppimiskynnyksen yrityksille, joilla ei ole data-analyysiin erikoistuneita henkilöitä.
- ’No-code’ ohjelmistojen puute: Toisin kuin monilla muilla analyysi ja tekoälymenetelmillä, kausaalianalyysiä varten on ei ole juurikaan tarjolla helppokäyttöisiä graafisia ohjelmistoja (etenkään ilmaisia), joita voisi käyttää ilman mitään ohjelmointiosaamista. Paras tapa päästä käsiksi uusimpiin menetelmiin on tällä hetkellä käyttää suoraan esim. Python ohjelmakirjastoja (esim. DoWhy).
Generatiivinen tekoäly kausaalisen päättelyn apuna
Generatiivinen tekoäly ja erityisesti edistyneet, suuret kielimallit (esim. ChatGPT palvelu) ovat erittäin hyvä apuväline kausaalisessa analyysissä. Kielimalleilla ei ole samanlaista syvällistä ymmärrystä maailmasta ja sen lainalaisuuksista (ns. world model) kuten ihmisillä on, joten niiden kausaalinen syy ja seuraussuhteiden ymmärrys on monesti heikkoa (Berglund ym. 2024). Niillä on myös taipumusta tuottaa vääriä tuloksia (ns. hallusinaatiot) tilanteissa, jossa ilmiö ei ole tuttu mallien opetusdatasta. Tästä huolimatta, kielimallit sisältävät valtavasti tietoa ja ne voivat tukea kausaalisen analyysin prosessia esimerkiksi seuraavilla tavoilla.
- Auttamaan taustatutkimuksessa, jossa tutkittavasta ilmiöstä etsitään tietoa kirjallisuudesta. Tiedonhakuun erikoistuneet tekoälymallit, kuten Perplexity, Consensus ja Scispace voivat nopeasti hakea ja koostaa kirjallisuuskatsauksia.
- Paikkaamaan puuttuvaa domain-asiantuntemusta joltakin keskeiseltä osa-alueelta. Tätä varten tekoälyä voi ”roolittaa” esim. pyytämällä sitä olemaan käyttäytymistieteilijä, talousasiantuntija tai markkinointiguru.
- Ehdottamaan ilmiöön liittyviä muuttujia ja niiden välisiä kausaalisia mekanismeja, sekä luomaan alustavia kausaalisia graafeja
- Arvioimaan kriittisesti asiantuntijoiden oletuksia ja hypoteeseja, sekä tarjoamaan uusia näkemyksiä
Professori Pearl on kuvannut suuria kielimalleja ’assosiaatioiden salaatiksi’, joka on rakennettu ihmisiltä peräisin olevasta tekstistä. Koska ihmisillä on kausaalinen ymmärrys maailmasta, myös kielimalleissa on mukana kausaalista tietoa, vaikka niillä itsellään ei ole kausaalista maailmankuvaa. Tämä ainutlaatuinen piirre mahdollistaa sen, että kielimallit suoriutuvat hyvin joistakin kausaalisen päättelyn tehtävistä, mutta huonosti toisista. Huolellinen promptaaminen on usein tarpeen oikean kausaalisen päättelyn aikaansaamiseksi. Pearl muistuttaa, ettei meidän tule olettaa, että kielimalleilla on johdonmukainen tai täydellinen ymmärrys kausaalisuudesta.
Mitä kausaalit promptit sitten voisivat olla? Tuoreessa artikkelissa (Yamin ym. 2024) tutkijat antavat kaksi esimerkkipromptia, joita voi käyttää yksittäisten kausaalisten yhteyksien kyselyyn kielimallilta.
Prompti 1
Consider the following hypothetical narrative.
{narrative}
According to the hypothetical narrative, does {cause} have a (direct or indirect) causal effect on {effect}? Think step-by-step and end your answer with Yes/No.
Prompti 2
Consider the following hypothetical narrative.
{narrative}
According to the hypothetical narrative, does {cause} have a (direct or indirect) causal effect on {effect}? Answer in Yes/No.
Näissä ilmiö on kuvattuna kohdassa {narrative} ja muuttujat kohdissa {cause} ja {effect}. Kannatta huomioida, että kyselyt kannattaa tehdä englanniksi, jolloin kielimalleista saa yleensä parhaimmat tulokset etenkin ongelmanratkaisutehtäville. Lisää esimerkkejä kielimallien käytöstä löytyy mm. lähteestä (Kıcıman ym. 2024).
Kausaalisesta analyysistä kilpailuetua PK-yrityksille
Pienet ja keskisuuret yritykset (pk-yritykset) toimivat monesti ympäristössä, jossa jokaisen käytetyn euron ja tehdyn päätöksen on oltava merkityksellinen. Pk-yrityksillä on usein rajalliset budjetit ja pienet tiimit, mikä tekee tehokkuudesta elintärkeää. Kausaalianalyysi voi antaa pk-yrityksille mahdollisuuden toimia resursseihinsa nähden tehokkaammin. Pk-yrityksiltä puuttuu usein suuryritysten byrokraattinen hitaus, mikä tekee niistä ketteriä ottamaan käyttöön uusia työkaluja ja menetelmiä. Kausaalianalyysin avulla pk-yritykset voivat nopeasti testata, validoida ja hienosäätää strategioitaan, mikä mahdollistaa tehokkaan reagoinnin markkinoiden muutoksiin.
Päätökset esimerkiksi markkinointibudjetista, rekrytoinneista tai operatiivisesta tehokkuudesta voivat ratkaista pk-yrityksen menestyksen tai epäonnistumisen. Paljastamalla lopputulosten taustalla olevat syy-seuraussuhteet kausaalianalyysi vähentää arvailua ja varmistaa, että resurssit kohdennetaan suurimman vaikutuksen alueille. Kontrafaktuaaliset (porras 3) kausaaliset mallit mahdollistavat päätösten vaikutusten simuloimisen ennen siirtymistä kalliiseen toteutukseen.
Vaikka kausaalianalyysi vaatii opiskelua, sen ei tarvitse olla monimutkaista tai kallista.
Keskity korkean vaikutuksen kysymyksiin. Aloita tunnistamalla liiketoimintasi kannalta kriittisimmät kysymykset, jotka vaikuttavat suoraan liikevaihtoon tai tehokkuuteen. Esimerkiksi: Mikä aiheuttaa asiakaspoistumaa? Mitkä markkinointikanavat ovat todella tehokkaita? Miten operatiivisia prosesseja voidaan virtaviivaistaa tunnistamalla ja poistamalla pullonkaulat?
Hyödynnä generatiivista tekoälyä. Edistyneimmät suuret kielimallit, kuten ChatGPT:n GPT-4o, o1 ja o3 mallit, voivat auttaa paikkaamaan omaa domain-asiantuntemuksen puutetta, auttamaan kausaalisten mallien rakentamisessa ja toimimaan kriitikkona. On kuitenkin muistettava terve kriittisyys mallien vastausten suhteen.
Aloita jo olemassa olevalla datalla. Myyntitiedot, asiakaspalaute ja operatiiviset mittarit ovat arvokkaita lähteitä kausaalianalyysille, koska niistä voi tunnistaa keskeisiä muuttujia ja niiden välisiä assosiaatioita (porras 1). Tämä toimii pohjana kausaaliselle mallinnukselle ja datankeräykselle (portaat 2 ja 3).
Toteuta pienimuotoisia kokeita. Kausaalianalyysi ei aina vaadi valtavia datamassoja tai kallista datankeräystä. Kokeellisen datan kerääminen esimerkiksi sähköisten markkinointistrategioiden tapauksessa voi olla suhteellisen helppoa.
Vahvista sisäistä ja ulkoista asiantuntijoiden välistä yhteistyötä. Poista kuilut teknisten asiantuntijoiden, ei-teknisten asiantuntijoiden ja päätöksentekijöiden välillä, sekä tunnista missä tarvitaan ulkoisia asiantuntijoita.
Rakenna kausaalinen ajattelutapa osaksi yrityskulttuuria. Kannusta tiimejä kyseenalaistamaan oletuksia, analysoimaan lopputuloksia kriittisesti ja keskittymään näyttöön perustuviin strategioihin. Hyödynnä kausaalisia graafeja monimutkaisten prosessien ymmärtämiseen.
Hyödynnä ilmaisia avoimen lähdekoodin kausaalisen laskennan työkaluja, kuten DoWhy ja EconML.
Yhteenveto
Kausaalinen mallinnus on laaja kokonaisuus, josta raapaisin vasta pintaa. Kävin läpi keskeisiä kausaalisen mallinnuksen perusteita, kuten kausaalisuuden kolme porrasta, sekä miten kausaalinen data-analyysi eroaa ennustavasta analyysistä ja tekoälymalleista. Esittelin myös kausaalisen analyysin seitsemän porrasta.
Aitoihin kausaalisiin syy-seuraussuhteisiin perustuvat analyysit ja laskennalliset mallit antavat valtavan edun päätöksentekoon. Liiketoiminnassa hyvä päätöksenteon ei pitäisi olla vain reagoimista tapahtumiin tai trendeihin, vaan niiden ennakointia ja ohjaamista.
Kausaalinen mallinnus on preskriptiivistä, eli sen avulla voidaan mallintaa vaihtoehtoisia tapahtumia myös tilanteessa, jossa toimintaympäristö muuttuu. Tämä voi antaa yrityksille työkalut ennakoida erilaisten toimenpiteiden vaikutusta ennen niiden toteuttamista.
Parhaimmillaan kausaalimallinnus voi muuttaa organisaation päätöksentekokulttuuria dataohjatumpaan ja analyyttisempaan suuntaan. Tämä voi olla merkittävä kilpailuetu erityisesti nopeasti muuttuvilla markkinoilla.
Kausaalinen malli mahdollistaa muun muassa:
- Kohdistetut toimenpiteet: Tiedät esimerkiksi mihin asiakkaisiin, prosesseihin ja kehityskohteisiin keskittyä.
- Optimoidut strategiat: Voit testata muutoksia oli kyse sitten hinnoittelusta tai operatiivisista säädöistä.
- Hukkaan menevien resurssien välttäminen: Vältä investoinnit toimiin, jotka eivät tuota tuloksia, ja panosta niihin, jotka toimivat.
Kausaalinen mallinnus vaatii kuitenkin uudenlaista ajattelutapaa ja myös teknistä osaamista. Kausaalisen mallin rakentaminen pakottaa miettimään ilmiötä syvällisemmin ja monipuolisemmin, kuin perinteinen tilastollinen tai ennustava mallinnus.
Vaikka saatavilla on jo hyviä avoimeen lähdekoodiin perustuvia työkaluja, toistaiseksi helppokäyttöisiä graafisia työkaluja ei ole vielä laajasti saatavilla. Toisaalta generatiivinen tekoäly (ChatGPT ja vastaavat) voi olla suureksi hyödyksi etenkin PK-yrityksille, joilla voi olla puutteita teknisessä osaamisessa tai erityisalojen asiantuntemuksessa.
Infolaatikko 1 (ohjelmistoja kausaaliseen mallinnukseen)
DoWhy and EconML: Avoimen lähdekoodin DoWhy-kirjasto tarjoaa laajan valikoiman algoritmeja graafien validointiin, mallien sovittamiseen, efektien arviointiin, kausaalivaikutusten kvantifiointiin, kausaalirakenteiden diagnosointiin, interventioihin ja kontrafaktuaalien tarkasteluun. EconML kirjasto integroituu saumattomasti DoWhy’hin lisäten kehittyneitä toiminnallisuuksia.
causaLens: Kaupallinen alusta, jossa on graafinen käyttöliittymä numeerisille, taulukkomuotoisille tai aikasarja-muotoisille datoille. Mahdollistaa ’mitä jos’ -analyysit ja erilaisten liiketoimintaskenaarioiden optimoinnin. Sisältää myös generatiivisen tekoälyn toimintoja.
Infolaatikko 2 (esimerkkejä valintaharhoista ja vääristymistä)
Simpsonin paradoksi ilmenee, kun tietty trendi, joka näkyy useissa eri dataryhmissä, kääntyy päinvastaiseksi tai häviää, kun ryhmät yhdistetään. Tämä korostaa sitä, kuinka luonnollisen ryhmittelyn huomioimatta jättäminen voi peittää tai kääntää muuttujien todellisen suhteen.
Esimerkki: Suurempi markkinointibudjetti kasvattaa myyntiä sekä pienillä, keskisuurilla ja suurilla yrityksillä, eli kaikissa ryhmissä nähdään vahva positiivinen korrelaatio. Kuitenkin, jos emme huomioi datan luonnollista ryhmittelyä ja trendiä katsotaan koko ryhmän tasolla, efekti katoaa.
Miten välttää: Analysoi dataa sopivalla tarkkuustasolla ja ota huomioon kaikki oleelliset muuttujat, jotka voivat vaikuttaa muuttujien väliseen suhteeseen.
Berksonin paradoksi on valintaharhan muoto, jossa kaksi toisistaan riippumatonta muuttujaa vaikuttavat negatiivisesti korreloituneilta jonkin valintakriteerin vuoksi. Tämä tapahtuu, kun otos perustuu kolmanteen muuttujaan, johon molemmat vaikuttavat.
Esimerkki: Analysoidaan yrityksen avainasiakkaita, jotka ovat sekä maksukykyisiä että sitoutuneita brändiin. Tällöin voidaan virheellisesti päätellä, että maksukyky ja sitoutuminen ovat toisiaan heikentäviä tekijöitä (negatiivinen korrelaatio), vaikka koko asiakakunnan tasolla korrelaatiota ei löydy.
Miten välttää: Varmista että analysoitu otos on edustava koko populaation tasolla, eikä valittu jonkin kriteerin perusteella.
Tekoälykäs pk-yritys: muutosvoimaa tekoälyn hyödyntämiseen pk-yrityksille ja niiden työntekijöille -hanke avaa tekoälyn merkitystä muutosmatkana yksilöiden ja yritysten tasoilla. Hanke edistää pk-yritysten ja niiden työntekijöiden tekoälyn käyttöönottoa. Hanketta toteuttaa Haaga-Helia ammattikorkeakoulu ja kumppaneina ovat Business Helsinki, KEUKE, Länsi-Uudenmaan kauppakamari, Terveysteknologia, Tradenomiliitto, Uudenmaan Yrittäjät, Yrityskummit. Hanketoteutusta tukee rahoittajan roolissa Työsuojelurahasto.
Lähteet
Baiardi, A., & Naghi, A. A. 2024. The value added of machine learning to causal inference: Evidence from revisited studies. The Econometrics Journal, utae004.
Berglund, L., Tong, M., Kaufmann, M., Balesni, M., Stickland, A.C., Korbak, T., Evans, O. 2024. The reversal curse: LLMs trained on ”A is B” fail to learn ”B is A”. Proceedings of International Conference on Learning Representations (ICLR).
Gelman, A. 2011. Causality and Statistical Learning, American Journal of Sociology 117, 955-966.
Kıcıman, K., Ness, R., Sharma, A., Tan, C. 2024. Causal Reasoning and Large Language Models: Opening a New Frontier for Causality. Cornell University.
Liotsiou, D. 2023. Causal Inference In Python: Theory to Practice. YouTube. Accessed 7.2.2025.
Molak, A. 2023. Causal Inference and Discovery in Python: Unlock the secrets of modern causal machine learning with DoWhy, EconML, PyTorch and more. Packt Publishing.
Pearl, J., Mackenzie, D. 2020. The book of why: The New science of cause and effect. first trade paperback edition. New York: Basic Books.
Takeda, H. 2024. Causal Inference with Machine Learning: Why It Matters in Business Decision-Making. Towards AI. Accessed 7.2.2025.
Taylor, S.J. 2024. Causal discovery for product analytics. Motif Analytics blog. Accessed 7.2.2025.
Yamin, K., Gupta, S., Ghosal, G. R., Lipton, Z. C., & Wilder, B. 2024. Failure Modes of LLMs for Causal Reasoning on Narratives. arXiv preprint arXiv:2410.23884.
Kuva: Shutterstock