BIG DATA – BIG BUSINESS -hankkeessa tutkittiin, voidaanko B2B-yrityksen myynnin tueksi kerätä avoimista datalähteistä tietoa potentiaalisista asiakkaista. Tutkimuksen yleinen havainto oli, että potentiaalisten asiakasyritysten tietojen louhiminen valtavista ja heterogeenisistä datalähteistä, kuten www-sivustoilta, on varsin haastavaa. Tutkimuksessa onnistuttiin kuitenkin kehittämään menetelmä, jonka avulla internetistä voidaan louhia sellaisia sivustoja, jotka sisältävät potentiaalisten yritysasiakkaiden tietoja. Tällaista menetelmää kannattaa yrityksessä hyödyntää silloin, kun toimintaa laajennetaan uudelle markkinalle, josta ei ole paljoa tietoa saatavilla. Tällaisia ovat tyypillisesti kehittyvien talouksien markkinat.
Myynnin asiantuntemusta ei kannata sivuuttaa
Tutkimuksessa saatiin melko nopeasti selville, että massadataa hyödyntävän menetelmän kehittämiseksi tarvitaan myynnin asiantuntemusta ja että kehitettävä menetelmä on parhaimmillaankin vain myynnin apuväline. Kehittyvillä markkinoilla toimivilla myynnin ammattilaisilla on käytössään useita eri tietolähteitä potentiaalisten asiakkaiden tunnistamiseksi. Näitä ovat esimerkiksi messuilta saatavat kontaktit, mediaseurannan, verkkoanalytiikan ja markkinointianalytiikan työvälineistä saatavat tiedot sekä erilaiset ostetut yritystietokannat. Lisäksi myyntihenkilöstö hyödyntää erilaisia verkossa vapaasti käytettävissä olevia lähteitä, jotka sisältävät tietoja potentiaalisista yritysasiakkaista. Nämä tietolähteet ovat tyypillisesti sivustoja, joissa on sekä julkisen että yksityisen sektorin tarjouspyyntöjä.
Tutkimuksen kohteena oleva markkina lukeutuu maailman viiden suurimman joukkoon, joten potentiaalisista asiakkaista tietoja sisältäviä sivustoja on erittäin paljon – niin paljon, ettei myynnin henkilöstö ehdi käydä niitä systemaattisesti läpi ja seuloa joukosta hyödyllisiä. Tähän tarpeeseen tutkimuksessa kehitettiin koneoppimiseen perustuva menetelmä, joka hakee verkosta myynnille mahdollisesti hyödyllisiä sivustoja ja pisteyttää ne hyödyllisyyden mukaan. Menetelmä testattiin käytännössä toteuttamalla leadMachine-niminen ohjelmistoprototyyppi.
Tutkimuksessa selvisi, että myynnin henkilöstö pitää menetelmän tuottamia tietolähteitä hyödyllisinä. Hyödyllisimpänä ominaisuutena he pitivät sitä, että leadMachine voi automaattisesti kertoa vaikka päivittäin, onko jokin uusi tärkeä tietolähde tullut saataville.
Koneoppiminen B2B-myynnin palveluksessa
Tutkimuksessa kehitetty massadataa hyödyntävä menetelmä toimii siten, että ensin myyjiltä kerätään tietoa tärkeimmistä heidän hyödyllisiksi ja toisaalta hyödyttömiksi arvioimistaan sivustoista. Linkkilistan (5-10 kpl) lisäksi tutkija kerää haastattelemalla laadullista tietoa hyvien ja huonojen sivustojen ominaisuuksista. Linkkilista annetaan syötteeksi leadMachine-ohjelmistolle ja laadullinen data säästetään ohjelmiston kehittämisen myöhempiä vaiheita varten.
Seuraava vaihe on sivustoja luokittelevan ohjelmiston luominen käyttäen koneoppimismenetelmiä. Koneoppimista varten pitää ensin luoda opetusdataa. Tämä tehdään käyttämällä Google Advanced Search:iä etsimään lisää sekä hyviä että huonoja sivustoja. Tutkija tarkistaa hakujen tulokset käyttäen haastattelussa saamiaan laadullisia kriteerejä. Tämän vaiheen tuloksena koossa on suurehko joukko hyödyllisiksi ja ei-hyödyllisiksi luokiteltuja sivustoja. Tämä datajoukko toimii opetusdatana koneoppimisalgoritmeille. Seuraavaksi luodaan viidellä eri koneoppimisalgoritmilla viisi eri luokittelijaa, jotka kukin osaavat luokitella tietolähteen hyödylliseksi tai ei-hyödylliseksi.
Viimeinen vaihe on leadMachine-ohjelmistoprototyypin luominen. Ohjelmisto ohjelmoidaan käynnistymään kerran päivässä. LeadMachinen sisällä käynnistyy ensin Google Advanced Search. Jos se löytää uusia potentiaalisesti hyödyllisiä tietolähteitä, lähetetään ne luokiteltaviksi viidelle koneoppimismenetelmin tuotetulle luokittelijalle. Luokittelijoiden tulokset yhdistetään ja jokainen uusi tietolähde luokitellaan hyödylliseksi tai ei-hyödylliseksi ja pisteytetään sen mukaan, kuinka varmoja luokittelijat ovat luokituksestaan. Ainoastaan ne tietolähteet, jotka leadMachine katsoo hyödyllisiksi ja joiden pisteytys ylittää tietyn kynnysarvon, lähetetään myyjille tiedoksi.
Massadataa voi ja kannattaa hyödyntää B2B-myynnissä
Tutkimuksessa selvittettiin tapaustutkimuksen keinoin, miten massadataa voi hyödyntää yrityksen myynnissä. Massadatan hyödyntämiseksi on olemassa paljon muitakin tapoja kuin tässä esitelty. Näitä ovat mm. yrityksen sisäisen datan louhiminen, ostettujen yritystietokantojen tietojen yhdistely sisäiseen ja ulkoiseen dataan sekä yrityksen ja sen kilpailijoiden sosiaalisiin verkostoihin, kuten LinkedIn ja Twitter, liittyvän datan louhiminen. Tässä tutkimuksessa hyödynnettiin verkkosivustoja B2B-myynnin datalähteenä ja kehitettiin koneoppimiseen perustuva menetelmä uusien myynnille hyödyllisten verkkosivustojen louhimiseksi. Valinta perustui sekä tapaustutkimuksen kohteena olevan yrityksen tarpeisiin että yritykseltä tutkimuskäyttöön saadun datan hyödynnettävyyteen. Rakentamalla Google Advanced Search:iä ja koneoppimisalgoritmeja hyödyntävä leadMachine-ohjelmistoprototyyppi voitiin käytännössä havainnollistaa kuinka hyödyntäminen voi tapahtua. Tämän lisäksi kohdeyritys arvioi, että leadMachinen tuottamat tulokset ovat heille hyödyllisiä. Tutkimuksen perusteella suosittelemme uusilla ja suurilla markkinoilla toimivien B2B-yritysten myynnille avoimen massadatan hyödyntämistä koneoppimisen keinoin.
Artikkelin on kirjoittanut digitalouden yksikön yliopettaja Lili Aunimo. Hän toimii Big Data – Big Business -hankkeessa tutkijana. Hankkeen tavoitteena on tuottaa uutta akateemista ja käytännöllistä tietoa big datan hyödyntämisestä uuden liiketoiminnan luomisessa. Hanke yhdistää datakeskeisen ja liiketoiminnallisen näkökulman big datan hyödyntämiseen.
Lähde:
Aunimo, L. & Hallikainen, H. (2019). Data-driven discovery of digital channels for detecting sales prospects in emerging markets. Proceedings of the 48th EMAC Annual Conference. European Marketing Academy. Poster paper.