Seuraava kirjoitus on julkaistu Tieke lehden numerossa 1-2017. Jaetaan se nyt täälläkin.
Tärkeintä on laadukas data
Voimme päivittäin lukea uutisvirrasta uusien tekoälyratkaisujen tulevaisuuden potentiaaleista. Datamäärien ja laskentatehon kasvu yhdessä algoritmien kehityksen kanssa ovat potkaisseet tekoälyn kehitysvauhdin uudelle kiertoradalle.
Nykyään lähes kaikki tekoälyratkaisut perustuvat neuroverkkoihin, joiden prosessoitavaksi on ohjattu dataa. Neuroverkko ohjelmoidaan oppimaan datasta, jossa on syötteitä (esimerkiksi asiakkaan taustatietoja ja ostohistoriaa) ja vasteita (esimerkiksi ostiko asiakas tuotteen vai ei).
Näin neuroverkko muodostaa mallin, jonka avulla se ennustaa syötteiden avulla vasteita.
Varmista vahva perusta
Kun tekoälyä ryhdytään valjastamaan liiketoiminnan resurssiksi, ensin onkin ymmärrettävä, että kaikki lähtee laadukkaasta datasta. Fiksuinkaan tekoälysovellus ei palvele tarkoitustaan, jos sille syötetään epärelevanttia dataa. Toisin sanoen: mitä kattavammat ja paremmat datavarannot yrityksellä on, sen järeämmät edellytykset sillä on rakentaa toimivia tekoälyratkaisuja liiketoiminnan eri osa-alueille.
Vältä järjettömät ratkaisut
Datan huonosta laadusta esimerkkinä käy botti, jonka piti opetella twiittailemaan. Valitettavasti Twitter-käyttäjät syöttivät sille rasistisia ja sovinistisia twiittejä, ja bottihan oppi ne nopeasti, ja alkoi heittää vastaavia twiittejä. Kunnes joutui itse jäähypenkille konekatumaan.
Yksi tekoälyratkaisujen heikkous onkin, että niillä ei ole kontekstia ympäröivään maailmaan, ja siksi ne voivat päätyä joissakin tilanteissa järjettömiin ratkaisuihin.
Korvaamaton resurssi
Jatkossa yritysten datavarannot ovat yksi tärkeimmistä kilpailutekijöistä, kun taistellaan paikasta auringossa. Ne ovat tärkeämpiä kuin vaikkapa ohjelmistot tai tekoälyalgoritmit, koska jälkimmäiset ovat melko helposti kopioitavissa tai ostettavissa. Datavarannot ovat taas rahanarvoista omaisuutta, jota kilpailijat eivät voi kopioida. Esimerkiksi Google julkaisee tekoälykoodejaan avoimesti, mutta datasta saa maksaa. Eikä kaikkea dataa tietenkään saa edes rahalla!
Laadi tekoälystrategia
Monissa yrityksissä datavarantojen muodostamisesta vastaa it-osasto, joka hankkii ohjelmistoja ja teknologioita asian toteuttamiseksi. Liiketoiminnat osallistuvat tiedonkeruuseen käyttämällä ohjelmistoja (esimerkiksi ERP tai CRM). Tämän mallin riskinä on, että datavarantojen sisällön kehitystä ei vie eteenpäin ennalta mietitty strategia. Seurauksena voi olla siilomaisia ja pistemäisiä ratkaisuja, jotka eivät kustannuksiin nähden tuo riittävästi arvoa. Yrityksissä olisikin korkea aika pohtia datan strategista arvoa liiketoiminnan kannalta ja kehittää datan keräämistä sekä hyödyntämistä sen mukaisesti.