21.08.2017

Tärkeintä on laadukas data

Seuraava kirjoitus on julkaistu Tieke lehden numerossa 1-2017. Jaetaan se nyt täälläkin.


Tärkeintä on laadukas data

Voimme päivittäin lukea uutisvirrasta uusien tekoälyratkaisujen tulevaisuuden potentiaaleista. Datamäärien ja laskentatehon kasvu yhdessä algoritmien kehityksen kanssa ovat potkaisseet tekoälyn kehitysvauhdin uudelle kiertoradalle.

Nykyään lähes kaikki tekoälyratkaisut perustuvat neuroverkkoihin, joiden prosessoitavaksi on ohjattu dataa. Neuroverkko ohjelmoidaan oppimaan datasta, jossa on syötteitä (esimerkiksi asiakkaan taustatietoja ja ostohistoriaa) ja vasteita (esimerkiksi ostiko asiakas tuotteen vai ei).
Näin neuroverkko muodostaa mallin, jonka avulla se ennustaa syötteiden avulla vasteita.

Varmista vahva perusta

Kun tekoälyä ryhdytään valjastamaan liiketoiminnan resurssiksi, ensin onkin ymmärrettävä, että kaikki lähtee laadukkaasta datasta. Fiksuinkaan tekoälysovellus ei palvele tarkoitustaan, jos sille syötetään epärelevanttia dataa. Toisin sanoen: mitä kattavammat ja paremmat datavarannot yrityksellä on, sen järeämmät edellytykset sillä on rakentaa toimivia tekoälyratkaisuja liiketoiminnan eri osa-alueille.

Vältä järjettömät ratkaisut

Datan huonosta laadusta esimerkkinä käy botti, jonka piti opetella twiittailemaan. Valitettavasti Twitter-käyttäjät syöttivät sille rasistisia ja sovinistisia twiittejä, ja bottihan oppi ne nopeasti, ja alkoi heittää vastaavia twiittejä. Kunnes joutui itse jäähypenkille konekatumaan.
Yksi tekoälyratkaisujen heikkous onkin, että niillä ei ole kontekstia ympäröivään maailmaan, ja siksi ne voivat päätyä joissakin tilanteissa järjettömiin ratkaisuihin.

Korvaamaton resurssi

Jatkossa yritysten datavarannot ovat yksi tärkeimmistä kilpailutekijöistä, kun taistellaan paikasta auringossa. Ne ovat tärkeämpiä kuin vaikkapa ohjelmistot tai tekoälyalgoritmit, koska jälkimmäiset ovat melko helposti kopioitavissa tai ostettavissa. Datavarannot ovat taas rahanarvoista omaisuutta, jota kilpailijat eivät voi kopioida. Esimerkiksi Google julkaisee tekoälykoodejaan avoimesti, mutta datasta saa maksaa. Eikä kaikkea dataa tietenkään saa edes rahalla!

Laadi tekoälystrategia

Monissa yrityksissä datavarantojen muodostamisesta vastaa it-osasto, joka hankkii ohjelmistoja ja teknologioita asian toteuttamiseksi. Liiketoiminnat osallistuvat tiedonkeruuseen käyttämällä ohjelmistoja (esimerkiksi ERP tai CRM). Tämän mallin riskinä on, että datavarantojen sisällön kehitystä ei vie eteenpäin ennalta mietitty strategia. Seurauksena voi olla siilomaisia ja pistemäisiä ratkaisuja, jotka eivät kustannuksiin nähden tuo riittävästi arvoa. Yrityksissä olisikin korkea aika pohtia datan strategista arvoa liiketoiminnan kannalta ja kehittää datan keräämistä sekä hyödyntämistä sen mukaisesti.

 

Share
Contact Person

Blog writer

Mika Laukkanen

Vincit Bilot

Bilot & Vincit have joined forces!

See where the story continues 

You have Successfully Subscribed!

Vincit Bilot

Bilot & Vincit have joined forces!

See where the story continues 

You have Successfully Subscribed!