Analytiikan kehittäminen on kuin tutkimusmatka – aina ei tiedä minkä ääreltä itsensä löytää. Mikä on kuitenkin varmaa on se, että jos ei ikinä lähde matkaan niin ei päädy minnekään.
Monissa yrityksissä on viime vuosina laitettu raportointia, BI:tä, kuntoon. Tiedetään miten hyvin tai huonosti meillä meni eilen, viime viikolla, viime kuussa. Sekin on ihan arvokasta tietoa ja onhan siinä samalla tehty organisaation datapääomalle määräaikaishuolto.
Aika monen toimiston nurkkahuoneessa nautitaan Suomen luonnon tarjoamasta hämärästä hetkestä ja pohditaan, että mitähän ihmettä sille kaikelle yrityksen toiminnasta kerätylle datalle tekisikään. Kaverit klubilla puhuivat jostain ennustavasta analytiikasta ja Machine Learningista…miten päästä alkuun ja uuden oppimisen äärelle järkevällä riskillä.
Louhialla ja muissakin fiksuissa konsulttitaloissa käytetään CRISP-DM metodologiaa (IBM:n aikanaan kehittämä), jonka avulla tehdään ketteriä ja pieniriskisiä analytiikkaprojekteja. Sen avulla on nopeasti selvitettävissä onko valitussa ongelmassa liiketoimintapotentiaalia. Työskentelytapa on iteratiivinen.
CRISP-DM vaiheistus on kuvattu seuraavassa:
- Ongelman identifiointi
- Datan ymmärtäminen
- Datan valmistelu
- Mallinnusvaihe
- Tulkinnat ja analyysit
- Tuotantoon vienti tai palautus aiempiin vaiheisiin
Kaikki lähtee ratkaistavan liiketoimintaongelman tunnistamisesta ja kuvaamisesta. Ongelmien tunnistaminen on yleensä suhteellisen helppoa, kuvaaminen jo hieman haastavampaa. Apuna voi käyttää esim. Ishikawa- diagrammia.
Osana kuvaamista tunnistetaan myös ko. ongelman ratkaisemisen hyötypotentiaali. Samalla on hyvä myös tutkailla löytyykö aihealueelta dataa menemättä vielä yksityiskohtiin. Yhtenä löydöksenä voi olla myös se, että meillä on ongelma, jonka ratkaiseminen toisi merkittävää liiketoimintahyötyä, mutta meillä ei ole dataa. Action: ryhdytään keräämään dataa ja palataan asiaan esim. vuoden kuluttua.
Kun on saatu ymmärrys ratkaistavasta ongelmasta, sen laajuudesta ja hyötypotentiaalista ja ollaan tunnistettu aihealueeseen suurella todennäköisyydellä liittyvät datat, on aika avata konepelti ja kääriä hihat. Datan kanssa puuhaaminen on aikaa vievää ja välillä tuskallistakin hommaa – kerätään, kuvaillaan, tutkaillaan, verifioidaan, valitaan, putsataan ja yhdistellään muiden datojen kanssa. Tämän vaiheen tärkeyttä ei voi aliarvioida – ilman dataa ei synny analyysiä, ilman analyysiä ei synny uusia havaintoja ja niiden mahdollistamia hyötyjä. Tämä vaihe saattaa vaatia pizzaa ja energiajuomia.
Mallinnusvaiheessa datatieteilijä tekee taikojaan: valitsee soveltuvat mallinnustekniikat, rakentaa ja testaa malleja, pistää parametrit oikeaan asentoon. Tässä vaiheessa datatieteilijää ei saa häiritä ja samassa toimistossa työskenteleviä suositellaan riisumaan kengät pois ja laittamaan pörrösukat jalkaan melun minimoimiseksi.
Kun mallinnus on tehty, on aika siirtyä tekemään tulkintoja ja analyysejä sekä verrata mallin antamia tuloksia suhteessa projektin alussa asetettuihin tavoitteisiin. Hyvässä lykyssä voidaan todeta, että mallit antavat järkevän tuntuisia tuloksia. Jossain tapauksissa joudutaan palaamaan nöyrästi joko mallinnuksen pariin tai selvittämään datassa mahdollisia olevia puutteita. Hyvässä lykyssä siirrytään miettimään miten kehitetyt mallit ja data saadaan tuottamaan liiketoimintahyötyä eli ryhdytään ensin suunnittelemaan ja sitten toteuttamaan tuotantoon siirtoa.
Kun jotain viedään tuotantoon, täytyy suunnitella kuinka asioita seurataan, ylläpidetään, kehitetään ja kenen kanssa. Mallien antamia tuloksia voidaan vaikkapa upottaa suoraan yrityksen liiketoimintaprosesseihin taikka visualisoida joko omassa sovelluksessa taikka yrityksen käyttämässä BI- sovelluksessa – modernit BI- välineet eivät hyljeksi esim. R- koodia. Ja nyt sitten tekemään parempia päätöksiä ja liiketoimintaa.
Mitenkä tämmöinen tutkailu sitten kannattaa ostaa? Paloittain ja hallittuina kokonaisuuksina. Jos joku sanoo muuta, tämä joku ei suurella todennäköisyydellä tiedä mistä puhuu.
Analytiikkahankkeille on tyypillistä se, että kun tämän lampun saa syttymään, se palaa kirkkaasti ja pitkään (uusia business case- aihioita tunnistetaan eri puolilla organisaatiota). Kyseessä on oppimismatka ja kun tästä Graalin maljasta pääsee ottamaan hörpyt, niin sitä tekee sitten kyllä mieli lisää.
Minkälaisia mysteerejä Louhia on sitten jo asiakkaidensa kanssa ratkaissut? No onhan noita ja eri toimialoilta.
- Asiakaspoistuman ennustaminen (vakuutus-, -tele ja energiasektori
- Kysynnän ennustaminen (terveydenhuolto, tukkuliikkeet)
- Tuotteiden hintaoptimointi (teollisuus)
- Vikaantuminen ennakointi (elektroniikkateollisuus)
- Maaperän kosteusarvojen estimointi (teollisuus)
- Asiakassegmentointi (vähittäiskauppa, telesektori)
- Tilauskannan realisoitumisen ennustaminen (terveydenhuolto)
- Liikenteen viivästymisalgoritmin kehittäminen (top secret)
- Mainonnan optimointialgoritmi (vähittäis- ja tukkukauppa)
- IoT-ennusteratkaisu raskaan liikenteen lähtöajankohtiin
- Avoimen datan hyödyntäminen
- Tarjousten läpimenon optimointikone (teollisuus)
Lampun sytytyspalveluun voi tutustua tarkemmin osoitteessa http://www.louhia.fi/palvelut/analytiikkamysteerit/.
