Big Datasta viriää nykyään runsaasti keskustelua. Meitä(kin) pyydetään palavereihin kertomaan asiasta näkemyksemme. Muutamat näistä tapaamisista ovat alkaneet suoralla kysymyksellä – mikä Big Data ratkaisu meidän pitäisi hankkia? Tämä siis ilman, että asiaan olisi liitetty taustatietoja, kuten syitä, tarpeita ja tavoitteita ko. ratkaisulle.
Tilanne on vastaava kuin kadulla tulisi vastaan random-tyyppi (kuten nuoriso sen ilmaisee), joka kysyisi että mikä auto hänen pitäisi ostaa? Sopivalla tuurilla suosittelija sanoo, että osta linja-auto.. se on nyt oikea ratkaisu. Jos random-tyypin tarve olisikin ollut pieni perheauto, niin linja-auto olisi problemaattinen ratkaisu (miettikää jos vaimolla onkin vain b-kortti)…
Sama pätee Big Datan kanssa. Jos yrityksen ydinbusiness ei ole rakentaa big datoja tai tietovarastoja, niin silloin perustelujen ko. ratkaisuille on löydyttävä liiketoiminnan kehittämisestä (myydään enemmän, säästetään kuluja, parannetaan mainetta..). Ja jos perustelut ja tavoitteet eivät ole riittävän konkreettisia ja yksityiskohtaisia, niin Big Data saattaa muuttua Big Problem hankkeeksi, joka etenee esim. teknologiaan ja datan keräämiseen keskittyen – ilman selvää suuntaa, että minkä ongelman se ratkaisee tai mitä kautta lisäarvo syntyy.
Big Dataa suunnittelevissa yrityksissä on jo yleensä tietovarasto käytössä. Yritysten olisikin hyvä peilata tietovaraston kehittämisen ja hyödyntämisen historiaa vasten Big Data tavoitteita.
Mikäli tietovarasto on ajautunut vaikeuksiin (esim. jäänyt kesken, tietoon ei luoteta, sitä kehitetä, vastuut epäselvät..), niin se on aika hyvä indikaatio siitä, että Big Datan kanssa ei tule olemaan helppoa. Jos hommaa ei saada toimimaan pienellä osa-alueella, niin miten sitten isommalla ja selvästi monimutkaisemmalla?
Yksi kysymys, joka myös tulee usein esille on – mitä Big Data tarkoittaa? Erittäin hyvä kysymys, johon voi katsoa yhdenlaisen vastauksen Wikipediasta.
Reaalimaailmassa rajanveto datan ja big datan välillä on tapauskohtaista. Lopulta kyse on vain datasta, jota tallennetaan erilaisiin purkkeihin. Yhtä hyvin voisimme puhua myös micro datasta, small datasta, medium datasta tai vaikka megatron datasta. Jaottelu kuitenkin tuntuisi vähän mielipuoliselta. Dataa se kaikki lopulta on.
Muutaman kerran olen kuullut perustelun Big Datalle, että edistynyt analytiikka vaatii sitä. Asiaa voi lähestyä ainakin kahta kautta.
Ensimmäiseksi, tilastotieteen, tiedon louhinnan ja koneoppimisen menetelmät eivät vaadi triljoonia tapahtumia laskeakseen jotain järkevää. Dataa on itse asiassa yleensä summattava, jotta saadaan mielekkäitä analyyseja aikaiseksi. Joskus jo muutamat sadat rivit riittävät esim. ennusteen tekoon. Ei ehkä mediaseksikästä, mutta totta.
Toiseksi, jotkin tietyt ongelmat voivat vaatia Big Data ratkaisua, jotta kaikki olennainen tieto saadaan purkitettua. Silloin kyse ei kuitenkaan ole edistyneen analytiikan vaatimuksesta.
Entä sitten päiväuni, jossa algoritmit louhivat ja möyhivät Big Dataa ilman ihmisen ohjausta ja löytävät sieltä ne kultahiput sekä liiketoiminnan kadoksissa olleet timantit? Uskokaa pois, tämäkin aihe on muutaman kerran käsitelty, kun joku myyntijeppe on käynyt asian noin esittämässä. Asiakkaalle oli syystäkin jäänyt vähän epäilevä olotila..
En toki väitä etteikö noin voisi teknisesti tehdä. Algoritmit lähes varmasti löytävät isoista tietomassoista kaikenlaisia yhteyksiä, kuten Nicholas Cagen elokuvissa esiintymisen ja hukkumiskuolemisien välisen korrelaation. Ennen superkeinoälyn syntyä joudumme vielä itsekin käyttämään päätämme.
Big Data teknologiat ja yhä lisääntyvä tallennetun tiedon määrä nostavat olennaisesti mahdollisuuksia hyödyntää dataa. Tuon mahdollisuuden lunastamiseksi yrityksissä vaaditaan tietoisia päätöksiä ja valintoja asiaan liittyen.
Näin konsultin näkökulmasta on hämmentävää, että monet yritykset tuntuvat tekevän näitä päätöksiä vain sisäisten tarpeiden mukaisesti, huomioimatta täysin mitä pahimmat kilpailjat tekevät.
Jos pahin kilpailija on ottanut jo muutaman vuoden etumatkan eikä ole sössinyt hommia, niin siinäpä onkin miettimistä, kun kilpailijan investoinnit alkavat näkyä parempana palveluna, alentuneina hintoina tai ylivoimaisena tarjonnan kohdentamisena.
Big Dataa asiana ei siis kannata sivuuttaa pelkällä olan kohautuksella. Mutta varautukaa siihen, että uusi muotitermi saattaa olla jo keksitty ja tulossa..