Pari vuotta sitten saimme tarjouspyynnön energia-alan tietovarastohankkeen toteutuksesta.
Projektista oli tehty oikeaoppisesti esimäärittely, mutta sen oli tehnyt yritys, joka ei ollut koskaan tietovarastoa nähnytkään. Asiakkaalle oli iskostettu päähän ajatus, että tietovarasto on kaupan hyllyltä ostettava tuote, joka otetaan käyttöön plug ‘n’ play –tyylisesti päivässä. Tietovaraston määrittely, suunnittelu, toteutus ja testaus oli tarkoitus toteuttaa alle kuukaudessa.
Olin sattumoisin ollut vastaavan toimialan lähes identtisessä hankkeessa mukana vastikään. Tuon tietovarastoprojektin budjetti oli 400 000 euroa ja suunniteltu aikataulu n. ½ vuotta. Projekti saatiin valmiiksi lähes kahden vuoden jälkeen kun rahaa oli palanut konsultointityöhön yli miljoona ja lisensseihin jotain 500 000€ ja miljoonan väliltä. Jossain välissä ostettiin Netezza.
On sanomattakin selvää, että tarjouspyynnön lähettäneellä yrityksellä oli virheellinen käsitys siitä mitä tietovarastohanke kustantaa ja kauanko se kestää. Tässä tapauksessa jouduimme kieltäytymään projektista, mutta lähetimme yritykselle oppaan ”Mitä tietovarasto maksaa, kauanko se kestää ja mistä vaiheista se koostuu”. Käyn tässä ja seuraavassa osassa läpi olennaisimmat pointit.
Mistä tietovaraston kokonaiskustannukset koostuvat?
Tietovarasto ei ole yksittäinen ohjelmisto tai tietokanta. Se on joukko prosesseja (esim. tiedon lataus ja muokkaus, historiointi), valtava määrä tietoa ja laskentasääntöjä, sovelluksia, rautaa, palvelimia ja ihmisiä joilla on erilaisia rooleja. Itse puhunkin usein tietovarastoympäristöstä.
Mutta mistä tietovarastoympäristön kustannukset muodostuvat? Tässä olennaisimmat kuluja aiheuttavat tekijät. Osa näistä on valinnaisia kuten analytiikkasofta.
- Lisenssit:
- palvelin (esim. Windows server) ja sille riittävästi rautaa (muistia ja levytilaa)
- tietokanta (esim. SQL Server, DB2, Oracle)
- ETL-softa (esim. SQL Server, Informatica, IBM Data Stage, Pentaho)
- raportointisofta (esim. SQL Server, IBM Cognos, Qlikview, SAP BO, Webfocus, Tableau)
- analytiikkasofta (esim. RapidMiner, SPSS, SAS, R, Azure ML, SQL Server, Knime)
- Rakennustyö
- konsultointityö
- yrityksen oma työ
- Ylläpito ja käyttökustannukset
- softaylläpito
- konsultointityö
- yrityksen oma työ
- koulutuskustannukset
- Bonus: Käyttökustannukset menetetystä työajasta
Sudenkuopat arvioitaessa DW/BI-hankkeen kustannuksia
Ylläpito:
Usein kokonaiskustannuksia laskettaessa jätetään ylläpitotyö kokonaan pois. Tämä voi olla iso menoerä, varsinkin alkuvaiheessa projektia. Parhaimmassa projektissa tekemämme tietovarasto ja raportit toimivat mallikkaasti vuoden ennen kuin asiakas ensimmäisen kerran ilmoitti ajojen kaatuneen. Toisessa casessa ylläpitoon meni tasaisesti 10 htpv/kk ensimmäisen puolen vuoden ajan. Tämä tarkoittaa n. 10 000€/kk budjetoimatonta kulua.
Ja toki ei saa unohtaa softalisenssien ylläpitoa. Tuotteesta riippuen tämä on 20% hankintahinnasta, joissain tuotteissa enemmänkin. Jos lasket 3 vuoden kokonaiskustannuksia niin 100 000€ lisenssihankinnasta tulee siis yhteensä 160 000€ kustannukset (kyllä, ensimmäisestäkin vuodesta menee joillakin toimittajilla ylläpitomaksu).
Koulutus:
Koulutuskustannukset unohtuvat helposti kustannuslaskelmista. Tämä koskee etenkin raportointivälineitä, koska toimittajat hoitavat usein ETL-toteutuksen ja ylläpidon.
Osa softista on helpommin omaksuttavissa, ja osassa oppimiskäyrä on jyrkempi. Oma kokemus koulutustarpeesta helpoimmasta vaikeampaan itselle tutuista tuotteista on jotakuinkin:
Tableau
QlikView
Microsoft
Cognos
Oracle
Yleensä softafirmat tarjoavat pääkäyttäjille sellaisia 3-5 päivän paketteja. Peruskäyttäjille riittää alkuun pääsemiseen usein 2x muutaman tunnin luokkahuonekoulutus pääkäyttäjien tai ulkopuolisen toimittajan toimesta.
Koulutuskustannuksia arvioitaessa kannattaa huomioida, että esimerkiksi Microsoft Reporting Servicen tai Cognoksen Report Studion todellinen hallinta vie kuukausia päivittäistä työtä. Sillä 3-5 päivän IBM:n tarjoamalla koulutuksella ei pääse edes alkuun. Olemme nähneet tämän usealla asiakkaalla. Todellinen tuotteen hallinta vaatii kuukausien ajan viikoittaista, jollei päivittäistä tekemistä. Microsoftin osalta voidaan valita raportointityövälineeksi pelkkä Excel, tällöin oppimiskäyrä on huomattavan paljon loivempi.
QlikView:n osalta olen taas nähnyt kun pätevät käyttäjät ottavat sen haltuun itsenäisesti parissa päivässä, ilman mitään koulutuksia. Isoissa käyttäjämäärissä tässä tulee iso ero kustannuksissa.
Asiakasyrityksen oma työ
Valitettavan usein asiakkaan oma panos jätetään pois kustannusarvioista, tämä aiheuttaa kuitenkin usein erittäin mittavan kustannuserän.
Asiakkaan omaa panosta tarvitaan etenkin määrittely- ja testausvaiheissa. Myös käyttöönotto ja koulutukset luonnollisesti vievät asiakkaan aikaa ja usein asiakkaalta tarvitaan oma projektipäällikkö hankkeeseen. Jos toimittajalta menee projektiin 100 htpv niin voit varata sisäistä työtä vähintäänkin saman verran.
Tietovarastohankkeiden ääripäät
Olemme olleet tekemässä miljoonaluokan tietovarastoja, mutta toisinaan DW on toteutettu parissakymmenessä päivässä. Keskiarvo on tällöin huono mittari, koska hajontaa työmäärissä on paljon.
Mutta jos otamme ääripäät pois ja tarkastelemme 90% kaikista toteutetuista DW-projekteista, liikkuvat työmäärät jossain 50 ja 150 henkilötyöpäivän välillä.
Ja tässä otoksena on lähes 100 tietovarastohanketta yli 10 vuoden ajalta ja lähes 10:ltä eri toimialalta, aina terveydenhuollosta vähittäiskauppaan ja tukkukaupasta valmistavaan teollisuuteen.
Päivähintana kustannuksia arvioitaessa kannattaa käyttää tuhatta euroa, se on tasoltaan laadukkaan konsultin hintataso.
Mitä esimerkkiprojekti voisi siis kustantaa?
Oletetaan, että yrityksen pitää hankkia raportointisofta 50 käyttäjälle. He lähtevät liikkeelle SQL Server -tietokannalla ja ETL-työvälineellä (SSIS). Standardiversio riittää hyvin. Raportointiin he valitsevat QlikView:n. Analytiikkasoftaa he eivät hanki, koska maturiteetti ei ole vielä ihan sillä tasolla ja analytiikka saa palvelunakin. Fiksu yritys ei mene työväline edellä.
Kyseessä on perinteinen valmistavan teollisuuden yritys ja datamäärät on maltillisia, joitakin miljoonia rivejä maksimissaan, tyypiltään myyntejä, tilauksia, ostoja/tuotantoa, varastoa jne. ERP:jä on pari ja dataa pitää tuoda myös CRM:stä sekä taloushallinnon järjestelmästä. Dimensioita pitää siis harmonisoida ja laskentasääntöjä yhdenmukaistaa. Perussettiä siis. Lasketaan esimerkkikustannukset:
- Lisenssit
- 2 * palvelin Windows server, esim. 4000€
- 1 * tietokanta SQL Server 2014, esim. 4000€
- 1 * ETL-softa SQL Server 2014: 0€ (sisältyy tietokantalisenssiin)
- 50 * Qlikview raportointisofta nimetyille käyttäjille + Qlikin palvelinlisenssit: n. 90 000€
- Rauta
- QlikView vaatii paljon RAM-muistia. Esim. 256Gb, palvelimen hintaluokka levyineen voi olla esim. 30 000€.
- Kantapalvelin voi olla paljon kevyempi, esim. 8 000€
- Rakennustyö
- konsultointityö: 100 000€ (100 htpv)
- yrityksen oma työ (400e/pv): 40 000€ (100 htpv)
- Ylläpito ja käyttökustannukset
- softaylläpito 20%: 20 000€/vuosi
- konsultointityö: 3000€/kk = 36 000€/vuosi
- yrityksen oma työ: 1000€/kk = 12 000€/vuosi
- koulutuskustannukset: 5 pääkäyttäjää * 3pv kurssi: 15 000€
YHTEENSÄ: 359 000€
Tämä on siis ensimmäisen vuoden kustannus. Jos lasketaan 3 vuoden kokonaiskustannus niin tähän lisätään kahdelta vuodelta raportointisoftan ylläpitomaksu (2 * 20 000€) sekä koko ympäristön ylläpito (2* 36 000€ + 12 000€). Tällöin 3 vuoden kokonaiskustannus on: 359 000€ + 88 000€ = 447 000€.
Tässä laskelmassa ei ole mukana jatkokehitystä, raporttien toteutusta matkan varrella, uusintakoulutuksia jne.
Jos hinta alkaa huimaamaan, voidaan raportointityöväline vaihtaa vaikka Microsoftiin. Silloin investointikustannus putoaa lisenssien osalta 90 000 €. Lisäksi toinen palvelin voi olla paljon kevyempi, kantapalvelin hieman raskaampi, kokonaishinta voisi olla tällöin luokkaa 447 000€ – 90 000€ – 10 000€ = 347 000€.
Investoinnin pitää maksaa itsensä takaisin
Nyt kun katsot hintaa niin mietit ehkä, kylläpä se maksaa. Tulee mieleen: voiko tästä säästää? Voinko oikoa polkuja? Rakentaisinko omakotitalon mutta jättäisin perustukset rakentamatta? Suosittelen kokeilemaan. Se pitää meidät konsultit leivässä ja kustantaa lopulta kolminkertaisesti. Suomi kiittää yritystäsi.
Kaikkein oleellisin kysymys on: Mitä teen tällä kaikella? Miten investointi maksaa itsensä takaisin? Saadaanko tämän avulla vähintään 447 000€ lisää katetta tai kustannuksia alas seuraavan 3 vuoden aikana?
Toinen kysymys itselle: onko vaihtoehtona jäädä paikalleen? Ei tehdä mitään?
Syvennytään myöhemmin siihen, miten “esimerkki”-teollisuusyrityksemme sai tietovaraston maksamaan itsensä takaisin niin, että sukan varteen jäi jotain kivaa omistajillekin.
Se mitä yrityksesi hanke tulee maksamaan, riippuu monista asioista ja etenkin siihen käytettävästä rakennustyöstä. Vasta tarkemman määrittelyvaiheen jälkeen voidaan antaa tarkka arvio mitä rakentaminen tulee maksamaan.
Tietovarasto- ja raportointihankkeen kustannuksia voidaan kuitenkin haarukoida etukäteen eri menetelmin. Seuraavassa osassa käynkin näitä keinoja läpi.
Pysy siis kuulolla niin tiedät miten laittaa luun kurkkuun toimittajalle, joka tarjoaa övereitä työmääräarvioita.