12.01.2016

Miten tehdä ennakoivaa analytiikkaa Azure Machine Learning:llä

Aloitamme lyhyen blogisarjan miten tehdä analytiikkaa Azure Machine Learning:llä.

Sarja käydään läpi tehokkaasti vajaassa 3 viikossa, sisältäen 3-4 juttua. Sarja päättyy Talentum Eventsillä pitämääni asiakasanalytiikka koulutukseen, jossa koko prosessi käydään läpi.

Ei teorioita, ei jaaritteluja, pelkkää asiaa

Suun louskuttajia aina löytyy hype-termien tiimoilta ja olemme mekin varmasti syyllistyneet kliseiden toistamiseen.

Dilbert

Nyt onkin aika näyttää miten analytiikkaa todella tehdään. Käytännössä ja konkreettisesti. Alusta loppuun. Ja mitä se maksaa. Ei teorioita. Ei höpöhöpöä ja liirulaarumeita.

Toteutamme sarjassa koko prosessin liiketoimintaongelman määrittämisestä, teknisen ympäristön pystyttämiseen, datan muokkaamiseen, mallintamiseen ja tulosten visualisointiin sekä tuotantokäyttöön.

Käytämme juuri niitä samoja työvälineitä ja menetelmiä mitä käytämme todellisissakin projekteissa. Seuraamalla blogisarjaa, näet siis miten käytännössä analytiikka tehdään Microsoft Azure -ympäristössä ja voit toistaa sen omassa yrityksessäsi ja säästää konsultointikustannuksissa.

Noudatamme hieman modifioitua CRISP-DM metodologiaa. Sisältäen seuraavat vaiheet:

Vaiheet:

  1. Määrittele liiketoimintaongelma
  2. Kerää data
  3. Muokkaa, käsittele ja rikasta tietoa (ns. etl-prosessi) ja tallenna se tietokantaan
  4. Analytiikka eli erilaisten ennustemallien toteutus Azure ML:ssä
  5. Tulosten visualisointi (MS Power BI)
  6. Ennustemallien tuotantokäyttö eli kohta jossa naureskellaan matkalla pankkiin

Pelkkää pilveä: All-in-Azure

Rakennamme koko touhun ETL-prosessista (datan lataus, muokkaus ja käsittely), tietokantaan ja analytiikkamallinnukseen Azureen. Eli pilveen. Yhtään kilkettä ei asenneta omalle palvelimelle.

Otamme käyttöön Azure virtuaalikoneen jota käytämme lähinnä ETL-työhön (MS SSIS). Toinen vaihtoehto olisi hyödyntää Data Factoryä, Microsoftin pilvipohjaista integraatiotyövälinettä. Tämä ei ole kuitenkaan vielä läheskään valmis suorittamaan vähänkään vaativimpia datan muokkaus toimenpiteitä eli ns. etl-työtä. Tai se vaatii koodaamista. Näin on fiksummat opastaneet.

Otamme käyttöön Azure SQL -tietokannan, jonne datat tuupataan. Tällä yhdistelmällä voisimme rakentaa myös varsinaisen tietovaraston, aivan kuten rakentaisimme sen yrityksen omille palvelimille on-premise. Looginen arkkitehtuuri on aivan sama.

Lisäksi käytämme Azure Machine learning studiota analytiikkamallintamiseen eli mallinnamme dataa tarpeesta riippuen eri algoritmeilla. Teemme ainakin:

Vaikkakin teemme nyt kaiken Azuressa, voisimme yhtä hyvin käyttää Amazonia tai analytiikkamallinnuksessa RapidMinerin pilveä. Käytämme nyt Azurea ja Microsoftin työvälineitä koska se on yksinkertaisesti tutuin vaihtoehto ja paljon kattavampi/monikäyttöisempi (virtuaalikoneet, blob-storage, SSIS, Power BI, ML) kuin esim. pelkkä RapidMiner.

Ja vaikka keskitymme nyt asiakasanalytiikkaan, voi samaa arkkitehtuuria ja algoritmeja hyödyntää toimialasta riippumatta ja vaikka tuoteanalytiikassa (esim. vikaantumisen ennakointi, tuotemenekkien ennustaminen).

Laitamme kaiken Lassen, maailman vahvimman analyytikon, luottokortille. Blogisarjan päätteeksi katsomme mikä on Lassen kortin saldo ja meneekö ensi kuukausi ylitöiksi. Toisin sanoen näytämme mitä tämä oikeasti maksaa ja voit arvioida mitä se maksaisi sinulle.

Jos sinua kiinnostaa tietää aihepiiristä lisää tai haluat, että näytämme/selvitämme jotain erityistä osa-aluetta tarkemmin, ole rohkeasti yhteydessä.

Voit nakata meille viestiä:

Aikaa on vähän joten Lasse, paras ryhtyä hommiin.


 

Jos haluat vähän makustella mitä asiakasanalytiikka tai asiakastiedon rikastaminen on, kannattaa tutustua seuraaviin juttuihin:

http://www.louhia.fi/tag/asiakasanalytiikka/

Share
Contact Person

Blog writer

Ville Niemijärvi

Vincit Bilot

Bilot & Vincit have joined forces!

See where the story continues 

You have Successfully Subscribed!

Vincit Bilot

Bilot & Vincit have joined forces!

See where the story continues 

You have Successfully Subscribed!