Me Bilotilla autamme yrityksiä kehittämään moderneja digitalisaatioratkaisuja ja niihin liittyviä liiketoimintaprosesseja. Eräs keskeinen osa-alue tässä on tekoälyn- ja koneoppimisen hyödyntäminen. Vuosien aikana olemme toteuttaneet kymmeniä AI-projekteja, joiden oppeja on käytetty AI-JACK nimisen koneoppimiskiihdyttimen kehittämiseen.
Mikä on AI-JACK?
Nyt julkaistu AI-JACK (beeta versio) perustuu R-koodiin, joka sisältää kirjastoksi toteutettuja valmismoduuleja. Nämä moduulit toteuttavat eri asioita koneoppimisharjoituksessa, kuten
- yhteydet tietolähteisiin,
- datan käsittely,
- datan jako training/testing/validation osiin,
- useiden koneoppimismallien automatisoitu opetus,
- tulosten vertailu,
- mallinnustulosten ja metatietojen tallennus ja
- tulosten julkaisu
Mallinnusosuus tehdään H2O API:lla.
Tavoitteena luonnollisesti on, että AI-JACK:ia voidaan hyödyntää reaalimaailman liiketoimintaongelmien ratkaisussa, esimerkiksi ennustaen asiakaspoistumaa tai ostopäätöstä.
AI-JACK:in käyttö on sikäli hyvin helppoa, että käyttäjän tarvitsee vain muokata asetustiedostoja. Ei ole siis pakollista osata R-kieltä. Asetustiedostossa käyttäjä kertoo mm. mistä data luetaan, mitä koneoppimismalleja sovelletaan ja millaisia hyperparametrivaihtoehtoja käytetään. Tämän jälkeen käyttäjän ei tarvitse kuin ”laittaa mallinnusvaihe päälle” (tämäkin onnistuu ilman ohjelmointitaitoja) ja odottaa tuloksia.
Kyseessä ei kuitenkaan ole black-box ratkaisu, sillä edistyneemmille käyttäjille AI-JACK tarjoaa täyden mahdollisuuden muokata lähdekoodia ja lisätä esim. omia moduuleja ratkaisun osaksi.
Tuetut koneoppimisalueet ovat tällä hetkellä (24.4.2020):
- luokitteluongelmat
- regressio-ongelmat (poikkileikkaus, ei aikasarja)
- klusterointi
- anomaly detection (osin kehitysvaiheessa)
Mitä hyötyä on AI-JACK:in käytöstä?
Ylivoimaisesti tärkein hyöty on, että merkittävä osa tarvittavasta koodista on jo valmiina ja alustavasti testattu. Tämä nopeuttaa aivan olennaisesti projektin toteutusta ja vähentää kehitystyöhön käytettyä aikaa. Lisäksi käyttäjät voivat kehittää ratkaisuun omia moduuleja, esim. johonkin toimialan tiettyyn ongelmaan liittyen.
AI-JACK on myös helppo implementoida tuotantokäyttöön erilaisiin ympäristöihin, kuten palvelimille, virtuaalikoneille tai pilvialustalle.
AI-JACK:sta on myös Python (+Databricks) versio, jonka todennäköisesti julkaisemme myös avoimena lähdekoodina tulevaisuudessa.
Voit ladata AI-JACK:in täältä ja lukea tarkemmin aiheesta. Jos tulee kysyttävää, niin laita viestiä.
GitHub: AI-JACK-opensource-R
follow AI-JACK on Twitter: @AIJACK_AI
follow AI-JACK onMedium: @ai.jack