Kuva, jossa verrataan Microsoft Fabricia ja Databrickiä palvelinhuoneessa. Microsoft Fabric keskittyy liiketoimintatietoihin ja käyttäjäkokemukseen, Databricks keskittyy kehittyneeseen analytiikkaan ja tietotekniikkaan. Kasvupolku yhdistää molemmat.

Savonia-artikkeli: Datan hallinnasta kilpailuetua: Kohti tekoälyvalmiutta ja ennakoivaa analytiikkaa

This work is licensed under CC BY-SA 4.0Creative Commons logoCreative Commons Attribution logoCreative Commons Share Alike logo

1. Johdanto

Organisaation data-analytiikan kypsyys korreloi vahvasti sen innovaatiopotentiaalin, kilpailukyvyn ja uudistumiskyvyn kanssa (Davenport & Harris 2017). Tietojohtamisen ja datan analysoinnin merkitys korostuu erityisesti päätöksenteossa, sillä tiedon analysointi ja sen hyödyntäminen vaikuttavat yhä kriittisemmin organisaatioiden menestymiseen. Tiedolla johtamisen avulla organisaatiot voivat paitsi optimoida toimintojaan, myös tunnistaa trendejä, ennustaa asiakasvaatimuksia ja tehdä muita strategisia päätöksiä, mikä on elintärkeää nopeasti muuttuvassa toimintaympäristössä.

Teollisuuden lisäarvo syntyy yhä enenevissä määrin tietoresursseista ja tiedon arvosta, mikä korostaa aineettoman pääoman merkitystä perinteisten tuotannontekijöiden rinnalla (Grant & Baden-Fuller 2004). Organisaation innovaatiokyvykkyys riippuu nykyisin suuresti sen kyvystä hyödyntää olemassa olevaa tietoa ja luoda uutta tietoa digitaalisten teknologioiden avulla (Vial 2019). Tässä prosessissa korostuvat oppiminen ja tiedon jakaminen, jotka ovat keskeisiä tekijöitä innovaatioiden syntymisessä ja kehittämisessä (Lawson & Samson 2001; Nonaka & Takeuchi 1995). Tämä prosessi luo perustan työntekijälähtöiselle innovoinnille, jossa teknologia ja data-alustat eivät ainoastaan tehosta toimintaa, vaan toimivat mahdollistajina henkilöstön kyvylle luoda uusia innovaatioita ja uudistaa yrityksen kilpailukykyä. Tätä aihepiiriä tutkin tarkemmin viime vuonna valmistuneessa pro gradu -tutkielmassani (Juntunen 2024).

Käytännön haasteena on kuitenkin usein se, että organisaatiot eivät tunnista jo kerätyn informaation potentiaalista arvoa tai arvokkaan datan määrää omissa järjestelmissään. Tämän niin kutsutun ”pimeän datan” (dark data) jalostaminen tiedoksi (knowledge) voi auttaa organisaatiota saavuttamaan liiketoiminnassaan merkittävää kilpailuetua (Gartner 2019). Nopeasti muuttuvassa maailmassa ja kovassa kilpailussa innovaatioista on tullut ratkaiseva tekijä yrityksen selviytymisen ja kasvun moottorina (Høyrup ym. 2012).

TechSavo-hankkeen tavoitteena on vastata tähän haasteeseen vahvistamalla Pohjois-Savon ja Pieksämäen alueen pk-yritysten valmiuksia siirtyä pelkästä datan keräämisestä sen tehokkaaseen jalostamiseen. Seuraavaksi tarkastelemme, kuinka modernit Data Lakehouse -teknologiat, kuten Microsoft Fabric ja Databricks, toimivat työkaluina tämän tietojohtamisen vision toteuttamisessa.

2. Analytiikan kypsyysmalli kehittämisen välineenä

Teknologian valinta on suhteutettava yrityksen analytiikan kypsyysvaiheeseen. Esimerkiksi voidaan soveltaa neliportaista mallia (mukaillen Davenport & Harris 2017; Gartner 2020):

Suomenkielinen taulukko, jossa hahmotellaan viisi analyysityyppiä: kuvaileva, diagnostinen, ennakoiva, määrittelevä ja kognitiivinen analyysi sekä niiden tavoitteet, käsiteltävät kysymykset ja niihin liittyvät menetelmät ja teknologiat.
Taulukko 1. Nelivaiheinen analytiikan kypsyysmalli.

Alueen teknologiateollisuuden PK-yritykset sijoittuvat tyypillisesti vaiheisiin I–II. Raportointi ei useinkaan ole automaattista, ja yritysten raportointi nojaa edelleen vahvasti manuaaliseen työhön. Keskeisimpänä teknisenä esteenä ovat vanhentuneet ERP-järjestelmät, jotka rajoittavat datan saatavuutta ja estävät sen tehokkaan jalostamisen. Jotta datasta voitaisiin luoda aitoa kilpailuetua, se on pystyttävä muuttamaan informaatiosta tietoyhteiskunnan vaatimaksi aineettomaksi pääomaksi (Grant & Baden-Fuller 2004).

Siirtyminen ennakoivaan analytiikkaan ja tekoälyn hyödyntämiseen (vaiheet III–V) on nykyisillä rakenteilla haastavaa, sillä perinteiset järjestelmät eivät kykene käsittelemään suuria, reaaliaikaisia datavirtoja tai tarjoamaan riittävää tukea kehittyneelle koneoppimiselle. Tämä vaatii siirtymistä moderneihin data-alustoihin, jotka mahdollistavat tiedon joustavan jakamisen ja uuden tiedon luomisen organisaatiossa. Modernit data-alustat muodostavat yrityksen digitaalisen kivijalan ja välttämättömän pohjan tekoälyn operatiiviselle hyödyntämiselle. Niihin panostaminen on kriittistä juuri nyt: alusta toimii mahdollistajana, jonka avulla yritykset voivat integroida ja hyödyntää nopeasti kehittyviä tekoälysovelluksia liiketoiminnassaan. Investointi nykyaikaiseen arkkitehtuuriin ei siten ole vain tekninen päivitys, vaan strateginen valinta, jolla varmistetaan yrityksen uudistumiskyky ja kilpailuetu tulevaisuuden markkinoilla.

3. Data Lakehouse -arkkitehtuurien teknologinen vertailu

Vertailu perustuu kustannusmalliin, osaamisvaatimuksiin ja skaalautuvuuteen.

3.1 Microsoft Fabric: Integroitu SaaS-ratkaisu

Arkkitehtuuri: Koko Azure-dataekosysteemi yhden käyttöliittymän kautta. Keskitetty OneLake-tallennus.

Vahvuudet: Erittäin matala käyttöönoton kynnys, saumaton Power BI -integraatio (Direct Lake), nopea raportoinnin automaatio.

Heikkoudet: Joustavuus on rajallisempi erittäin suurten tai korkeataajuisten datavirtojen kustomoidussa käsittelyssä.

Kypsyysvaihe: Optimaalinen vaiheisiin I–II.

Kaavio Microsoft Fabric -arkkitehtuurista, jossa näkyvät tietolähteet, laskentamoottorit ja palvelut. Tiedot kulkevat lähteistä, kuten Azuresta ja Amazonista, Sparkin ja T-SQL:n kaltaisten moottoreiden kautta erilaisiin analyysi- ja liiketoimintasovelluksiin OneLaken kautta.
Kuva 1. Microsoft Fabric (learn Microsoft)

3.2 Databricks: Avoin ja skaalautuva Lakehouse

Arkkitehtuuri: Spark-pohjainen, pilviriippumaton (multi-cloud). Keskiössä Delta Lake ja MLflow.

Vahvuudet: Tehokas IIoT-streaming, tuotantovalmis koneoppiminen (ML/AI), massiivinen laskentateho.

Heikkoudet: Korkeampi tekninen osaamistarve, laskentaperusteinen hinnoittelu vaatii optimointia.

Kypsyysvaihe: Optimaalinen vaiheisiin III–IV.

Yhteenveto: Fabric soveltuu nopeaan BI-kehitykseen ja datan yhtenäistämiseen. Databricks on valinta ennakoivaan analytiikkaan ja raskaaseen laskentaan.

Kaavio, jossa Databricks-alustan ominaisuudet on luokiteltu käyttäjäroolien mukaan: Data Engineer, ML Engineer, Data Scientist, Business Analyst, App Developer ja Business Partner, sekä työkalut ja integraatiot dataa, ML:ää, analytiikkaa ja yhteistyötä varten.
Kuva 2. Databricks

4. Toimialakohtainen soveltuvuus

4.1 Puu- ja rakennustuoteteollisuus

Toimialalla korostuvat materiaalivirtojen optimointi (saanto), laadunvalvonta sekä prosessien läpinäkyvyys. Keskeinen data on tyypillisesti peräisin ERP- ja MES-järjestelmistä.

Microsoft Fabric. Alusta mahdollistaa reaaliaikaisen raportoinnin ja datan yhdistämisen ilman raskaita koodausprojekteja. Se soveltuu erinomaisesti yrityksille, jotka haluavat rakentaa selkeän tilannekuvan tuotannosta nopeasti.

Esimerkiksi: Tuotantolinjan saanto (yield) visualisoidaan automaattisesti yhdistämällä MES-data Microsoft Fabricin OneLakeen. Tämä lyhentää analyysiviiveen päivistä tunteihin, mahdollistaen välittömät korjaavat toimenpiteet.

4.2 Teknologiateollisuus

Teknologiateollisuudessa hyödynnetään korkeataajuisia sensoreita ja konenäköä. Käsiteltävät datamäärät ovat valtavia, ja tavoitteena on usein vikaantumisten ennustaminen ja toimintavarmuuden parantaminen.

Databricks (tai hybridimalli). Databricks Intelligence Platform for Manufacturing hallitsee tehokkaasti tärinä-, lämpö- ja kuvadatan analyysin. Se tarjoaa skaalautuvan ympäristön kehittyneelle koneoppimiselle ja uusien dataperusteisten palvelutuotteiden luomiselle.

Esimerkiksi: Koneen laakerivian ennustemalli, joka varoittaa huoltoa kaksi tuntia ennen vikaantumista. Lakehouse IoT Platform for Predictive Maintenance -arkkitehtuuria ja MLflow-putkea, mikä minimoi kalliit suunnittelemattomat tuotantokatkokset.

Tietojen työnkulun kojelauta näyttää toisiinsa kytketyt datataulukot ennakoivaa ylläpitoa varten, sensor_hourly-mittareiden yhteenvedon, vihreän odotusten edistymisympyrän ja kyselyhistorian, jonka alaosassa on yksityiskohtaiset lokit.
Kuva 3. Demo maintenance harjoituksesta

5. Esimerkkipilotti

Yrityksen kannattaa suhteuttaa eteneminen nykyiseen analytiikkakypsyyteensä ja resursseihinsa. Seuraavat kaksi polkua tarjoavat konkreettiset esimerkkimallit kehitystyön aloittamiseen.

5.1 Strategia I: Nopea arvonluonti (Microsoft Fabric -painotus)

Tämä polku on suunnattu yrityksille, jotka ovat kypsyysvaiheessa I–II. Painopiste on manuaalisen työn automatisoinnissa ja välittömässä tilannekuvassa.

Tavoite: Automatisoida kriittinen raportointi 4–6 viikossa.

Toteutus:

1. KPI-pilotti: Valitaan yksi kriittinen mittari (esim. tuotannon saanto).

2. Keskittäminen: Tuodaan data OneLakeen hyödyntämällä Data Factory -liittimiä.

3. Visualisointi: Luodaan automaattisesti päivittyvät Power BI -raportit päätöksenteon tueksi.

5.2 Strategia II: Innovaatioiden kehittäminen (Databricks-painotus)

Tämä polku on suunnattu kypsyysvaiheen III–IV yrityksille, joilla on tunnistettuja tarpeita teolliselle internetille (IIoT) tai koneoppimiselle.

Tavoite: Rakentaa ennakoiva päätöksentekoputki ja AI-valmius.

Toteutus:

1. Osaaminen: Varmistetaan syväosaaminen (Spark/ML) kumppaniverkoston avulla.

2. Streaming: Rakennetaan reaaliaikainen tietovirta sensoridatalle.

3. ML-malli: Kehitetään ja tuotannollistetaan koneoppimismalli (esim. ennakoiva huolto) MLflow-työkaluilla.

6. Teknologiavertailu ja päätöksenteko

Suomenkielinen vertailutaulukko neljällä kriteerillä - Ydinlupaus, Liiketoimintahyöty, IIoT & Reaaliaika ja Tekoäly (AI/ML) - Microsoft Fabricin ja Databricksin vertailu ominaisuuksien ja strategisten syiden perusteella.
Taulukko 2. Strateginen vertailu: Fabric vs. Databricks
Jaetussa grafiikassa vertaillaan Microsoft Fabricia ja Databrickiä ja korostetaan niiden painopistettä, parhaita käyttäjiä ja kasvupolkua. Microsoft Fabric korostaa BI:tä ja helppoa raportointia; Databricks korostaa analytiikkaa, ML:ää ja skaalautuvuutta datakeskustaustalla.
Kuva 4. Fabric vs Databrics. Luotu geminillä.

Kypsyysarvioinnin tarkistuslista

• [ ] Onko nykyinen raportointi manuaalista? (-> Fabric)

• [ ] Ovatko datalähteet siiloutuneita? (-> Fabric/Databricks)

• [ ] Onko tavoitteena ennakoiva analytiikka 12 kk sisällä? (-> Databricks)

• [ ] Onko IIoT-data kriittistä toiminnalle? (-> Databricks)

8. Johtopäätökset

Analytiikan kypsyysmalli ja teknologinen vertailu luovat pohjan PK-yritysten tuottavuuden kasvulle. Keskeiset havainnot ovat:

1. Microsoft Fabric on paras valinta yrityksille, jotka haluavat nopeasti automatisoida raportointinsa ja siirtyä tiedolla johtamisen aikaan.

2. Databricks on optimaalinen edistyneille yrityksille, jotka rakentavat kilpailuetua tekoälystä ja massiivisesta datasta.

3. Hybridimalli on usein pitkän aikavälin tavoitetila: raskas laskenta Databricksissä, raportointi Fabricissa.

TechSavo-hanke tukee alueen pk-yrityksiä tiedolla johtamisen ja teknologian kehittämisessä. Aktivoimme ja autamme valmistelemaan yritysten omia investointi-, innovointi- ja tuotantoprosessien kehittämishankkeita, jotta uudet teknologiat saadaan tehokkaasti käyttöön. Samalla syvennämme yritysten osaamista analytiikkatyökalujen käytössä ja osoitamme niiden tarjoaman hyödyntämispotentiaalin liiketoiminnan kasvun tukena.


Kirjoittaja: Henri Juntunen, TKI-asiantuntija, Savonia-ammattikorkeakoulu, TechSavo-hanke


Lähteet:

Armbrust, M. et al. (2021) The Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics. Databricks Inc.

Crickard, R. (2023) Choosing Your Cloud Analytics Platform: Databricks vs. Microsoft Fabric.

Davenport, T. H. & Harris, J. G. (2007) Competing on Analytics. Harvard Business School Press.

Davenport, T. H., Barth, P. & Bean, R. (2010) ’How to become an analytical competitor’, Sloan Management Review.

Grant, R.M. & Baden-Fuller, C. (2004) ’A knowledge accessing theory of strategic alliances’, Journal of Management Studies, 41(1), s. 61–84.

Juntunen, Henri (2024). Työntekijälähtöinen innovaatiotoiminta tietojohtamisen näkökulmasta teknologiateollisuusorganisaatiossa. Pro gradu -tutkielma. Itä-Suomen yliopisto. Linkki tutkielmaan

Hlupic, V., Pouloudi, A. & Rzevski, G. (2002) ’Towards an integrated approach to knowledge management: ‘Hard’, ‘soft’ and ‘abstract’ issues’, Knowledge and Process Management, 9(2), s. 90–102.

Høyrup, S., Møller, K., Bonnafous-Boucher, M., Hasse, C. & Lotz, M. (2012) Employee-Driven Innovation: A New Approach. Houndmills: Palgrave Macmillan.

Inmon, W. H. (2002) Building the Data Warehouse. John Wiley & Sons.

Kizilaslan, V., Özdal, O. & Turkay, M. (2020) ’A machine learning approach for predictive maintenance on manufacturing data’, Journal of Manufacturing Systems.

Lawson, B. & Samson, D. (2001) ’Developing innovation capability in organisations: A dynamic capabilities approach’, International Journal of Innovation Management, 5(3), s. 377–400.

Microsoft (2023) Introducing Microsoft Fabric.

Davenport, T.H. & Harris, J.G. (2007) Competing on Analytics: The New Science of Winning. Boston: Harvard Business School Press.

Nonaka, I. & Takeuchi, H. (1995) The Knowledge-Creating Company: How Japanese Companies Create the Dynamics of Innovation. Oxford University Press.

Kuva 1: The scope of the lakehouse platform. Databricks on Google Cloud. Saatavilla: https://docs.gcp.databricks.com/lakehouse-architecture/index.html

Kuva 2: What is Microsoft Fabric. Microsoft Learn. Saatavilla: https://learn.microsoft.com/en-us/fabric/fundamentals/

Kuva 3 Demo maintenance harjoituksesta: Databricks Intelligence Platform for IoT: Predictive Maintenance and GenAI Agents | Databricks


Kolme logoa: EU:n lippu, jossa on suomenkielinen teksti, Pohjois-Savon maakunnan vaakuna ja teksti sekä TechSavon logo, jossa on lisäksi suomenkielistä tekstiä sinisellä ja valkoisella.