
Savonia-artikkeli: Datan hallinnasta kilpailuetua: Kohti tekoälyvalmiutta ja ennakoivaa analytiikkaa
This work is licensed under CC BY-SA 4.0
1. Johdanto
Organisaation data-analytiikan kypsyys korreloi vahvasti sen innovaatiopotentiaalin, kilpailukyvyn ja uudistumiskyvyn kanssa (Davenport & Harris 2017). Tietojohtamisen ja datan analysoinnin merkitys korostuu erityisesti päätöksenteossa, sillä tiedon analysointi ja sen hyödyntäminen vaikuttavat yhä kriittisemmin organisaatioiden menestymiseen. Tiedolla johtamisen avulla organisaatiot voivat paitsi optimoida toimintojaan, myös tunnistaa trendejä, ennustaa asiakasvaatimuksia ja tehdä muita strategisia päätöksiä, mikä on elintärkeää nopeasti muuttuvassa toimintaympäristössä.
Teollisuuden lisäarvo syntyy yhä enenevissä määrin tietoresursseista ja tiedon arvosta, mikä korostaa aineettoman pääoman merkitystä perinteisten tuotannontekijöiden rinnalla (Grant & Baden-Fuller 2004). Organisaation innovaatiokyvykkyys riippuu nykyisin suuresti sen kyvystä hyödyntää olemassa olevaa tietoa ja luoda uutta tietoa digitaalisten teknologioiden avulla (Vial 2019). Tässä prosessissa korostuvat oppiminen ja tiedon jakaminen, jotka ovat keskeisiä tekijöitä innovaatioiden syntymisessä ja kehittämisessä (Lawson & Samson 2001; Nonaka & Takeuchi 1995). Tämä prosessi luo perustan työntekijälähtöiselle innovoinnille, jossa teknologia ja data-alustat eivät ainoastaan tehosta toimintaa, vaan toimivat mahdollistajina henkilöstön kyvylle luoda uusia innovaatioita ja uudistaa yrityksen kilpailukykyä. Tätä aihepiiriä tutkin tarkemmin viime vuonna valmistuneessa pro gradu -tutkielmassani (Juntunen 2024).
Käytännön haasteena on kuitenkin usein se, että organisaatiot eivät tunnista jo kerätyn informaation potentiaalista arvoa tai arvokkaan datan määrää omissa järjestelmissään. Tämän niin kutsutun ”pimeän datan” (dark data) jalostaminen tiedoksi (knowledge) voi auttaa organisaatiota saavuttamaan liiketoiminnassaan merkittävää kilpailuetua (Gartner 2019). Nopeasti muuttuvassa maailmassa ja kovassa kilpailussa innovaatioista on tullut ratkaiseva tekijä yrityksen selviytymisen ja kasvun moottorina (Høyrup ym. 2012).
TechSavo-hankkeen tavoitteena on vastata tähän haasteeseen vahvistamalla Pohjois-Savon ja Pieksämäen alueen pk-yritysten valmiuksia siirtyä pelkästä datan keräämisestä sen tehokkaaseen jalostamiseen. Seuraavaksi tarkastelemme, kuinka modernit Data Lakehouse -teknologiat, kuten Microsoft Fabric ja Databricks, toimivat työkaluina tämän tietojohtamisen vision toteuttamisessa.
2. Analytiikan kypsyysmalli kehittämisen välineenä
Teknologian valinta on suhteutettava yrityksen analytiikan kypsyysvaiheeseen. Esimerkiksi voidaan soveltaa neliportaista mallia (mukaillen Davenport & Harris 2017; Gartner 2020):

Alueen teknologiateollisuuden PK-yritykset sijoittuvat tyypillisesti vaiheisiin I–II. Raportointi ei useinkaan ole automaattista, ja yritysten raportointi nojaa edelleen vahvasti manuaaliseen työhön. Keskeisimpänä teknisenä esteenä ovat vanhentuneet ERP-järjestelmät, jotka rajoittavat datan saatavuutta ja estävät sen tehokkaan jalostamisen. Jotta datasta voitaisiin luoda aitoa kilpailuetua, se on pystyttävä muuttamaan informaatiosta tietoyhteiskunnan vaatimaksi aineettomaksi pääomaksi (Grant & Baden-Fuller 2004).
Siirtyminen ennakoivaan analytiikkaan ja tekoälyn hyödyntämiseen (vaiheet III–V) on nykyisillä rakenteilla haastavaa, sillä perinteiset järjestelmät eivät kykene käsittelemään suuria, reaaliaikaisia datavirtoja tai tarjoamaan riittävää tukea kehittyneelle koneoppimiselle. Tämä vaatii siirtymistä moderneihin data-alustoihin, jotka mahdollistavat tiedon joustavan jakamisen ja uuden tiedon luomisen organisaatiossa. Modernit data-alustat muodostavat yrityksen digitaalisen kivijalan ja välttämättömän pohjan tekoälyn operatiiviselle hyödyntämiselle. Niihin panostaminen on kriittistä juuri nyt: alusta toimii mahdollistajana, jonka avulla yritykset voivat integroida ja hyödyntää nopeasti kehittyviä tekoälysovelluksia liiketoiminnassaan. Investointi nykyaikaiseen arkkitehtuuriin ei siten ole vain tekninen päivitys, vaan strateginen valinta, jolla varmistetaan yrityksen uudistumiskyky ja kilpailuetu tulevaisuuden markkinoilla.
3. Data Lakehouse -arkkitehtuurien teknologinen vertailu
Vertailu perustuu kustannusmalliin, osaamisvaatimuksiin ja skaalautuvuuteen.
3.1 Microsoft Fabric: Integroitu SaaS-ratkaisu
Arkkitehtuuri: Koko Azure-dataekosysteemi yhden käyttöliittymän kautta. Keskitetty OneLake-tallennus.
• Vahvuudet: Erittäin matala käyttöönoton kynnys, saumaton Power BI -integraatio (Direct Lake), nopea raportoinnin automaatio.
• Heikkoudet: Joustavuus on rajallisempi erittäin suurten tai korkeataajuisten datavirtojen kustomoidussa käsittelyssä.
• Kypsyysvaihe: Optimaalinen vaiheisiin I–II.

3.2 Databricks: Avoin ja skaalautuva Lakehouse
Arkkitehtuuri: Spark-pohjainen, pilviriippumaton (multi-cloud). Keskiössä Delta Lake ja MLflow.
• Vahvuudet: Tehokas IIoT-streaming, tuotantovalmis koneoppiminen (ML/AI), massiivinen laskentateho.
• Heikkoudet: Korkeampi tekninen osaamistarve, laskentaperusteinen hinnoittelu vaatii optimointia.
• Kypsyysvaihe: Optimaalinen vaiheisiin III–IV.
Yhteenveto: Fabric soveltuu nopeaan BI-kehitykseen ja datan yhtenäistämiseen. Databricks on valinta ennakoivaan analytiikkaan ja raskaaseen laskentaan.

4. Toimialakohtainen soveltuvuus
4.1 Puu- ja rakennustuoteteollisuus
Toimialalla korostuvat materiaalivirtojen optimointi (saanto), laadunvalvonta sekä prosessien läpinäkyvyys. Keskeinen data on tyypillisesti peräisin ERP- ja MES-järjestelmistä.
• Microsoft Fabric. Alusta mahdollistaa reaaliaikaisen raportoinnin ja datan yhdistämisen ilman raskaita koodausprojekteja. Se soveltuu erinomaisesti yrityksille, jotka haluavat rakentaa selkeän tilannekuvan tuotannosta nopeasti.
• Esimerkiksi: Tuotantolinjan saanto (yield) visualisoidaan automaattisesti yhdistämällä MES-data Microsoft Fabricin OneLakeen. Tämä lyhentää analyysiviiveen päivistä tunteihin, mahdollistaen välittömät korjaavat toimenpiteet.
4.2 Teknologiateollisuus
Teknologiateollisuudessa hyödynnetään korkeataajuisia sensoreita ja konenäköä. Käsiteltävät datamäärät ovat valtavia, ja tavoitteena on usein vikaantumisten ennustaminen ja toimintavarmuuden parantaminen.
• Databricks (tai hybridimalli). Databricks Intelligence Platform for Manufacturing hallitsee tehokkaasti tärinä-, lämpö- ja kuvadatan analyysin. Se tarjoaa skaalautuvan ympäristön kehittyneelle koneoppimiselle ja uusien dataperusteisten palvelutuotteiden luomiselle.
• Esimerkiksi: Koneen laakerivian ennustemalli, joka varoittaa huoltoa kaksi tuntia ennen vikaantumista. Lakehouse IoT Platform for Predictive Maintenance -arkkitehtuuria ja MLflow-putkea, mikä minimoi kalliit suunnittelemattomat tuotantokatkokset.

5. Esimerkkipilotti
Yrityksen kannattaa suhteuttaa eteneminen nykyiseen analytiikkakypsyyteensä ja resursseihinsa. Seuraavat kaksi polkua tarjoavat konkreettiset esimerkkimallit kehitystyön aloittamiseen.
5.1 Strategia I: Nopea arvonluonti (Microsoft Fabric -painotus)
Tämä polku on suunnattu yrityksille, jotka ovat kypsyysvaiheessa I–II. Painopiste on manuaalisen työn automatisoinnissa ja välittömässä tilannekuvassa.
• Tavoite: Automatisoida kriittinen raportointi 4–6 viikossa.
• Toteutus:
1. KPI-pilotti: Valitaan yksi kriittinen mittari (esim. tuotannon saanto).
2. Keskittäminen: Tuodaan data OneLakeen hyödyntämällä Data Factory -liittimiä.
3. Visualisointi: Luodaan automaattisesti päivittyvät Power BI -raportit päätöksenteon tueksi.
5.2 Strategia II: Innovaatioiden kehittäminen (Databricks-painotus)
Tämä polku on suunnattu kypsyysvaiheen III–IV yrityksille, joilla on tunnistettuja tarpeita teolliselle internetille (IIoT) tai koneoppimiselle.
• Tavoite: Rakentaa ennakoiva päätöksentekoputki ja AI-valmius.
• Toteutus:
1. Osaaminen: Varmistetaan syväosaaminen (Spark/ML) kumppaniverkoston avulla.
2. Streaming: Rakennetaan reaaliaikainen tietovirta sensoridatalle.
3. ML-malli: Kehitetään ja tuotannollistetaan koneoppimismalli (esim. ennakoiva huolto) MLflow-työkaluilla.
6. Teknologiavertailu ja päätöksenteko


Kypsyysarvioinnin tarkistuslista
• [ ] Onko nykyinen raportointi manuaalista? (-> Fabric)
• [ ] Ovatko datalähteet siiloutuneita? (-> Fabric/Databricks)
• [ ] Onko tavoitteena ennakoiva analytiikka 12 kk sisällä? (-> Databricks)
• [ ] Onko IIoT-data kriittistä toiminnalle? (-> Databricks)
8. Johtopäätökset
Analytiikan kypsyysmalli ja teknologinen vertailu luovat pohjan PK-yritysten tuottavuuden kasvulle. Keskeiset havainnot ovat:
1. Microsoft Fabric on paras valinta yrityksille, jotka haluavat nopeasti automatisoida raportointinsa ja siirtyä tiedolla johtamisen aikaan.
2. Databricks on optimaalinen edistyneille yrityksille, jotka rakentavat kilpailuetua tekoälystä ja massiivisesta datasta.
3. Hybridimalli on usein pitkän aikavälin tavoitetila: raskas laskenta Databricksissä, raportointi Fabricissa.
TechSavo-hanke tukee alueen pk-yrityksiä tiedolla johtamisen ja teknologian kehittämisessä. Aktivoimme ja autamme valmistelemaan yritysten omia investointi-, innovointi- ja tuotantoprosessien kehittämishankkeita, jotta uudet teknologiat saadaan tehokkaasti käyttöön. Samalla syvennämme yritysten osaamista analytiikkatyökalujen käytössä ja osoitamme niiden tarjoaman hyödyntämispotentiaalin liiketoiminnan kasvun tukena.
Kirjoittaja: Henri Juntunen, TKI-asiantuntija, Savonia-ammattikorkeakoulu, TechSavo-hanke
Lähteet:
Armbrust, M. et al. (2021) The Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics. Databricks Inc.
Crickard, R. (2023) Choosing Your Cloud Analytics Platform: Databricks vs. Microsoft Fabric.
Davenport, T. H. & Harris, J. G. (2007) Competing on Analytics. Harvard Business School Press.
Davenport, T. H., Barth, P. & Bean, R. (2010) ’How to become an analytical competitor’, Sloan Management Review.
Grant, R.M. & Baden-Fuller, C. (2004) ’A knowledge accessing theory of strategic alliances’, Journal of Management Studies, 41(1), s. 61–84.
Juntunen, Henri (2024). Työntekijälähtöinen innovaatiotoiminta tietojohtamisen näkökulmasta teknologiateollisuusorganisaatiossa. Pro gradu -tutkielma. Itä-Suomen yliopisto. Linkki tutkielmaan
Hlupic, V., Pouloudi, A. & Rzevski, G. (2002) ’Towards an integrated approach to knowledge management: ‘Hard’, ‘soft’ and ‘abstract’ issues’, Knowledge and Process Management, 9(2), s. 90–102.
Høyrup, S., Møller, K., Bonnafous-Boucher, M., Hasse, C. & Lotz, M. (2012) Employee-Driven Innovation: A New Approach. Houndmills: Palgrave Macmillan.
Inmon, W. H. (2002) Building the Data Warehouse. John Wiley & Sons.
Kizilaslan, V., Özdal, O. & Turkay, M. (2020) ’A machine learning approach for predictive maintenance on manufacturing data’, Journal of Manufacturing Systems.
Lawson, B. & Samson, D. (2001) ’Developing innovation capability in organisations: A dynamic capabilities approach’, International Journal of Innovation Management, 5(3), s. 377–400.
Microsoft (2023) Introducing Microsoft Fabric.
Davenport, T.H. & Harris, J.G. (2007) Competing on Analytics: The New Science of Winning. Boston: Harvard Business School Press.
Nonaka, I. & Takeuchi, H. (1995) The Knowledge-Creating Company: How Japanese Companies Create the Dynamics of Innovation. Oxford University Press.
Kuva 1: The scope of the lakehouse platform. Databricks on Google Cloud. Saatavilla: https://docs.gcp.databricks.com/lakehouse-architecture/index.html
Kuva 2: What is Microsoft Fabric. Microsoft Learn. Saatavilla: https://learn.microsoft.com/en-us/fabric/fundamentals/
Kuva 3 Demo maintenance harjoituksesta: Databricks Intelligence Platform for IoT: Predictive Maintenance and GenAI Agents | Databricks
