datalakeratkaisut
Datalakeratkaisut ovat datan hallinta- ja tallennusalustoja, joita käytetään suurten volyymien raakadatan keräämiseen, tallentamiseen ja jakamiseen organisaatioissa. Ne voivat yhdistää dataa monista lähteistä kuten operatiivisista järjestelmistä, IoT-laitteilta sekä sovelluksista, ja säilyttää sen sekä strukturoituna että strukturoimattomana. Datalakeratkaisut painottavat laajaa tallennuskapasiteettia, joustavuutta sekä kykyä tukea monipuolista analytiikkaa.
Keskeiset piirteet include skaalautuvuus, tuki erilaisten datamuotojen tallentamiseen, sekä skeema-on-read -lähestymistapa, jossa skeema määritellään vasta tiedon
Arkkitehtuurissa datainipoituminen ja tallennus tapahtuvat usein pilviteknologioiden avulla, esimerkiksi object storage -ratkaisuihin. Datan jalostus tapahtuu ETL/ELT-prosessien
Toteutusmallit vaihtelevat on-premises-, pilvi- ja hybridiympäristöjen välillä. Datalakeratkaisut tarjoavat nopean pääsyn suuriin datamääriin, helpottavat data sciencea
Haasteisiin kuuluvat datan laadun ja hallinnan varmistaminen, pysyvä metadata sekä vahva tietoturva ja käyttöoikeuksien hallinta, sekä
Käyttötapaukset kattavat eksploratiivisen analytiikan, koneoppimisen, liiketoimintatiedon raportoinnin sekä datan arkistoinnin. Esimerkkejä teknologioista ovat Amazon S3, Azure