datakeskeinen
Datakeskeinen (data-centric) tarkoittaa lähestymistapaa, jossa keskeinen huomio kohdistuu dataan: sen laatuun, kattavuuteen, hallintaan ja luotettavuuteen. Datakeskeisessä suunnittelussa järjestelmän arkkitehtuuri, kehitysprosessi ja päätökset perustuvat ensisijaisesti dataan sekä sen laadunvarmistukseen, datan keruuseen, puhdistukseen, annotaatioihin ja versionhallintaan. Tällainen painotus heijastuu sekä ohjelmisto- että tekoälysovellusten elinkaareen, käytettäviin mittareihin ja vastuullisuusnäkökulmiin.
Erityisesti tekoälyssä datakeskeinen lähestymistapa tarkoittaa, että mallin suorituskykyä pyritään parantamaan ensisijaisesti kehittämällä ja laajentamalla dataa. Keskeisiä
Käytännön sovelluksissa datakeskeinen lähestymistapa näkyy data-pipelines, datakatalogit, datan laadunvalvonta, data-versionhallinta sekä hallinto- ja MLOps-käytännöissä. Organisaatiot pyrkivät
Termi on lainattu englanninkielisestä ilmauksesta data-centric. Suomessa siitä käytetään sekä "datakeskeinen" että "data-keskeinen" muotoa. Ajatus on
Lisää aiheesta: data-centric AI, datan hallinta (data governance), datalaatu (data quality) sekä MLOps.