datasettiä
Datasettiä on suomen kielen partitiivimuoto sanasta datasetti, joka on lainasana englannista (dataset). Datasetti tarkoittaa kokoelmaa dataa, joka on usein jäsennelty riveihin ja sarakkeisiin ja jota käytetään tilastollisessa analyysissä tai koneoppimisessa. Datasetti voi vaihdella kooltaan ja rakenteeltaan, ja siihen voi sisältyä sekä rakenne- että semi- tai epästrukturoitua dataa.
Partitiivimuotoa datasettiä käytetään, kun viitataan osaan suuremmasta datasetistä tai epävarmasti määriteltyyn määrään dataa. Suomen kielessä partitiivi
Käytännön kontekstissa datasetti viittaa yleisesti tilastollista tai analyysia varten tarkoitettuun aineistoon. Tyypillisiä tiedostomuotoja ovat CSV, JSON
---