syöttöaineiston
Syöttöaineisto on termi, jota käytetään kuvaamaan dataa, jota käytetään ohjelmiston, mallin tai tutkimusmenetelmän syöttämänä lähtöaineistona. Se voi olla rakenteista dataa, kuten taulukkotietoja, tai epästrukturoitua dataa, kuten tekstia tai kuvia, ja se voi koostua yhdestä tai useammasta lähteestä.
Syöttöaineiston tarkoituksena on tarjota tarvittavat tiedot analyysiin, laskentaan tai simulaatioon. Sen laatu vaikuttaa suoraan tulosten luotettavuuteen
Aineiston valmistelu tarkoittaa keräystä, puhdistamista, muotoilua ja yhdistämistä. Keskeistä on virheellisten tai puuttuvien arvojen käsittely, duplicates-ongelman
Käyttökonteksteja on monia: koneoppimisessa syöttöaineisto muodostaa mallin oppimisen perustan; tilastollisessa analyysissä se on tutkimuksen perusta; ohjelmistokehityksessä