harjoitusdata
Harjoitusdata on dataa, jota käytetään mallien opettamiseen, kalibrointiin ja arviointiin koneoppimisessa sekä laajemmin datanalytiikassa. Sen tarkoituksena on tarjota riittävän edustava ja laadukas aineisto, jonka perusteella malli oppii tunnistamaan piirteitä ja tekemään päätöksiä. Harjoitusdata eroaa tuotantodatasta, jota käytetään reaaliaikaisessa toiminnassa, sekä testidatasta, jota käytetään mallin suorituskyvyn arviointiin ennen käyttöönottoa.
Harjoitusdata voi olla merkittyä (valvottu oppiminen) tai merkitsemätöntä (valvomaton oppiminen tai itseohjautuva oppiminen). Se voi koostua
Käyttökohteita ovat muun muassa kuvantunnistus, puhe- ja tekstintunnistus sekä ennakoivat mallit eri toimialoilla. Harjoitusdata jaetaan usein
Laatu ja hallinta ovat keskeisiä: harjoitusdatan on edustettava, laadultaan luotettavaa ja hyvin dokumentoitua. Tiedon lähteet, keruumenetelmät,