Koulutusdataa
Koulutusdataa on tekoälyn ja koneoppimisen mallien opettamiseen käytetty aineisto. Se voi sisältää tekstiä, kuvia, ääniä tai rakenteellista dataa sekä usein sekä syötteen että sille annettavan oikean vastauksen (etiketit) yhdistelmän. Koulutusdatan avulla malli oppii tunnistamaan kuvioita ja tekemään ennusteita tai päätöksiä uusilla, näkemättömillä esimerkeillä.
Koulutusdata jaetaan usein valvottuun oppimiseen (supervised), jossa esimerkeillä on etiketti, sekä valvomattomaan tai itseohjautuvaan oppimiseen, jossa
Käytännön seikat ja lainsäädäntö ovat keskeisiä. Koulutusdatan keräämisen ja käytön on noudatettava tekijänoikeus- ja yksityisyyden suojaa
Laatu ja hallinta ovat keskeisiä: edustavuus, virheettömyys ja ajantasaisuus sekä vinoumien hallinta. Datan provenance, versionointi ja
---