Koolitusandmete
Koolitusandmed on masinõppe ja tehisintellekti mudelite treenimiseks kasutatav andmekogum. Need koosnevad näidetest ja nende omadustest, mis võimaldavad mudelil õppida mustreid ja seoseid. Koolitusandmed eristuvad test- ja valideerimisandmetest, mida kasutatakse mudeli hindamiseks ja parameetrite valimiseks.
Tüübid: märgistatud koolitusandmed sisaldavad tähiseid või klasifikatsioone, mis juhendavad õpet ja aitavad mudelil luua seoseid. Märgistamata
Allikad: koolitusandmed võivad pärineda avatud andmekogudest, ettevõtete sisemistest andmetest, sensorandmetest, tekstist, piltidest või helist. Litsentsid ja
Kvaliteet ja ettevalmistus: enne treenimist tuleb andmed puhastada, duplikaadid kõrvaldada, puuduvad või valed märgendid korrigeerida ning
Kasutusvaldkondade näited ja riskid: erinevates kontekstides kasutatakse ImageNeti, CIFAR-10, COCO jt suuremaid või spetsialiseeritud andmestikke. Samas