märgistusandmeid
Märgistusandmed (annotation data) on lisandväärtusega teave, mis kirjeldab või märgistab algandmeid ning mida kasutatakse nende sisu, konteksti, struktuuri või tähenduse mõistmiseks ja tööstuslikuks ning uurimiskasutuseks. Need tekivad märgistamise või annotatsiooni protsessis ning neid kasutatakse andmete leidmiseks, klassifitseerimiseks ning masinõppe mudelite treenimiseks. Märgistused võivad olla teksti, pilte, helifaile või videoid sisaldavad ning hõlmavad erinevaid vorme, nagu nimede märkimine, teemade märksõnastamine, osa-sõnade analüüs või objektide tunnustamine.
Märgistusandmeid kasutatakse laialdaselt erinevates valdkondades: tekstiannotatsioonis parandavad need otsingutulemusi ja mõistmist, visuaalses andmestikus võimaldavad piirid ja
Kvaliteet ja läbipaistvus on märgistuste elujõulisuse seisukohalt kriitilised: kasutatakse märgistusjuhiseid, teostatakse inter-annotaatorluse kontrolli ja hallatakse märgistuste
Seoses teiste andmetega võimaldavad märgistatud andmed paremat otsingut, parem andmete ühenduvus ja täpsem analüüs, eriti suurandmekogumite