Märgistuspõhised
Märgistuspõhised on termin, mida kasutatakse kirjeldamaks meetodeid, süsteeme või töökäike, mis põhinevad märgistatud andmetel ehk annotatsioonidel. Sõna algne tähendus märgistus on lisatud või kirjeldav teave andmete kohta, ja põhisõna viitab sellele, et andmete märgistamine on lahenduse keskne osa. Märgistuspõhised lähenemised on levinud nii tehisintellekti kui ka andmete haldamise valdkondades, kus mudelite koolitus ja analüüs sõltub kvaliteetsest labeled data kogumist.
Kasutusvaldkonnad hõlmavad peamiselt juhendatud, ehk supervisoidud, õppimist ning seotud töövooge. Nende puhul koostatakse märgistatud korpused või
Töövoog tavaliselt hõlmab märgistamiskeemi defineerimist, juhendite koostamist, annotatsiooniprotsessi läbiviimist, kvaliteedi tagamist ning inter-annotator agreement’i (kas annotatsioonide
Eelistused ja väljakutsed hõlmavad suurema täpsuse ja jälgitavuse kasu, kuid nõuavad märgistajate palkamist, juhendite ühtlustamist ning
Näited kasutusaladest: nimekiri entiteetide äratundmine (NER), objektide tuvastamine piltidel, emotsionaalse sisu märgistamine ning audio transkriptsioonide märgistamine.