språkdatal
Språkdatal är data som används inom språkvetenskap och språkteknologi. Det omfattar text- och talmaterial samt multimodala resurser, ofta med tillhörande annoteringar och metadata som beskriver lingvistiska strukturer, ursprung och villkor för användning. Språkdatal fungerar som det empiriska grunden för språkforskning, modellutveckling och utvärdering och kan omfatta allt från ordlistor och ordböcker till korpusar och språktekniska databaser.
Vanliga typer av språkdatal inkluderar textkorpora (monolinguala och flerspråkiga), tal- eller audiokorpora, parallella korpora, samt lexikon
Organisationer och infrastrukturer för språkdatal inkluderar nationella och internationella projekt och samlingar, som stöder dataåtkomst och
Användningen av språkdatal spänner över akademisk forskning, utveckling av språkverktyg och utbildning. Öppen tillgång och tydliga
---