Textinformationen
Textinformationen bezeichnet alle Informationen, die in Textform vorliegen und dadurch semantisch interpretierbar werden. Dazu gehören Fließtexte, Dokumente, Dialoge, E-Mails, Webseiten, Code-Kommentare, Tweets sowie wissenschaftliche Abstracts oder strings in Tabellen. Im Gegensatz zu numerischen oder bildbasierten Daten stehen bei Textinformationen Merkmale wie Sprache, Semantik, Kontext und Diskurs im Vordergrund. Textinformationen können unstrukturiert vorliegen oder in strukturierten bzw. semi-strukturierten Formaten vorkommen, zum Beispiel in XML- oder JSON-Feldern, oder als Textinhalt in Tabellen.
Die Verarbeitung von Textinformationen umfasst Methoden aus Informatik und Linguistik, darunter Textverarbeitung, Information Retrieval, Text Mining
Zu den Anwendungen gehören Suchmaschinen-Indexierung, automatische Zusammenfassungen, maschinelle Übersetzung, Plagiaterkennung, digitale Archivierung sowie Analyse in Bereichen