Freitextdaten
Freitextdaten bezeichnen unstrukturierte Textdaten, die in natürlicher Sprache verfasst sind. Sie entstehen in vielen Bereichen, etwa durch Kundenfeedback, E-Mails, Support-Tickets, Beschreibungen oder Freitextnotizen in klinischen Akten. Im Gegensatz zu strukturierten Feldern enthalten Freitextdaten Informationen, die nicht einfach in vordefinierte Kategorien passen und oft kontextabhängig, mehrdeutig oder stilistisch geprägt sind.
Charakteristisch sind große Varianz in Formulierungen, Rechtschreibfehler, Abkürzungen und sprachliche Ambiguität. Die Analyse erfordert Vorverarbeitung wie
Zu den typischen Anwendungen gehören Textklassifikation, Named Entity Recognition, Sentiment- oder Themenanalyse, Informationsextraktion und die Unterstützung
Beim Umgang mit Freitextdaten sind Datenschutz und Privatsphäre zu beachten. Personenbezogene Daten müssen ggf. entfernt oder