semistrukturierten
Semistrukturierte Daten bezeichnet man Daten, die sich nicht in einer festen, relationalen Tabellenstruktur abbilden lassen, dennoch aber über eine erkennbare, selbstbeschreibende Struktur verfügen. Typische Merkmale sind hierarchische Organisationen durch verschachtelte Strukturen sowie Marker wie Tags oder Schlüssel-Wert-Paare, die Informationen zu Datenelementen liefern. Diese Merkmale ermöglichen flexible Erweiterungen, unregelmäßige Felder und heterogene Datensätze, ohne dass eine strenge Schema-Definition vorliegen muss.
Zu den häufigsten Formaten gehören XML, JSON, YAML und BSON. HTML kann ebenfalls semistrukturiert sein, obwohl
Vorteile ergeben sich aus der Anpassungsfähigkeit an neue Felder, der einfachen Integration unterschiedlicher Quellen und der
Anwendungsgebiete finden sich in Weblog-Analysen, Konfigurations- und Protokolldateien, API-Antworten, Datenaustauschformaten zwischen Systemen und großen unstrukturierten Sammlungen,