halbstrukturiert
Halbstrukturiert bezeichnet in der Informationstechnik Daten oder Datenbestände, die eine definierte Struktur aufweisen, deren Schema jedoch nicht so starr ist wie bei relationalen Datenbanken. Solche Daten enthalten typischerweise Kennungen oder Markierungen (Schlüssel-Wert-Paare, Tags) und eine hierarchische Organisation, die sich flexibel an neue Inhalte anpassen lässt. Der Begriff entspricht dem englischen Konzept der semi-strukturierten Daten.
Charakteristische Merkmale sind selbstbeschreibende Inhalte, eine hierarchische Struktur, teilweise festgelegte Felder sowie Metadaten. Oft gilt Schema-on-read
Typische Formate und Repräsentationen sind JSON, XML und YAML; in Logdateien, APIs, Messaging-Systemen oder Content-Management-Systemen treten
Vorteile sind Flexibilität, leichteres Integrieren heterogener Quellen und schrittweise Schema-Entwicklung. Nachteile sind potenzielle Inkonsistenzen, aufwendigere Validierung
Halbstrukturiert bildet eine Brücke zwischen streng strukturierten relationalen Systemen und unstrukturierten Daten und passt gut zu