Home

halbstrukturiert

Halbstrukturiert bezeichnet in der Informationstechnik Daten oder Datenbestände, die eine definierte Struktur aufweisen, deren Schema jedoch nicht so starr ist wie bei relationalen Datenbanken. Solche Daten enthalten typischerweise Kennungen oder Markierungen (Schlüssel-Wert-Paare, Tags) und eine hierarchische Organisation, die sich flexibel an neue Inhalte anpassen lässt. Der Begriff entspricht dem englischen Konzept der semi-strukturierten Daten.

Charakteristische Merkmale sind selbstbeschreibende Inhalte, eine hierarchische Struktur, teilweise festgelegte Felder sowie Metadaten. Oft gilt Schema-on-read

Typische Formate und Repräsentationen sind JSON, XML und YAML; in Logdateien, APIs, Messaging-Systemen oder Content-Management-Systemen treten

Vorteile sind Flexibilität, leichteres Integrieren heterogener Quellen und schrittweise Schema-Entwicklung. Nachteile sind potenzielle Inkonsistenzen, aufwendigere Validierung

Halbstrukturiert bildet eine Brücke zwischen streng strukturierten relationalen Systemen und unstrukturierten Daten und passt gut zu

statt
Schema-on-write,
und
die
Struktur
wird
beim
Lesen
interpretiert.
Halbstrukturiert
ermöglicht
das
einfache
Hinzufügen
neuer
Felder
und
die
Evolution
des
Schemas,
erfordert
aber
spezialisierte
Werkzeuge
zum
Parsen,
Validieren
und
Abfragen.
sie
regelmäßig
auf.
Auch
dokumentenbasierte
NoSQL-Datenbanken
arbeiten
mit
halbstrukturierten
Daten.
Abfragen
erfolgen
über
Sprachen
wie
JSONPath,
XPath,
XQuery
oder
SQL-Erweiterungen,
die
semi-strukturierte
Inhalte
adressieren.
und
oft
komplexere
Indizierung
oder
Performance-Hotspots
bei
großen
Datenbeständen.
Typische
Einsatzgebiete:
Datenintegration,
Data
Lakes,
Logging,
API-Antworten
und
Content-Management.
modernen,
skalierbaren
Architekturen,
die
Anpassungsfähigkeit
erfordern.