Home

semistructurées

Les données semistructurées sont des données qui ne suivent pas un schéma rigide comme les bases de données relationnelles, mais qui comportent des éléments auto-descripteurs tels que des balises, des clés ou des attributs qui organisent l’information. Elles se situent entre les données structurées et les données non structurées, en permettant une hiérarchie et un balisage des champs, tout en autorisant des structures variables.

Les formats courants incluent XML, JSON et YAML. Ces formats stockent l’information sous forme d’arbres ou de

En pratique, elles sont souvent gérées par des bases de données et systèmes NoSQL (documents, graphiques) et

Avantages et défis: gain de flexibilité, intégration de données hétérogènes et évolutivité; inconvénients: qualité des données,

graphes
où
les
nœuds
peuvent
contenir
des
sous-ensembles
et
des
champs
optionnels.
Les
données
semistructurées
peuvent
être
semi-formalisées
et
évoluer
sans
rupture
majeure,
mais
elles
ne
comportent
pas
nécessairement
un
schéma
fixe.
par
des
mécanismes
de
schéma
à
la
lecture
(schema-on-read).
Le
traitement
et
l’interrogation
se
font
via
des
langages
tels
que
XPath,
XQuery,
JSONPath,
ou
des
extensions
SQL,
et
par
des
technologies
RDF
et
SPARQL
dans
le
cadre
du
web
sémantique.
validation,
cohérence,
complexité
des
requêtes
et
performances,
ainsi
que
la
nécessité
de
conventions
communes
pour
l’interopérabilité.