metadataextractie

Metadataextractie verwijst naar het proces van automatisch identificeren en extraheren van metadata uit datasets en bestanden. Metadata zijn gegevens over data die beschrijven wat de data zijn, hoe ze zijn gemaakt en onder welke voorwaarden ze gebruikt mogen worden. Tijdens metadataextractie gaat het meestal om het ophalen van geïndexeerde informatie zoals auteur, datum, bestandsgrootte, GPS-locatie, camera-instellingen of inhoudsbeschrijvingen, afhankelijk van het type bron.

De extractie kan handmatig of automatisch plaatsvinden. Automatische extractie gebruikt software en algoritmen die tekst, structuur

Metadata kan op verschillende niveaus voorkomen: embedded metadata binnen bestanden, structurele metadata die relaties tussen objecten

Uitdagingen bij metadataextractie zijn onder meer inconsistentie van formaten, ontbrekende of foutieve metadata, privacy- en beveiligingsaspecten

metadata-standaarden

interoperabiliteit.