Quelldatensätze
Quelldatensätze bezeichnet in der Regel die ursprünglichen, unveränderten Datenbestände, aus denen weitere Analysen, Auswertungen oder Transformationsprozesse abgeleitet werden. Sie bilden die primäre Informationsquelle und dienen der Nachvollziehbarkeit und Reproduzierbarkeit von Ergebnissen. Quelldatensätze können in verschiedenen Formaten vorliegen, darunter relationale Datenbanken, CSV-, JSON- oder XML-Dateien, Logdateien, Sensor- oder Transaktionsprotokolle sowieFeld- oder Erhebungsdaten.
Charakteristische Merkmale sind Rohheit, Vollständigkeit (Sammelfrequenz, Abdeckung) und der Originalkontext der Erfassung. Sie gehen oft mit
Beziehungen zu weiteren Konzepten umfassen Data Provenance oder Data Lineage, also die Nachverfolgung, wie Quelldatensätze zu
Anwendungsgebiete reichen von wissenschaftlicher Forschung über statistische Erhebungen und Verwaltungsdaten bis zu GIS, Data Warehousing und