Home

Rohdatenerhebung

Rohdatenerhebung bezeichnet den Prozess der Erfassung unverarbeiteter Daten direkt aus Quellen, bevor eine systematische Bereinigung, Transformation oder Aggregation erfolgt. Rohdaten dienen als Grundlage für nachfolgende Analysen, Modellierungen und Validierungen. Der Begriff wird in Wissenschaft, Technik, Wirtschaft und Verwaltung verwendet und umfasst sowohl quantitative als auch qualitative Daten sowie strukturierte und unstrukturierte Datenquellen.

Typischerweise umfasst die Rohdatenerhebung die Festlegung von Zielen und Datenanforderungen, die Festlegung der Quelltypen, die Auswahl

Beispiele für Rohdaten umfassen Messwerte aus Sensoren, Versuchsdaten in der Naturwissenschaft, Antworten in Befragungen, Transaktions- oder

Wichtige Aspekte sind Datenqualität (Gültigkeit, Zuverlässigkeit, Vollständigkeit, Genauigkeit), der Umgang mit Fehl- und Ausreißerwerten, Fehlerquellen und

Rohdaten bilden die Eingangsgröße für Reinigungs-, Transformations- und Analysemethoden und dienen zugleich der Archivierung und Langzeitnutzung,

geeigneter
Erfassungsmethoden
und
Instrumente
(Fragebögen,
Messgeräte,
Beobachtungsprotokolle,
Logdateien,
Sensoren),
die
Planung
der
Stichprobe
oder
vollständigen
Erfassung,
die
Datenerhebung
selbst,
sowie
den
Transport,
die
Speicherung
und
die
Dokumentation
der
Rohdaten,
einschließlich
Metadaten
wie
Variablenbeschreibung,
Einheiten,
Zeitstempel
und
Herkunft.
Server-Logs
sowie
Bild-,
Audio-
oder
Videodaten
aus
Experimenten.
Rohdaten
können
strukturierte
Dateien
(z.
B.
CSV,
JSON)
oder
unstrukturierte
Formate
(z.
B.
Text,
Medien)
sein.
Eine
sorgfältige
Dokumentation
der
Erfassungsmethoden
ist
wesentlich
für
Reproduzierbarkeit
und
Nachvollziehbarkeit.
Versionskontrolle.
Ebenso
spielen
Datenschutz,
Einwilligung,
Anonymisierung
bzw.
Pseudonymisierung,
Rechte
an
Daten
und
Compliance
eine
zentrale
Rolle.
sofern
sie
entsprechend
dokumentiert
und
geschützt
werden.