Home

Nullwerte

Nullwerte bezeichnet in der Datenverarbeitung Werte, die fehlen oder nicht vorhanden sind. Sie treten in Datenbanken, Tabellen, statistischen Datensätzen und Programmiersprachen auf und können Berechnungen, Vergleiche und Aggregationen verfälschen, wenn sie nicht explizit behandelt werden.

Je nach Kontext werden Nullwerte unterschiedlich repräsentiert. In SQL-Datenbanken ist NULL der Marker für eine fehlende

Semantik und Abfragen unterscheiden sich durch dreiwertige Logik. Vergleiche mit NULL liefern UNKNOWN statt TRUE oder

Umgang mit Nullwerten umfasst Optionen wie das Entfernen von Datensätzen (listwise deletion), das Imputieren fehlender Werte

Missings lassen sich statistisch als MCAR, MAR oder MNAR klassifizieren, was die Wahl der Analyse- und Imputationsstrategie

Information.
In
CSV-Dateien
können
fehlende
Felder
durch
leere
Zeichenfolge
oder
zwei
aufeinanderfolgende
Kommata
angezeigt
werden.
Programmiersprachen
verwenden
unterschiedliche
Konzepte:
Python
verwendet
None,
Java/Kotlin
verwenden
null,
R
verwendet
NA,
und
NaN
in
MATLAB
bzw.
IEEE-Gleitkommazahlen
steht
für
“not
a
number”
und
ist
nicht
zwingend
dasselbe
wie
NULL.
FALSE.
Typische
Werkzeuge
sind
IS
NULL
und
IS
NOT
NULL,
COALESCE
oder
DEFAULT-Werte,
um
fehlende
Informationen
zu
behandeln
oder
zu
ersetzen.
Bei
Aggregationen
ignorieren
viele
Systeme
NULL-Werte,
wodurch
Mittelwerte
oder
Summen
entsprechend
berechnet
werden.
(Durchschnitt,
Regression,
k-nearest
neighbors)
oder
das
Markieren
von
fehlenden
Informationen
mit
Flags.
In
Datenbanken
steuert
eine
NOT
NULL-Constraint,
ob
ein
Feld
fehlende
Werte
akzeptiert;
Defaults
können
ebenfalls
eingesetzt
werden.
beeinflusst.
Eine
klare
Dokumentation
von
Nullwerten
erhöht
die
Reproduzierbarkeit
und
Datenqualität.