Home

Bedeutungstests

Bedeutungstests, im Fachjargon auch Signifikanztests oder Hypothesentests genannt, sind statistische Verfahren, die beurteilen, ob beobachtete Daten mit hinreichender Wahrscheinlichkeit aus einer zugrundeliegenden Population stammen oder ob der beobachtete Unterschied oder Zusammenhang zufällig entstanden ist.

Grundidee ist die Prüfung einer Nullhypothese (H0), etwa dass kein Effekt besteht oder zwei Gruppen gleich sind.

Zu den gängigen Tests gehören parametrische Tests wie der Z-Test, der t-Test, der Chi-Quadrat-Test und die Varianzanalyse

Wichtige Kennzahlen neben dem p-Wert sind die Effektgröße (z. B. Cohen's d, eta-Quadrat) sowie Konfidenzintervalle, die

Die Interpretation von Bedeutungstests erfordert Vorsicht; p-Werte sagen nichts über die Größe oder praktische Relevanz eines

Historisch wurden Signifikanztests im 20. Jahrhundert entwickelt und durch Arbeiten von Fisher sowie Neyman und Pearson

Dazu
wird
eine
Teststatistik
berechnet
und
aus
ihr
ein
p-Wert
abgeleitet,
der
angibt,
wie
wahrscheinlich
die
beobachteten
Daten
unter
H0
sind.
Bei
einem
vorgegebenen
Signifikanzniveau
alpha
(häufig
0,05)
wird
entschieden,
ob
H0
verworfen
wird.
(ANOVA),
sowie
nichtparametrische
Alternativen
wie
Mann-Whitney-U-
oder
Wilcoxon-Test.
Abhängig
von
der
Fragestellung
können
Ein-
oder
zweiseitige
Tests
gewählt
werden;
der
zweiseitige
Test
prüft
auf
Abweichungen
in
beide
Richtungen.
die
Unsicherheit
der
Schätzung
anzeigen.
Der
Stichprobenumfang
beeinflusst
die
Testempfindlichkeit
(Statistikpower)
und
das
Risiko
von
Typ-I-
bzw.
Typ-II-Fehlern.
Effekts
und
können
durch
mehrfache
Tests
verzerrt
werden.
Kritikpunkte
umfassen
Missverständnisse,
p-Hacking
und
den
Fokus
auf
Signifikanz
statt
auf
Reproduzierbarkeit.
Alternative
Ansätze
umfassen
die
Berücksichtigung
von
Konfidenzintervallen,
Bayessche
Methoden
oder
einen
Fokus
auf
Effektgrößen
und
Replikationsstudien.
geprägt.
Heute
finden
sie
breite
Anwendung
in
Wissenschaft,
Medizin,
Psychologie,
Sozial-
und
Verhaltenswissenschaften.