Home

fstatistieken

Fstatistieken, oftewel F-statistieken, vormen een familie van teststatistieken die gebaseerd zijn op de F-verdeling en worden gebruikt om hypotheses over variatie te toetsen. Ze komen vaak voor in analyse van variantie (ANOVA) en in regressieanalyse, waar ze helpen bepalen of waargenomen verschillen tussen groepen of tussen modelprestaties significant zijn. De F-verdeling fungeert als referentie onder de nulhypothese en maakt het mogelijk om een p-waarde af te leiden.

In een eenweg ANOVA wordt de F-waarde berekend als F = MS_between / MS_within, waarbij MS_between staat voor

Interpretatie: een grote F-waarde of een kleine p-waarde geeft aan dat de modelcomponenten of groepseffecten significant

Historisch gezien werd de F-verdeling geïntroduceerd door Ronald A. Fisher in de vroege 20e eeuw en sindsdien

de
gemiddelde
kwadraat
tussen
groepen
en
MS_within
voor
het
gemiddelde
kwadraat
binnen
groepen.
Deze
variabelen
worden
afgeleid
uit
respectievelijk
SS_between
en
SS_within,
door
te
delen
door
hun
vrijheidsgraden
(a-1
en
n-a).
In
regressieanalyses
wordt
de
F-waarde
vaak
berekend
als
F
=
(SSR/k)
/
(SSE/(n-k-1)),
waarbij
SSR
de
verklaarde
variatie
is,
SSE
de
onverklaarde
variatie
en
k
het
aantal
voorspellers.
De
F-verdeling
heeft
twee
vrijheidsgraden
(df1
en
df2)
die
afhangen
van
het
model
en
het
aantal
observaties.
bijdragen
aan
de
verklaarde
variatie,
waarmee
de
nulhypothese
wordt
verlaagd.
F-tests
zijn
gevoelig
voor
de
aannames
van
de
analyse,
zoals
normaliteit
van
residuen
en
homoscedasticiteit.
een
centraal
instrument
in
statistische
inferentie.
Toepassingen
bevinden
zich
in
experimenteel
ontwerp,
biologie,
sociaal
wetenschappelijk
onderzoek
en
econometrie,
waar
ze
algehele
modelsignificantie
en
verschillen
tussen
meerdere
groepen
toetsen.