Home

Rkwadraat

Rkwadraat, ook wel R² genoemd, is een statistische maat die aangeeft welk deel van de variatie in de afhankelijke variabele verklaard kan worden door het regressiemodel. Voor een regressie met een intercept wordt R² berekend als R² = 1 - SS_res / SS_tot, waarbij SS_res de som van de gekwadrateerde residuen is en SS_tot de totale som van kwadraten ten opzichte van het gemiddelde. In een eenvoudige lineaire regressie is R² bovendien het kwadraat van de Pearson-correlatie tussen waargenomen en voorspelde waarden.

R² ligt doorgaans tussen 0 en 1; een lagere waarde duidt op een slechtere fit. In sommige

Interpretatie: R² geeft aan welk aandeel van de variatie in de uitkomst verklaard wordt door de onafhankelijke

Om modelvergelijking eerlijker te maken wordt vaak naar de aangepaste R² gekeken, die corrigeert voor het aantal

Beperkingen: R² is gevoelig voor de schaal van de data en uitbijters, en geeft geen indicatie van

Praktische toepassing: R² wordt veel gebruikt in regressieanalyse om de fit te evalueren, te vergelijken tussen

---

gevallen
kan
R²
negatief
zijn,
bijvoorbeeld
wanneer
het
model
minder
goed
voorspelt
dan
een
eenvoudig
model
dat
altijd
het
gemiddelde
voorspelt
of
wanneer
er
geen
intercept
is.
variabelen.
Een
hoger
R²
duidt
op
een
betere
fit,
maar
het
impliceert
geen
causaliteit
en
kan
bedrieglijk
hoog
zijn
bij
overfitting
door
veel
predicters.
predicters:
R²_adj
=
1
-
(1
-
R²)
*
(n
-
1)
/
(n
-
p
-
1),
met
n
het
aantal
observaties
en
p
het
aantal
prediktoren.
Aangepaste
R²
kan
afnemen
bij
onnodige
extra
variabelen.
voorspellende
nauwkeurigheid
buiten
de
steekproef.
Het
is
het
meest
informatief
bij
vergelijkbare
modellen
en
dezelfde
afhankelijke
variabele.
modellen
en
om
de
verklarende
kracht
van
variabelen
te
beoordelen.
Veel
statistische
software
berekent
R²
automatisch.