Home

voorspellingsinterval

Een voorspellingsinterval is een interval met een gekozen betrouwbaarheidsniveau (bijvoorbeeld 95%) waarin een toekomstige waarneming y0 naar verwachting valt, gegeven een statistisch model en de reeds verzamelde data. Het doel is om de ongecerteidheid van een toekomstige observatie te quantificeren, niet alleen de onzekerheid over het model zelf.

Het verschil met een betrouwbaarheidsinterval voor het gemiddelde is dat een voorspellingsinterval ook de extra onzekerheid

In lineaire regressie wordt de voorspelde waarde op een nieuw punt x0 aangeduid als ŷ0. De voorspellingsinterval

Aannames omvatten een correct gespecificeerd model, onafhankelijke observaties met constant variance van de fouttermen, en bij

Voorspellingsintervallen worden toegepast bij planning, kwaliteitscontrole en prognoses, wanneer men wil weten waar een toekomstige waarneming

van
de
toekomstige
waarneming
zelf
omvat.
Een
betrouwbaarheidsinterval
voor
het
gemiddelde
geeft
de
onzekerheid
weer
rond
de
verwachte
waarde
van
het
gemiddelde,
terwijl
een
voorspellingsinterval
rekening
houdt
met
zowel
die
onzekerheid
als
de
variabiliteit
van
individuele
waarnemingen.
voor
y0
bij
x0
wordt
vaak
uitgedrukt
als
ŷ0
±
tα/2,n−p
·
s
·
sqrt(1
+
h0),
waarbij
s
de
ruwe
maximale
fout
schat
en
h0
de
leverage
van
x0
is
(h0
=
x0ᵀ(XᵀX)⁻¹x0).
Voor
eenvoudige
regressie
kan
dit
worden
geschreven
als
ŷ0
±
tα/2,n−2
·
s
·
sqrt(1
+
1/n
+
(x0
−
x̄)²
/
Sxx).
kleine
steekproeven
normaliteit
van
de
fouttermen.
In
de
praktijk
geldt
de
voorspellinginterval
vooral
binnen
het
bereik
van
de
waarnemingen;
extrapolatie
buiten
dit
bereik
kan
aanzienlijk
misleidend
zijn
en
vereist
voorzichtigheid.
waarschijnlijk
zal
vallen
onder
een
gegeven
model.