Home

kandidaatmodellen

Kandidaatmodellen zijn een verzameling mogelijke statistische of wiskundige modellen die kunnen worden gebruikt om de relatie tussen variabelen te beschrijven. In een modelselectieproces worden deze kandidaatmodellen vergeleken met als doel een model te kiezen dat de data adequaat verklaart en/of nauwkeurige voorspellingen oplevert. Het begrip wordt in verschillende vakgebieden gebruikt, waaronder statistiek, econometrie en data-analyse.

Kenmerken van kandidaatmodellen zijn onder meer verschillen in functionele vorm (lineair versus niet-lineair), in de selectie

Het proces omvat meestal: het definiëren van een pakket kandidaatmodellen, het schatten van deze modellen met

Uitdagingen bij het gebruik van kandidaatmodellen zijn onder meer modelonzekerheid, overfitting bij een grote set kandidaten,

van
voorspellende
variabelen,
interactie-effecten,
en
assumpties
over
de
foutenelementen
of
de
verdeling
van
de
data.
Een
kandidaatset
kan
bestaan
uit
modellen
met
verschillende
aantallen
parameters,
verschillende
regelingen
voor
kollineariteit
en
verschillende
veronderstellingen
over
het
patroon
van
de
data.
de
beschikbare
data,
en
het
evalueren
op
basis
van
criteria
zoals
informatiecriteria
(bijv.
AIC,
BIC),
cross-validated
prestatie
of
likelihood
ratio-tests.
De
gekozen
aanpak
probeert
balans
te
vinden
tussen
goed
verklaren
van
de
data
en
welkome
generaliseerbaarheid
naar
nieuwe
data.
Soms
wordt
modelgemiddelde
toegepast
als
alternatief
voor
een
enkele,
definitieve
keuze,
om
onzekerheid
over
het
model
zelf
mee
te
nemen.
en
de
kans
op
data-dredging.
Aanhangsels
zoals
Bayesian
model
selection
en
modelgemiddelde
bieden
aanvullende
benaderingen
om
met
deze
onzekerheid
om
te
gaan.