Home

kandidatmodeller

Kandidatmodeller är en samling av potentiella modeller som övervägs när man bygger en statistisk eller maskininlärningsbaserad modell. Begreppet betonar att det finns flera möjliga strukturer, variabler eller algoritmer som kan förklara data, och att valet av slutlig modell baseras på hur väl varje kandidat presterar enligt ett definierat kriterium.

Generation och olika sätt att skapa kandidater varierar. Man kan jämföra olika uppsättningar av förklarande variabler

Utvärdering och urval av kandidater bygger på upprepade mätningar av modellernas prestanda. Vanliga metoder är korsvalidering

Relationen till praktiken är att kandidatmodeller utgör ett standardsteg i modellbyggnad. De hjälper till att strukturera

i
en
regression,
använda
olika
modellklasser
(till
exempel
linjära
modeller,
träd,
neurala
nätverk)
eller
testa
olika
hyperparametrar
och
regulariseringstekniker.
Ofta
används
domänkunskap
för
att
begränsa
antalet
kandidater
eller
för
att
vägleda
urvalet,
ibland
kompletterat
med
automatiska
sökmetoder.
eller
bootstrap
för
att
bedöma
generalisering
till
ny
data.
Urvalskriterier
inkluderar
prediktiv
noggrannhet,
informationskriterier
som
AIC
eller
BIC,
justerad
förklaringsgrad,
eller
log-likelihood.
Ibland
används
parsimoni
som
ett
krav,
så
att
enklare
modeller
föredras
om
de
presterar
likvärdigt.
I
vissa
fall
används
modellmedelvärde
eller
ensemblemetoder
istället
för
att
välja
en
enda
kandidatmodell.
och
dokumentera
alternativen
innan
ett
beslut
fattas
och
uppmärksammar
risker
som
överanpassning
och
urvalsbias.