Modelselectie
Modelselectie is het proces waarbij uit een reeks kandidaat-modellen een model wordt gekozen dat naar verwachting het beste presteert op ongeziene data. Het doel is een balans tussen bias en variance te vinden zodat de voorspellingen accuraat en generaliseerbaar blijven, zonder onnodig complexe modellen te gebruiken.
Modellen worden beoordeeld met verschillende criteria. Prestatie op held-out data via cross-validatie of train-test splits is
Veelgebruikte methoden voor modelselectie zijn onder meer forward selectie, backward selectie en stepwise selectie in regressie,
Modelensembles en modellaveraging spelen een rol wanneer men modelonzekerheid wil bestrijden. Methoden zoals Bayesian model averaging
Uitdagingen bij modelselectie omvatten overfitting bij kleine datasets, data leakage, keuze van evaluatiecriteria en de afhankelijkheid