factorselectie
Factorselectie is het proces waarbij uit een breed scala aan potentiële factoren een subset wordt gekozen die relevant is voor een model of analyse. Het doel is om interpretatie te verbeteren, overfitting te verminderen en de voorspellende prestaties te verhogen, vooral bij hoge-dimensionaliteitsproblemen of beperkte datasets. Factoren kunnen variabelen zijn uit observaties, experimentele metingen of gekwantificeerde kenmerken; vaak worden kwalitatieve variabelen gedigitaliseerd (bijv. dummy-codering) voordat selectie plaatsvindt.
Veelgebruikte benaderingen zijn onderverdeeld in drie categorieën: filtermethoden (bijv. selectie op basis van correlatie, mutual information
Selektie gebeurt op basis van een criterium: voorspellende nauwkeurigheid op een losstaande validatieset, information criteria (AIC,
Bij factorselectie moet rekening gehouden worden met het type data (numeriek, categorisch), interacties tussen factoren en
Toepassingen omvatten statistische modellering, econometrie, biomedische onderzoeksanalyse en ontwerp van experimenten (factorontwerp). Uitdagingen zijn hoge dimensionaliteit,