variabelurval
Variabelurval är processen att välja ett begränsat antal av de tillgängliga variablerna som används när man bygger en statistisk eller maskininlärningsbaserad modell. Syftet är att förbättra prognostisk eller förklarande prestanda, öka tolkbarheten, minska överanpassning och minska kostnaderna för datainsamling och modellkomplexitet.
Metoderna inom variabelurval delas ofta in i tre grupper: filtermetoder, wrappermetoder och inbäddade (embedded) metoder. Filtermetoder
Vid höga dimensioner används ofta särskilda tillvägagångssätt som stabilt urval och korsvalidering för att bedöma prestanda
Skillnaden mellan variabelurval och dimensionalitetsreduktion är att variabelurval behåller de ursprungliga variablerna medan reduktion som PCA