featurekeuze

Featurekeuze, ook wel selectie van kenmerken genoemd, is het proces waarbij vanuit een grotere set aan kenmerken een subset wordt gekozen die het meest informatief is voor een voorspellend model. Het doel is de prestaties te verbeteren, overfitting te verminderen en de trainingstijd en interpretatie van het model te vereenvoudigen door te werken met minder, relevantere kenmerken.

Doel en criteria: het selecteren van kenmerken richt zich op het behouden van informatie die bijdraagt aan

Methoden: er bestaan verschillende benaderingen. Filtermethoden beoordelen kenmerken los van een model, bijvoorbeeld op basis van

Werkflow en evaluatie: selectie moet gebeuren zonder data leakage. Vaak gebeurt selectie binnen cross-validatie, waarna de

Uitdagingen en overwegingen: bij hoge dimensionale data, multicollineariteit, en kleine steekproeven kan selectie leiden tot overfitting

Toepassingsgebieden: veelvoorkomend in tabulaire datasets, tekstverwerking (bijv. selectie van woorden/termen) en sensor- of biomedische gegevens.

voorspellingen,

dimensionaliteit

datasetgrootte.

Wrappermethoden

L1-regularisatie

coëfficiënten

evaluatiemetriek,

domain-specificiteit.

dimensionaliteitsreductie