featurekeuze
Featurekeuze, ook wel selectie van kenmerken genoemd, is het proces waarbij vanuit een grotere set aan kenmerken een subset wordt gekozen die het meest informatief is voor een voorspellend model. Het doel is de prestaties te verbeteren, overfitting te verminderen en de trainingstijd en interpretatie van het model te vereenvoudigen door te werken met minder, relevantere kenmerken.
Doel en criteria: het selecteren van kenmerken richt zich op het behouden van informatie die bijdraagt aan
Methoden: er bestaan verschillende benaderingen. Filtermethoden beoordelen kenmerken los van een model, bijvoorbeeld op basis van
Werkflow en evaluatie: selectie moet gebeuren zonder data leakage. Vaak gebeurt selectie binnen cross-validatie, waarna de
Uitdagingen en overwegingen: bij hoge dimensionale data, multicollineariteit, en kleine steekproeven kan selectie leiden tot overfitting
Toepassingsgebieden: veelvoorkomend in tabulaire datasets, tekstverwerking (bijv. selectie van woorden/termen) en sensor- of biomedische gegevens.