crossvalidatie
Crossvalidatie is een statistische methode om de generaliseerbaarheid van een model te beoordelen door de beschikbare data meerdere keren te splitsen in trainings- en testdelen. Het doel is een betrouwbaardere schatting te geven van prestaties op onbekende data dan bij een enkele train-test split.
Werkwijze: De data worden in k gelijke delen (folds) verdeeld. Voor elke iteratie wordt het model getraind
Varianten: De meest gebruikte variant is k-fold crossvalidatie, vaak met k=5 of k=10. Leave-One-Out (LOO) gebruikt
Toepassingen en evaluatie: Crossvalidatie wordt gebruikt om de generalisatiefout te schatten, hyperparameters te tunen en modellen
Voordelen en valkuilen: Voordelen zijn efficiënter gebruik van data en een betrouwbaardere inschatting van prestaties. Nadelen