Veralgemingscapaciteit

Veralgemingscapaciteit is de capaciteit van een model of leerprocedure om wat het van trainingdata heeft geleerd toe te passen op nieuwe, ongeziene data uit dezelfde verdeling. In statistisch leren en machine learning is de veralgemening een cruciale maat voor hoe nuttig een model is in praktijk. De kwaliteit van veralgemening wordt vaak geëvalueerd aan de hand van de generalisatieprestaties op een aparte testset of via cross-validatie, waarbij de testdata de onbekende situatie simuleren.

De theoretische basis is de bias-variance trade-off. Een complex model kan lage bias hebben maar hoge variantie,

Factoren die de veralgemingscapaciteit beïnvloeden zijn onder meer modelcomplexiteit, regularisatie, data-kwaliteit en -verzamelingen, aanwezigheid van covariate

Versterking van veralgemingscapaciteit gebeurt doorgaans door regelmatige regulatie (regularisatie), data-augmentatie, het verkrijgen van meer diverse data,

Kritiek en beperkingen bestaan onder meer in de afhankelijkheid van de veronderstelling van gelijke verdelingen tussen

representativiteit

verwachtingsmatige

Rademachercomplexiteit

hypothesis-klasse

distributieverschuiving,

evaluatiemethoden

representatieve

validatieschema's

betrouwbaardere

validatiemethoden

cross-validatie.

distributieshift

veralgemingsvermogen