overtilpassing
Overtilpassing, også kalt overfitting, er en tilstand i statistikk og maskinlæring der en modell lærer mønstre i treningsdataene som ikke er representationelle for den underliggende variansen i dataene. Resultatet er god ytelse på treningssettet, men svakt generaliseringsevne til nye, usette data.
Årsaker inkluderer høy modellkapasitet i forhold til mengden og kvaliteten på dataene, støy eller irrelevante variabler
Konsekvenser er ofte en betydelig forskjell mellom trenings- og validerings-/testytelse, samt følsomhet for små endringer i
Diagnostisering kan skje gjennom læringskurver som viser avvik mellom trening og validering, kryssvalidering, og hold-out tester.
Forebygging og avbøtning inkluderer å velge en enklere modell eller redusere antall parametre, bruke regularisering (L1/L2),