valideringsdatasettet
Valideringsdatasettet er en del av datasettet som brukes i maskinlæring for å vurdere modellers ytelse under utviklingen. Det skilles ut fra treningsdatasettet og brukes som en uavhengig referanse for å justere hyperparametere, arkitektur og treningsprosesser.
Det kan opprettes ved å dele treningsdataene (hold-out) eller gjennom metoder som kryssvalidering (k-fold). Valget av
Under evaluering brukes valideringsdatasettet til å velge mellom konfigurasjoner og til å bestemme tidspunkt for tidlig
Det finnes begrensninger: distribusjonen i valideringsdatasettet kan avvike fra virkelige data over tid (konseptdrift), og settet
Relasjon til andre datadelinger: treningsdatasettet brukes til læring, mens et testerdatasett gir endelig generaliseringsevaluering; valideringsdatasettet brukes