valideringsdatasettet - Infinite Lexicon - Infinite Lexicon

valideringsdatasettet

Valideringsdatasettet er en del av datasettet som brukes i maskinlæring for å vurdere modellers ytelse under utviklingen. Det skilles ut fra treningsdatasettet og brukes som en uavhengig referanse for å justere hyperparametere, arkitektur og treningsprosesser.

Det kan opprettes ved å dele treningsdataene (hold-out) eller gjennom metoder som kryssvalidering (k-fold). Valget av

Under evaluering brukes valideringsdatasettet til å velge mellom konfigurasjoner og til å bestemme tidspunkt for tidlig

Det finnes begrensninger: distribusjonen i valideringsdatasettet kan avvike fra virkelige data over tid (konseptdrift), og settet

Relasjon til andre datadelinger: treningsdatasettet brukes til læring, mens et testerdatasett gir endelig generaliseringsevaluering; valideringsdatasettet brukes

representativitet

klassedistribusjon

valideringsdataene

målpopulationen.

valideringssettet.

i

klassifisering,

i

Valideringsmålingene

generalisering.

splittingmetode

i

hyperparameterrulling.