yliooppiminen
Yliooppiminen on tilanne, jossa koneoppimismalli oppii liikaa koulutusdataan, mukaan lukien sen kohinan ja poikkeavuudet, ja menettää siten kykynsä yleistää uuteen, näkemättömään dataan. Tällöin malli esiintyy hyvänä koulutusdatan perusteella mutta suoritus heikkenee käytännön sovelluksissa.
Yliooppimisen tyypillisiä piirteitä ovat suuri virhe koulutusdatalla ja huomattavasti heikompi virhe uudella, erillisellä testi- tai validaatiodatalalla.
Syytekijöitä ovat muun muassa liiallinen mallin monimutkaisuus, liian pienet tai huonosti edustavat datamassat, kohina datassa sekä
Diagnosointi perustuu muun muassa oppimiskäyriin, joissa koulutuksen ja validaation suorituskyvyn välinen gap voi osoittaa yliooppimista, sekä