Ylisovittuminen
Ylisovittuminen, yleisesti kutsuttu myös ylisovitus, on tilastollisen mallin tai koneoppimismenetelmän ilmiö, jossa malli oppii koulutusdatassa esiintyvää satunnaista vaihtelua liikaa. Tämän seurauksena malli sopii hyvin koulutusdataan, mutta sen yleistyminen uusille, näkemättömille aineistoille heikkenee.
Ilmiö ilmenee usein siten, että koulutusdatalla saavutettu suoritus on korkea, kun taas validointi- tai testidatalla suoritukset
Ylisovittumisen taustalla voi olla useita syitä. Liian monimutkainen malli verrattuna käytettävissä olevaan datamäärään, liiallinen ominaisuuksien määrä,
Ehkäisy ja diagnosointi perustuvat huolelliseen evaluointiin ja ennaltaehkäiseviin käytäntöihin. Tähän kuuluvat harjoitus- ja validoijaryhmän pitäminen erillään,
Ylisovittuminen on yleinen haaste, joka liittyy taitavasti tasapainossa olevaan mallin kykyyn yleistää opittua. Sen ymmärtäminen ja