Dimensiovähennystä - Infinite Lexicon - Infinite Lexicon

Dimensiovähennystä

Dimensiovähennys viittaa prosessiin, jossa datan ulottuvuuksien eli piirteiden määrää vähennetään. Tavoitteena on yleensä yksinkertaistaa mallia, nopeuttaa laskentaa, vähentää muistin käyttöä tai poistaa redundanssia ja kohinaa datasta. Tämän seurauksena datan esitysmuoto muuttuu pienempään ulottuvuuteen säilyttäen kuitenkin mahdollisimman paljon alkuperäisestä informaatiosta.

On olemassa useita erilaisia dimensiovähennysmenetelmiä, jotka voidaan jakaa karkeasti kahteen luokkaan: piirteiden valintaan (feature selection) ja

Yleisiä piirteiden poimintamenetelmiä ovat pääkomponenttianalyysi (PCA) ja t-hajautettu stokastinen naapuriupotus (t-SNE). PCA on lineaarisesti etsivä menetelmä,

Dimensiovähennystä käytetään laajasti koneoppimisessa, data-analytiikassa ja kuvankäsittelyssä. Se auttaa käsittelemään korkeaulotteista dataa, parantamaan mallien suorituskykyä ja

alkuperäisistä

informatiivisimpia

yhdistelemällä

ortogonaalisiin

komponentteihin,

epälineaarinen

visualisointiin

ulottuvuuksissa.