dimensjonreduksjon
Dimensjonreduksjon er en gruppe teknikker som reduserer antall variabler i et datasett ved å produsere et mindre sett av representasjoner som fortsatt oppsummerer vesentlig informasjon. Metodene deles ofte inn i to hovedkategorier: feature selection, som velger en del av de eksisterende variablene, og feature extraction, som skaper nye variabler som oppsummerer dataene.
Lineær dimensjonreduksjon inkluderer metoder som principal component analysis (PCA), som finner ortogonale komponenter som maksimerer variansen
Anvendelser inkluderer datavisualisering av høy-dimensionale data i to eller tre dimensjoner, støyreduksjon og forbehandling i maskinlæring
Vurdering av dimensjonreduksjon omfatter målinger som variantholdning (for PCA), rekonstruksjonstap og egenskaper for etterfølgende analyse, som
Historisk sett utviklet seg fra statistisk faktoranalyse og PCA til dagens ikke-lineære metoder som tilbyr kraftige
---