pääkomponenttianalyysiin
Pääkomponenttianalyysi (PCA) on tilastollinen menetelmä korkean ulottuvuuden datan ymmärtämiseen ja tiivistämiseen. PCA muuttaa alkuperäiset muuttujat lineaarisesti yhdistyneiksi pääkomponentteiksi, jotka kuvaavat suurimman varianssin suunnat. Ensimmäinen komponentti selittää suurimman osan varianssista, toinen seuraavan, ja niin edelleen. Tämän avulla moniulotteinen data esitetään pienemmässä ulottuvuudessa ilman olennaisen rakenteen merkittävää menetystä. PCAa käytetään sekä tutkimuksessa että sovelluksissa.
Menetelmä etenee seuraavasti: data standardoidaan, jotta muuttujien mittakaavat eivät vääristä tuloksia. Sitten lasketaan kovarianssimatriisi ja sen
PCAa käytetään eksploratiiviseen analyysiin, visuaaliseen havainnointiin ja datan tiivistämiseen, esimerkkeinä kuvatiedot, geeniekspressio ja rahoitusdatan analyysi. Variantteja
Rajoitukset: PCA on lineaarinen menetelmä ja vaatii numeerista dataa sekä standardointia. Se ei ota huomioon luokkien