Pääkomponenttianalyysin
Pääkomponenttianalyysi, usein lyhennettynä PCA (Principal Component Analysis), on tilastollinen menetelmä, jota käytetään dimensionpudotukseen. Sen tavoitteena on vähentää datan muuttujien määrää säilyttäen samalla mahdollisimman paljon alkuperäisen datan varianssista. Tämä tehdään muuntamalla alkuperäiset, mahdollisesti korreloituneet muuttujat uusiksi, korreloimattomiksi muuttujiksi, joita kutsutaan pääkomponenteiksi.
Ensimmäinen pääkomponentti kuvaa suurimman osan datan varianssista. Toinen pääkomponentti kuvaa suurimman osan jäljellä olevasta varianssista ja
PCA soveltuu moniin eri käyttötarkoituksiin, kuten kuvankäsittelyyn, datan visualisointiin, kohinan poistoon ja muiden koneoppimisalgoritmien syötteen valmisteluun.