pääkomponenttianalyysiä
Pääkomponenttianalyysi, usein lyhennettynä PCA, on tilastollinen menetelmä, jota käytetään datan dimensiota pienentämiseen. Sen tavoitteena on muuntaa joukko mahdollisesti korreloivia muuttujia pienemmäksi joukoksi korreloimattomia muuttujia, joita kutsutaan pääkomponenteiksi. Nämä pääkomponentit ovat lineaarisia yhdistelmiä alkuperäisistä muuttujista ja ne järjestetään siten, että ensimmäinen pääkomponentti selittää suurimman osan datan varianssista, toinen pääkomponentti selittää suurimman osan jäljellä olevasta varianssista ja niin edelleen.
PCA toimii etsimällä datan kovarianssi- tai korrelaatiomatriisin ominaisvektoreita ja ominaisarvoja. Ominaisvektorit määräävät pääkomponenttien suunnat datassa, ja
PCA:ta käytetään laajasti monilla aloilla, kuten kuvankäsittelyssä, koneoppimisessa ja bioinformatiikassa. Sitä voidaan hyödyntää esimerkiksi datan visualisointiin,