komponenttianalyysiä
Komponenttianalyysi, suomeksi myös pääkomponenttianalyysi, on tilastollinen menetelmä, jota käytetään moniulotteisten datojen ulottuvuuden vähentämiseen. Sen tavoitteena on löytää uusi joukko muuttujia, komponentteja, jotka ovat alkuperäisten muuttujien lineaarikombinaatioita. Nämä uudet komponentit ovat keskenään ortogonaalisia eli korreloimattomia, ja ne järjestetään siten, että ensimmäinen komponentti selittää suurimman osan datan varianssista, toinen komponentti suurimman osan jäljelle jääneestä varianssista ja niin edelleen.
Menetelmä perustuu datan kovarianssi- tai korrelaatiomatriisin ominaisarvojen ja ominaisvektorien laskemiseen. Ominaisvektorit määräävät komponenttien suunnat korkeampiulotteisessa avaruudessa,
Komponenttianalyysiä käytetään laajalti eri tieteenaloilla, kuten kuvantunnistuksessa, koneoppimisessa, bioinformatiikassa ja taloustieteessä. Sen etuja ovat datan visualisoinnin