Pääkomponentti
Pääkomponentti on tilastotieteessä ja koneoppimisessa käytetty käsite, joka tarkoittaa datapisteiden vaihtelun suunnan kuvaavaa koordinaattia tai vektoria. Termi esiintyy erityisesti pääkomponenttianalyysissä (PCA), jossa havaintoaineiston muuttujista etsitään järjestys, jonka mukaisesti varianssi vähenee. Ensimmäinen pääkomponentti on se suunta, jonka projektiolla havaintojen vaihtelu on suurin; seuraavat pääkomponentit ovat keskenään ortogonaalisia ja maksimoivat jäljellä olevan varianssin.
Pääkomponentit lasketaan yleensä kovarianssi- tai korrelaatiomatriisin ominaisvektoreina tai suoran singular value decomposition (SVD) -menetelmän avulla. Eniten
Pääkomponenttien käyttö edellyttää huolellista esikäsittelyä, kuten muuttujien skaalausta, koska eri yksiköissä mitatut suureet voivat vääristää tuloksia.