hoofdcomponentenanalyse
Hoofdcomponentenanalyse (PCA, principal component analysis) is een statistische methode voor dimensionaliteitsreductie en exploratieve data-analyse. Het doel is om een dataset te beschrijven met zo weinig mogelijk nieuwe variabelen, de hoofdcomponenten, die lineaire combinaties van de oorspronkelijke variabelen zijn en die in oplopende volgorde van verklaarde variantie zijn gerangschikt. De methode legt veelal de nadruk op maximale variantie vast in de eerste componenten, terwijl latere componenten orthogonaal blijven aan eerder verkregen componenten.
De gebruikelijke procedure begint met standaardisatie van de gegevens (afhankelijk van de schaal van de variabelen).
Gevolgen en interpretatie: de eerste component legt de grootste variantie vast; elke volgende component is orthogonaal
Toepassingen omvatten beeld- en geluidscompressie, patroonherkenning, data-visualisatie in 2D/3D, en als voorbewerking in genetica, financiën en