spredningsmatricer
Spredningsmatriser, eller spredningsmatriser i statistik, beskriver hur data sprider sig och hur variablerna samvarierar. För en slumpmässig vektor X ∈ R^p med medelvärde μ definieras den teoretiska spredningsmatrisen S som S = E[(X − μ)(X − μ)^T]. Denna matris är symmetrisk och positiv semidefinit. Om μ är okänd används vanligtvis en estimator baserad på data, exempelvis kovariansmatrisen.
Kovariansmatrisen uppskattas med Σ̂ = (1/(n−1)) Σ_{i=1}^n (x_i − x̄)(x_i − x̄)^T. Denna estimator ger diagonala elementen som variansen och
Användningsområden inkluderar multivariat analys som principal components analysis (PCA), diskriminantanalys, portföljval inom finans och signalbehandling. Spredningsmatriser
Notera att valet av estimator påverkar resultatet i små prover och vid avvikande data; robusta eller shrinkage-baserade