spredningsmatricer - Infinite Lexicon - Infinite Lexicon

spredningsmatricer

Spredningsmatriser, eller spredningsmatriser i statistik, beskriver hur data sprider sig och hur variablerna samvarierar. För en slumpmässig vektor X ∈ R^p med medelvärde μ definieras den teoretiska spredningsmatrisen S som S = E[(X − μ)(X − μ)^T]. Denna matris är symmetrisk och positiv semidefinit. Om μ är okänd används vanligtvis en estimator baserad på data, exempelvis kovariansmatrisen.

Kovariansmatrisen uppskattas med Σ̂ = (1/(n−1)) Σ_{i=1}^n (x_i − x̄)(x_i − x̄)^T. Denna estimator ger diagonala elementen som variansen och

Användningsområden inkluderar multivariat analys som principal components analysis (PCA), diskriminantanalys, portföljval inom finans och signalbehandling. Spredningsmatriser

Notera att valet av estimator påverkar resultatet i små prover och vid avvikande data; robusta eller shrinkage-baserade

i

p

>

n

i

dataförbehandling,

kovariansmatrisen

Mahalanobis-avståndet

spredningsmatrisen.

i

kovariansmatrisen,

korrelationsmatrisen

scatter-matrisen,

Mahalanobis-avståndet.