Mahalanobisetäisyyden
Mahalanobisetäisyys on tilastollinen mitta, jota käytetään kuvaamaan, kuinka monta standardipoikkeamaa pistejoukon keskiarvosta tietty piste on. Toisin kuin euklidinen etäisyys, joka ei ota huomioon muuttujien välistä korrelaatiota, Mahalanobisetäisyys ottaa huomioon muuttujien kovarianssin ja korrelaatiot. Tämä tekee siitä erityisen hyödyllisen moniulotteisissa tilastollisissa analyyseissä.
Kaavan avulla voidaan laskea Mahalanobisetäisyys pisteelle x, joukon keskiarvolle μ ja kovarianssimatriisille Σ. Kaava on d(x) = sqrt((x - μ)^T
Mahalanobisetäisyyttä käytetään monilla aloilla, kuten poikkeamien havaitsemisessa, luokittelussa ja klusteroinnissa. Sitä voidaan hyödyntää tunnistamaan pisteitä, jotka