kosinietäisyyttä
Kosinietäisyys on kahden vektorin välinen mitta, joka perustuu näiden vektoreiden suunnan samankaltaisuuteen. Käytännössä kosinisiałto eli kosinisame aiheutettaessa lasketaan vektoreille a ja b seuraavasti: s = (a · b) / (||a|| · ||b||), jossa · tarkoittaa pistetuloa ja || · || pituutta (normia). Yleisesti käytetty etäisyys määritellään d = 1 − s. Tällöin s ∈ [-1, 1] ja d ∈ [0, 2]. Vektorit, joiden suunta on sama, antavat s≈1 ja d≈0; vastakkaiset suunnat antavat s≈-1 ja d≈2.
Toinen yleisesti käytetty mitta on kulman etäisyys eli angular distance, joka on d_ang = arccos(s). Kun vektorit
Käyttökohteet ja etuudet: Kosinietäisyyttä käytetään laajasti tiedonhausta, tekstianalyysistä, suositusjärjestelmistä ja klusteroinnista, erityisesti korkeadimensioisissa ja harvoin täytetyissä
Rajoitukset: 1 − s ei ole todellinen metrika yleisesti, ellei vektoreita ole normalisoitu tai rajattu juuri yksikkövektoreiksi.