etäisyysperusteisilla
Etäisyysperusteiset menetelmät ovat tilastollisessa analyysissä ja koneoppimisessa käytettyjä lähestymistapoja, joissa datapisteiden välinen etäisyys määrittää analyysin tulokset. Ne perustuvat etäisyysfunktion arvoon, joka mittaa esimerkiksi kuinka lähellä toisiaan kaksi havaintoa ovat.
Yleisimmät etäisyysmittarit ovat Euclidinen etäisyys, Manhattan-etäisyys ja Minkowski-etäetäisyys. Kosinietäisyys mittaa vektorien välisen kulman erotusta ja on
Sovelluksia ovat muun muassa k-nearest neighbours (k-NN) -luokittelu, klusterointi (k-means ja hierarkkinen klusterointi) sekä tiheysperusteiset menetelmät
Käytössä on otettava huomioon tiedon esikäsittely: skaalaus tai standardointi, koska eri ominaisuudet voivat painottaa etäisyyksiä eri
Etäisyysperusteiset menetelmät ovat laajasti käytössä eri tieteenaloilla, kuten tilastotieteessä, informaatiohakussa, bioinformatiikassa ja konenäössä, ja termiä käytetään