Etäisyysperusteiset
Etäisyysperusteiset menetelmät ovat tilastollisia ja koneoppimisen menetelmiä, jotka perustuvat kohteiden välisten etäisyyksien tai erojen mittaamiseen. Näitä mittareita käyttämällä voidaan arvioida samankaltaisuuksia, ryhmitellä havaintoja sekä havaita poikkeavuuksia ilman tarvetta muodostaa täysin parametrista mallia.
Yleisimmät etäisyysmittarit ovat euklidinen etäisyys, manhattan- eli L1-etäisyys sekä Minkowski-etäisyys. Lisäksi käytetään kosinietäisyyttä (1 minus cosine-similarity)
Käyttökohteisiin kuuluu klusterointi (esim. k-means, hierarkkinen klusterointi), lähimmän naapurin luokittelu (k-NN), poikkeavuuksien havaitseminen sekä hajautettu tai
Ominaisuuksiin kuuluu intuitiivisuus ja vapaus parametrisesta mallista, mikä tekee niistä joustavia monenlaisiin datatyyppeihin. Niiden tehokas käyttö
Etäisyysperusteiset menetelmät muodostavat tärkeän osan data-analyysin perusvälineistöä, erityisesti tilanteissa, joissa ei haluta tai pystytä tekemään vahvasti