naapuruusmenetelmät
Naapuruusmenetelmät ovat tietojenkäsittelyssä ja erityisesti koneoppimisessa käytettyjä algoritmeja, jotka luokittelevat tai ennustavat datapisteen arvon sen lähimpien naapureiden perusteella. Perusideana on, että samankaltaiset datapisteet sijaitsevat todennäköisesti lähellä toisiaan ja niillä on samat ominaisuudet tai luokat.
Yleisin ja tunnetuin naapuruusmenetelmä on K-lähimmän naapurin algoritmi (K-NN). Tässä menetelmässä jokaiselle uudelle datapisteelle etsitään K
Etäisyyden mittaamiseen käytetään tyypillisesti euklidista etäisyyttä, mutta myös muita etäisyysmittoja, kuten Manhattan-etäisyyttä, voidaan hyödyntää. Valitun K:n