metrikkvalg
Metrikkvalg er prosessen med å velge en passende metrikk eller avstandsfunksjon for et gitt oppdrag eller datasett. En metrikk kvantifiserer hvor likt eller forskjellig to objekter er og brukes i oppgaver som klyngeanalyse, nær-nabo-søk og dimensjonal reduksjon. Valget av metrikk påvirker ofte resultatene, og det bør tilpasses dataenes egenskaper og oppgavekrav.
Vanlige distanser inkluderer Euclidean (L2), Manhattan (L1), Chebyshev (L∞) og Minkowski-familien, samt cosine-avstand, Jaccard-indeks og Hamming-avstand.
Når man velger metrikk, vurderes dataenes type (numeriske, kategoriske, blandede), skala og behov for normalisering, sparsitet
Praktiske tilnærminger innebærer å prøve flere metrikker og evaluere ytelsen på relevante oppgaver, for eksempel via