nærvektorsøk
Nærvektorsøk er prosessen med å finne vektorer i et datasett som er nærmest en forespørselvektor under en valgt avstandsmål. Dette er et sentralt problem i høy-dimensional dataanalyse, særlig når data representeres som embeddede vektorer fra maskinlæring, som bilde-, tekst- eller lydrepresentasjoner. Vanlige avstands- eller likhetsmål inkluderer euklidsk avstand, cosinuslikhet og Manhattan-avstand.
Det finnes eksakte og tilnærmede tilnærminger. Eksakt nærvektorsøk returnerer den faktisk nærmeste naboen, men kan være
Vanlige metoder og datastrukturer inkluderer brute force-søk, som sjekker alle vektorer og gir nøyaktighet til kostnad
Anvendelser spenner fra bilde- og videoretrieval, tekstoppløsning og tekstbaserte embeddings til anbefalingssystemer, bioinformatiske søk og anomalideteksjon.