likhetssøk
Likhetssøk er oppgaven med å finne elementer i en samling som ligner på et gitt forespørselselement, basert på en definert likhets- eller avstandsfunksjon mellom datarepresentasjoner. Målet er å returnere de elementene som anses som nærmest forespørselen. Likhetssøk skiller seg fra eksakt matching ved at små variasjoner ofte tillates i dataenes representasjon.
Data kan være ulike typer: numeriske vektorer, binære vektorer, sekvenser eller tekst. Vanlige målefunksjoner inkluderer Euclidisk
Metoder: ved nøyaktig søk må alle elementer vurderes, noe som kan være kostbart. For storskala bruk benyttes
Anvendelser inkluderer bilde- og videoretrieval, dokument- og informasjonsgjenfinning, musikk- og anbefalingssystemer, duplikat- og plagiatkontroll, bio- og
Utfordringer og evaluering: høy dimensjonalitet og støy gjør likhetssøk utfordrende, og det innebærer ofte et avveiningsvalg