likhetssökning - Infinite Lexicon - Infinite Lexicon

likhetssökning

Likhetssökning, eller närliggande sökning, är processen att hitta objekt som liknar en given förfrågan i ett visst mått på deras egenskaper. Den är central inom områden som informationsåtervinning, datorseende, ljud- och textanalys samt rekommendationssystem. Vanligtvis representeras data som vektorer i ett rum där varje dimension fångar en egenskap hos objektet. Frågan till systemet lämnas också som en vektor, och målet är att hitta de närmaste grannarna enligt ett avstånds- eller likhetsmått.

Vanliga mått inkluderar cosine similarity, som fokuserar på vektorernas riktning, och olika avståndsmått som L2 (euklidiskt

Indexeringstekniker för effektiv likhetssökning inkluderar strukturer som k-d-träd och ball-träd för lågdimensionell data, samt mer sofistikerade

Användningsområden omfattar bild- och videosökning, text- och dokumentlikhet, dubblettidentifiering, och personliga rekommendationer. Viktiga utmaningar är hög

Manhattan-avstånd.

i

högdimensionella

locality-sensitive

produktkvantisering.

neighbor-verktyg

i