setningsvektor
En setningsvektor er en fast lengde, numerisk representasjon av en setning som tar sikte på å fange dens innhold og semantikk. Slike vektorer brukes i naturlig språkbehandling (NLP) for å måle likhet mellom setninger, gjøre søk etter mening og legge grunnlag for maskinlæringsmodeller som arbeider med tekst.
Tilnærminger varierer fra enkle til avanserte. Tradisjonelt kan setningsvektorer skapes ved bag-of-words eller TF-IDF, eller ved
Dimensjonalitet og egenskaper: Setningsvektorer har vanligvis fast lengde, for eksempel 256, 512 eller 768 dimensjoner, og
Bruksområder: Semantisk likhetssøk, klustring, tekstklassifisering, paraphrase-detektering og spørsmål-svar-systemer, samt som inngangsrepresentasjoner i større NLP-modeller.
Evaluering: Setningsvektorer vurderes ofte ved oppgaver for semantisk likhet og paraphrase-detektering, og i nedstrøms oppgaver som