embeddingkwaliteit

Embeddingkwaliteit verwijst naar de mate waarin een vectorrepresentatie de semantische en syntactische eigenschappen van de oorspronkelijke entiteit vastlegt en bruikbaar is voor taken die op die representaties vertrouwen. Embeddings kunnen worden toegepast op woorden, zinnen, documenten, of entiteiten in kennisgrafieken en multimodale data.

Evaluatie van embeddingkwaliteit gebeurt op intrinsiek en extrinsiek niveau. Intrinsieke evaluaties toetsen direct eigenschappen zoals woord-

Factoren die embeddingkwaliteit beïnvloeden zijn onder meer de grootte en kwaliteit van de trainingsdata, de gekozen

Verfijning en evaluatie verlopen vaak iteratief: data-aanvulling, aanpassen van het leerobj ect, en testen op zowel

zinsgelijkenis,

informatieophaling,

Pearson-correlatie

task-specifieke

leerdoelstelling

dimensionaliteit,

post-processing

domeinspecificiteit,

structuurbehoud

sentence-embeddings

aanbevelingsystemen.