LSAtyyppisillä - Infinite Lexicon - Infinite Lexicon

LSAtyyppisillä

LSA-tyyppisillä viitataan joukkoon laskennallisia tekniikoita, joissa pyritään mallintamaan sanojen ja dokumenttien semanttista suhdetta piilotettujen rakenteiden avulla. Tyylin keskeinen idea on muuttaa teksti numeeriseen tilaan siten, että samankaltaiset merkitykset sijaitsevat lähellä toisiaan.

Perusmenetelmä perustuu termi-dokumentti -matriisiin, jossa kussakin solussa on sanan esiintymisen paino tai tf-idf-arvo. Matriisi pienennetään matemaattisesti

LSA-tyyppisiä menetelmiä on sovellettu tiedonhakuun, dokumenttien klusterointiin, kysymysten ja vastausten semanttiseen yhdistämiseen sekä semanttisen similariteetin arviointiin.

Nykyisin LSA-tyyppisiä malleja täydentävät tai korvaavat usein muut tekniikat, kuten sanojen upotusmallit (word embeddings) ja neuroverkkopohjaiset

decompositionilla

tekstiaineistoista.

transformer-mallit.

lähestymistavan