Språkparsing
Språkparsing er prosessen med å analysere setninger for å fastslå deres grammatiske struktur og, i noen tilnærminger, betydning. Innen lingvistikken undersøker parsing hvordan ord kombineres i fraser og klausuler, og identifiserer ordklassene, funksjonelle ord og syntaktiske forhold. Innen beregningsbasert lingvistikk refererer parsing til algoritmer som konverterer en rå setning til en strukturert representasjon, for eksempel et parse-tre eller en avhengighetsgraf.
To hovedformer finnes: constituencParsing, som gir frasetrær basert på hierarkiske grupperinger; og avhengighetsparsing, som viser grammatiske
Typisk prosessering involverer en pipeline med tokenisering, morfologisk analyse eller lemmatisering, setningsdel-tagging, og deretter selve parseingen,
Data og evaluering: store annoterte korpora som treebanks og Universal Dependencies gir treningsdata for mange språk.
Anvendelser og utfordringer: språkparsing brukes i maskinoversettelse, informasjonsutvinning, spørsmål-svar-systemer og taleassistenter. Utfordringer inkluderer syntaktisk ambiguities, språklig