taivutusanalysaattorit
Taivutusanalysaattorit ovat luonnollisen kielen käsittelyn työkaluja, jotka purkavat sanan taivutusmuodon takaisin perusmuotoon sekä määrittelevät siihen liittyvät morfologiset ominaisuudet, kuten luvun, sijamuodon, ajan ja persoonan. Ne ovat erityisen tärkeitä taivutusrikkaissa kielissä, kuten suomessa, ja niiden käyttö ulottuu sekä tutkimukseen että sovelluksiin kuten hakukoneisiin ja konekäännöksiin.
Käytännössä ne rakentuvat useimmiten kahdella tavalla: sääntöihin ja sanakirjoihin perustuvilla analyyseillä sekä tilastollisilla tai koneoppimisperusteisilla malleilla.
Tuloksena on tyypillisesti lista mahdollisista analyyseista, jotka sisältävät perusmuodon ja morfologiset tagit (esim. luku, sijamuoto, aika,
Käyttökohteita ovat hakukoneet, tekstin indeksointi ja analyysi, konekäännös sekä kielentutkimus. Haasteita ovat mm. sanakirjojen ulkopuolisten muotojen