korpuspõhised
Korpuspõhised lähenemised on keeleteaduses ja keeletehnoloogias kasutatavad meetodid, mis põhinevad suurte tekstit kogudel ehk korpustel. Nende abil kirjeldatakse keelekasutust reaalses kasutuses ning tuuakse esile sageduslikke mustreid, kollokatsioone, grammatilisi struktuure ja semantilisi seoseid. Tulemused põhinevad empiirilisel andmetööl ning on sageli reprodutseeritavad ning üldistatavad.
Korpused võivad olla erinevat tüüpi: üldkorpused, erialakorpused, õppijakorpused ning mitmekeelsed korpused. Need võivad olla märgendatud (nt
Analüüs käsitleb frekvenentsi, kollokatsioonide ja n-grammide avastamist, sünnakses mustrite ja semantiliste ühenduste uurimist ning sageli ka
Peamised piirangud hõlmavad andmete kvaliteeti ja representatiivsust, märgendustöö kulukust ning potentsiaalset üleeksplikatsiooni või õiget üldistuse puudumist