korpusanalüüsil
Korpusanalüüs on lingvistiline meetod, mis kasutab suure hulga tekstide või kõnekeele kogumit, mida tuntakse korpusena, keelekasutuse uurimiseks. Need korpused võivad olla väga suured, sisaldades miljoneid või isegi miljardeid sõnu. Analüüs keskendub tegeliku keelekasutuse mustrite tuvastamisele, erinevalt traditsioonilistest meetoditest, mis sageli tuginevad keeleteadlaste intuitsioonile või piiratud näidetele.
Selle meetodi abil uuritakse erinevaid keelenähtusi, nagu sõnade esinemissagedus, sõnaühendite kooskasutus (kollokatsioonid), grammatilised konstruktsioonid ja keele
Oluline on korpuse esinduslikkus. Hea korpus peab peegeldama võimalikult täpselt seda keelt või keelekasutuse varianti, mida