kollokaatioparien
Kollokaatioparien käsite kuvaa kahta sanaa, jotka esiintyvät yhdessä tilastollisesti usein ja säännöllisesti enemmän kuin sattumanvaraisesti. Näitä pareja pidetään usein vakiintuneina ilmauksina tai osana suurempia monisanaisia ilmauksia, ja ne voivat ilmetä erilaisissa taivutus- tai muodostustilanteissa. Kollokaatioparien tarkastelu kuuluu sekä kielitieteelliseen korpus-analyyttiin että sanakirjojen sekä kielioppien kehittämiseen.
Kollokaatioparien ja laajempien monisanaisten ilmaisujen välillä on ero: kollokaatio tarkoittaa yleensä vahvaa tilastollista assosiaatiota, mutta ei
Mittaa kollokaatioparien tilastollisia yhteyksiä voidaan sanoa korpusperusteisiksi: yleisimpiä mittareita ovat muun muassa PMI/PMI-tyyppiset arvot, Dice-kerroin sekä
Käyttökohteita ovat sanakirjojen ja oppimateriaaleiden kehittäminen, kielentutkimus sekä luonnollisen kielten käsittelyn (NLP) tehtävät kuten sanastokokonaisuuksien/parien hallinta,