filtreerimismõõdud
Filtreerimismõõdud, tuntud ka kui filtermõõdud või diskriminantanalüüsi mõõdud, on statistilised meetodid, mida kasutatakse sobivate ennustajate valimiseks mudelisse või mitmete ennustajate rühma tähtsuse hindamiseks. Need mõõdud kvantifitseerivad, kui palju üks või mitu muutujat suudavad eristada või ennustada tulemusmuutujat.
Üks levinumaid filtreerimismõõdusid on Pearsoni korrelatsioonikoefitsient, mis mõõdab lineaarset seost kahe pideva muutuja vahel. Kõrgem absoluutväärtus
ANOVA (dispersioonanalüüs) F-statistika on samuti filtreerimismõõt, mida kasutatakse pideva tulemusmuutuja ja ühe või mitme kategoorilise ennustaja
Lisaks eelmainitud meetoditele kasutatakse ka informatsiooniteooriast pärinevaid mõõdusid, nagu informatsiooni hulk (information gain) ja vastastikune informatsioon
Filtreerimismõõdusid kasutatakse sageli andmete ettevalmistamise etapis masinõppe projektides, et vähendada muutujate arvu ja parandada mudeli jõudlust,