informasjonsgevinsten
Informasjonsgevinsten, ofte kalt informasjonsgevinst, er et mål på reduksjonen i usikkerhet om en tilfeldig variabel Y når man observerer en annen variabel X. Den brukes i informasjons- og maskinlæring for å vurdere hvor mye en attributt X bidrar til å forklare eller forutsi Y.
For diskrete variabler beregnes informasjonsgevinsten IG(Y; X) som IG(Y; X) = H(Y) − H(Y|X). Entropien H(Y) måler usikkerheten
Bruksområder: i beslutningstrær bruker man informasjonsgevinsten for å velge den beste splitten av en attributt ved
Begrensninger: IG kan være skjev mot attributter med mange verdier. For å dempe denne skjevheten brukes ofte