informasjonsgevinsten - Infinite Lexicon - Infinite Lexicon

informasjonsgevinsten

Informasjonsgevinsten, ofte kalt informasjonsgevinst, er et mål på reduksjonen i usikkerhet om en tilfeldig variabel Y når man observerer en annen variabel X. Den brukes i informasjons- og maskinlæring for å vurdere hvor mye en attributt X bidrar til å forklare eller forutsi Y.

For diskrete variabler beregnes informasjonsgevinsten IG(Y; X) som IG(Y; X) = H(Y) − H(Y|X). Entropien H(Y) måler usikkerheten

Bruksområder: i beslutningstrær bruker man informasjonsgevinsten for å velge den beste splitten av en attributt ved

Begrensninger: IG kan være skjev mot attributter med mange verdier. For å dempe denne skjevheten brukes ofte

i

=

=

=

I

informasjonsteori

=

/

i

i

maskinlæringsoppgaver