Home

Konfusionsmatrix

Konfusionsmatrix, eller confusion matrix på engelska, är en tabell som används inom maskininlärning och statistik för att utvärdera prestanda hos klassificeringsmodeller. Den jämför modellens förutsägelser med de sanna etiketterna i en given datauppsättning och visar hur många observationer som blivit rätt eller fel i varje klass. Genom att analysera strukturen i tabellen kan man få en övergripande bild av hur modellen presterar och var den gör misstag.

I fallet med två klasser kallas etiketterna ofta positiv och negativ. Tabellen har fyra celler: sann positiv

Vanliga mått inkluderar noggrannhet (accuracy) som är andelen korrekta förutsägelser, precision som anger hur stor del

Användningen innefattar modellutvärdering, jämförelser mellan olika algoritmer, och optimering av beslutsgränser. Det finns även normaliseringar (t.ex.

(TP),
falsk
positiv
(FP),
sann
negativ
(TN)
och
falsk
negativ
(FN).
TP
är
antal
rätt
positiva
förutsägelser,
TN
rätt
negativa,
medan
FP
och
FN
anger
felklassificeringar.
Från
dessa
värden
kan
man
beräkna
olika
prestandamått
som
beskriver
olika
aspekter
av
modellen.
av
de
förutsagda
positiva
som
verkligen
är
positiva,
återkallning
eller
känslighet
som
mäter
hur
många
av
de
sanna
positiva
som
fångas
upp,
och
F1-score
som
är
den
harmoniska
medelvärden
av
precision
och
återkallning.
Specificitet
och
falsk-positivt-frekvens
går
också
att
beräkna,
liksom
negativa
prediktiva
värden.
För
fler
än
två
klasser
används
en
multi-klasskonfusionsmatris
där
varje
klass
jämförs
mot
alla
övriga.
per
rad
eller
per
kolumn)
för
att
hantera
skev
fördelning
av
klasser.
Notera
att
konfusion
matrisen
inte
ger
information
om
sannolikhetskalibrering
eller
hur
modellen
beter
sig
över
olika
populationsgrupper.