Home

förvirringsmatrisen

Förvirringsmatrisen, eller confusion matrix, är ett tabellformat som används för att utvärdera prestanda hos ett klassificeringssystem. Den jämför faktiska klasser med de förutsagda klasserna och visar hur många fall som faller i varje kombination.

En vanlig version är en tvådimensionell matris där raderna representerar verklig klass och kolumnerna representerar den

Exempel: Anta att av 60 verkliga positiva fall förutsades rätt i 50 fall (TP=50) och missades i

Med dessa tal kan man beräkna prestandamått som noggrannhet (TP+TN)/total ≈ 150/165 ≈ 0,91, precision TP/(TP+FP) ≈ 50/55 ≈ 0,91,

Förvirringsmatrisen kan även användas vid fler än två klasser, där varje cell anger antalet fall med verklig

förutsagda
klassen.
I
binär
klassifikation
är
matrisen
uppdelad
i
fyra
celler:
sanna
positiva
(TP),
falska
positiva
(FP),
falska
negativa
(FN)
och
sanna
negativa
(TN).
10
fall
(FN=10),
medan
5
negativa
fall
felaktigt
förutsågs
positiva
(FP=5)
och
100
negativa
förutsades
korrekta
negativa
(TN=100).
Totalt
165
fall.
recall
TP/(TP+FN)
≈
50/60
≈
0,83
och
F1-score≈0,87.
Specificitet
TN/(TN+FP)
≈
0,95
och
falsk
negativt
felrate
≈
0,17.
klass
i
rad
och
förutsagd
klass
i
kolumn.
Den
hjälper
till
att
identifiera
mönster
i
vilka
fel
som
uppstår
och
används
i
modellutvärdering
tillsammans
med
andra
mått
som
ROC-AUC
och
precisions-/återkallelsekurvor.
Vid
obalanserade
data
kan
mått
som
noggrannhet
vara
missledande
och
därför
kompletteras
ofta
med
fler
mått.