geïnterpreteerbaar

Geïnterpreteerbaar is een eigenschap van een systeem of model waardoor de oorzaak en werking van beslissingen begrijpelijk kunnen worden gemaakt voor mensen. In het domein van kunstmatige intelligentie verwijst interpretability vaak naar de mogelijkheid om te zien welke kenmerken en regels bijdragen aan een uitkomst en om het beslissingsproces te reconstrueren. Het begrip is nauw verwant aan verklaarbaarheid, maar in de literatuur worden de termen soms verschillend gebruikt: interpretability bekijkt doorgaans hoe het model intern werkt, terwijl explainability zich richt op heldere toelichtingen voor een specifieke beslissing.

Er bestaan twee hoofdbenaderingen: intrinsiek interpreteerbare modellen en post-hoc interpretaties. Intrinsiek interpreteerbare modellen zijn van nature

Toepassingen van geinterpreteerbare modellen bevinden zich in gebieden waar begrip en verantwoording belangrijk zijn, zoals financiën,

beslissingsbomen

regelgebaseerde

feature-importance-scores,

LIME-varianten,

gezondheidszorg

besluitvorming,

contextafhankelijk

misinterpretatie

vereenvoudigingen

modelprestaties