Interpretabilitate
Interpretabilitate se referă la gradul în care o persoană poate înțelege mecanismele interne sau rezultatele unui model de învățare automată. În cercetarea învățării automate, interpretabilitatea este legată de transparența deciziilor și de capacitatea de a justifica concluziile generate de un model.
În literatura de specialitate, interpretabilitatea poate fi diferențiată de explicabilitate: interpretabilitatea se referă la înțelegerea directă
Există două paradigme principale: interpretabilitate globală și locală. Globală înseamnă înțelegerea comportamentului întregului model; locală se
Aplicații: domenii cu decizii semnificative de impact, cum ar fi finanțele, sănătatea și drepturile, includ reglementări
Provocări: definirea și evaluarea interpretabilității, compromis între complexitate și acuratețe, risc de explicații incorecte sau înșelătoare,