SHAP - Panduan Praktis Explainable AI dan Interpretabilitas Model
Model machine learning makin sering dipakai untuk mengambil keputusan yang berdampak pada orang: persetujuan pinjaman, triase medis, penandaan fraud, hingga intervensi churn. Ketika model menjawab "tidak", para pemangku kepentingan wajar bertanya mengapa. SHAP (SHapley Additive exPlanations) memberikan jawaban yang berdasar dan konsisten dengan mengatribusikan setiap prediksi ke fitur-fitur yang menghasilkannya.
Tutorial ini adalah pembahasan mendalam khusus tentang SHAP: teori di baliknya, API modern, explainer yang tepat untuk tiap tipe model, setiap plot inti beserta cara membacanya, dan jebakan yang sering menyandung tim di produksi.
Daftar Isi
Mengapa Interpretabilitas Penting
Model yang mencetak skor bagus pada data uji belum tentu otomatis layak dipercaya. Interpretabilitas menjawab empat kebutuhan konkret yang muncul di proyek nyata.
- Kepercayaan dan adopsi. Pakar domain lebih cepat mengadopsi model bila mereka bisa melihat bahwa model bertumpu pada sinyal yang masuk akal, bukan korelasi semu. Seorang analis kredit lebih nyaman menindaklanjuti skor ketika pendorongnya cocok dengan model pikir mereka.
- Debugging. Penjelasan membongkar kebocoran data (leakage) dan pembelajaran jalan pintas. Bila kolom timestamp "masa depan" mendominasi model fraud, penjelasan akan menampakkannya jauh sebelum postmortem.
- Keadilan (fairness). Dengan memeriksa bagaimana atribut terlindungi atau proxy-nya berkontribusi pada prediksi, tim bisa mendeteksi dan mengukur perilaku yang tidak diinginkan.
- Regulasi. Kerangka seperti hak penjelasan (right-to-explanation) GDPR Uni Eropa, EU AI Act, dan panduan pengawas keuangan makin menuntut alasan yang terdokumentasi dan dapat direproduksi di balik keputusan otomatis.
SHAP sendiri tidak membuat model menjadi adil atau benar. Ia adalah alat ukur yang memberi tahu, secara setia, apa yang sedang dilakukan model sehingga Anda bisa memutuskan apakah perilaku itu dapat diterima.
Penjelasan Global vs Lokal
Pertanyaan interpretabilitas hadir dalam dua bentuk, dan SHAP menjawab keduanya dengan besaran yang sama di bawahnya.
- Penjelasan lokal: "Mengapa model menghasilkan prediksi ini untuk pelanggan ini?" Jawabannya adalah kontribusi per fitur untuk satu baris.
- Penjelasan global: "Fitur mana yang paling berpengaruh di seluruh dataset, dan ke arah mana?" Jawabannya diperoleh dengan menggabungkan penjelasan lokal dari banyak baris.
Sifat berguna dari SHAP adalah tampilan global secara harfiah merupakan rangkuman dari tampilan lokal. Rata-rata nilai SHAP absolut per fitur memberi tingkat kepentingan global; tanda dan sebaran nilai per baris menggambarkan arah dan keragaman. Tidak ada metrik "kepentingan global" terpisah yang tidak konsisten yang harus didamaikan.
Intuisi di Balik Nilai Shapley
Nilai Shapley berasal dari teori permainan kooperatif (Lloyd Shapley, 1953). Bayangkan sebuah permainan di mana beberapa pemain bekerja sama menghasilkan hadiah, dan Anda perlu membagi hadiah itu secara adil. Nilai Shapley seorang pemain adalah rata-rata kontribusi marginalnya di seluruh urutan kemungkinan pemain bergabung ke koalisi.