SHAP - Panduan Praktis Explainable AI dan Interpretabilitas Model

Model machine learning makin sering dipakai untuk mengambil keputusan yang berdampak pada orang: persetujuan pinjaman, triase medis, penandaan fraud, hingga intervensi churn. Ketika model menjawab "tidak", para pemangku kepentingan wajar bertanya mengapa. SHAP (SHapley Additive exPlanations) memberikan jawaban yang berdasar dan konsisten dengan mengatribusikan setiap prediksi ke fitur-fitur yang menghasilkannya.

Tutorial ini adalah pembahasan mendalam khusus tentang SHAP: teori di baliknya, API modern, explainer yang tepat untuk tiap tipe model, setiap plot inti beserta cara membacanya, dan jebakan yang sering menyandung tim di produksi.

Daftar Isi

Mengapa Interpretabilitas Penting

Penjelasan Global vs Lokal

Intuisi di Balik Nilai Shapley

Apa Arti Sebuah Nilai SHAP

Instalasi

API Terpadu dan Explainer Khusus

Contoh Tabular Lengkap

Membaca Plot-Plot Inti

Mengagregasi Tampilan Lokal Menjadi Global

Nilai Interaksi

Menjelaskan Model Regresi

Menjelaskan Model Teks dan NLP

Mengoperasikan SHAP di Produksi

Jebakan Umum

Praktik Terbaik

Kesimpulan dan Poin Utama

Mengapa Interpretabilitas Penting

Model yang mencetak skor bagus pada data uji belum tentu otomatis layak dipercaya. Interpretabilitas menjawab empat kebutuhan konkret yang muncul di proyek nyata.

Kepercayaan dan adopsi. Pakar domain lebih cepat mengadopsi model bila mereka bisa melihat bahwa model bertumpu pada sinyal yang masuk akal, bukan korelasi semu. Seorang analis kredit lebih nyaman menindaklanjuti skor ketika pendorongnya cocok dengan model pikir mereka.
Debugging. Penjelasan membongkar kebocoran data (leakage) dan pembelajaran jalan pintas. Bila kolom timestamp "masa depan" mendominasi model fraud, penjelasan akan menampakkannya jauh sebelum postmortem.
Keadilan (fairness). Dengan memeriksa bagaimana atribut terlindungi atau proxy-nya berkontribusi pada prediksi, tim bisa mendeteksi dan mengukur perilaku yang tidak diinginkan.
Regulasi. Kerangka seperti hak penjelasan (right-to-explanation) GDPR Uni Eropa, EU AI Act, dan panduan pengawas keuangan makin menuntut alasan yang terdokumentasi dan dapat direproduksi di balik keputusan otomatis.

SHAP sendiri tidak membuat model menjadi adil atau benar. Ia adalah alat ukur yang memberi tahu, secara setia, apa yang sedang dilakukan model sehingga Anda bisa memutuskan apakah perilaku itu dapat diterima.

Penjelasan Global vs Lokal

Pertanyaan interpretabilitas hadir dalam dua bentuk, dan SHAP menjawab keduanya dengan besaran yang sama di bawahnya.

Penjelasan lokal: "Mengapa model menghasilkan prediksi ini untuk pelanggan ini?" Jawabannya adalah kontribusi per fitur untuk satu baris.
Penjelasan global: "Fitur mana yang paling berpengaruh di seluruh dataset, dan ke arah mana?" Jawabannya diperoleh dengan menggabungkan penjelasan lokal dari banyak baris.

Sifat berguna dari SHAP adalah tampilan global secara harfiah merupakan rangkuman dari tampilan lokal. Rata-rata nilai SHAP absolut per fitur memberi tingkat kepentingan global; tanda dan sebaran nilai per baris menggambarkan arah dan keragaman. Tidak ada metrik "kepentingan global" terpisah yang tidak konsisten yang harus didamaikan.

Intuisi di Balik Nilai Shapley

Nilai Shapley berasal dari teori permainan kooperatif (Lloyd Shapley, 1953). Bayangkan sebuah permainan di mana beberapa pemain bekerja sama menghasilkan hadiah, dan Anda perlu membagi hadiah itu secara adil. Nilai Shapley seorang pemain adalah rata-rata kontribusi marginalnya di seluruh urutan kemungkinan pemain bergabung ke koalisi.

Tutorial SHAP: Explainable AI dan Interpretasi Model

SHAP - Panduan Praktis Explainable AI dan Interpretabilitas Model

Daftar Isi

Mengapa Interpretabilitas Penting

Penjelasan Global vs Lokal

Intuisi di Balik Nilai Shapley

Artikel Terkait

Tutorial XGBoost & LightGBM: Gradient Boosting Masterclass

Tutorial PyOD: Deteksi Anomali dan Outlier dengan Python

Tutorial spaCy: NLP Berskala Industri dengan Python

DSPy: Framework untuk Optimasi LLM Secara Programatik