Back to IF3170 Inteligensi Artifisial

Topic: Evaluation Strategy & Ethics (Pengukuran Kinerja Model - Part 4)

Questions/Cues

  • Konsistensi Tujuan Bisnis

  • Risiko & Mitigasi

  • Sifat Iteratif ML

  • Kriteria Pemilihan Algoritma

  • Kompleksitas Waktu & Ruang

  • Interpretabilitas

  • Aspek Etis & Bias

Reference Points

  • Slides: 30-35

  • Topik: Strategi & Etika

1. Konsistensi dengan Tujuan Bisnis

Evaluasi teknis (akurasi tinggi) tidak selalu berarti sukses bisnis.

  • Pertanyaan Kunci: Apakah model ini benar-benar memecahkan masalah bisnis?

  • Risiko & Mitigasi: Identifikasi potensi kegagalan di dunia nyata. Contoh: Model sensitif terhadap outlier, atau data produksi berbeda distribusi dengan data latih (data drift). Rencanakan mitigasinya.

2. Prinsip Eksperimen ML

  • Iteratif: ML bukan proses sekali jadi. Mulailah dengan sederhana.

  • Aturan 25%: Pada eksperimen pertama, jangan gunakan lebih dari 25% sumber daya (waktu/biaya). Sisakan ruang untuk iterasi dan perbaikan.

  • Ekspektasi: Jangan mulai dengan janji muluk-muluk. Pengujian statistik hanya mendukung hipotesis, bukan membuktikan kebenaran mutlak selamanya.

  • Dokumentasi: Catat semua konfigurasi, hasil, dan kegagalan. Ini aset pengetahuan berharga.

3. Kriteria Pemilihan Algoritma

Jangan hanya memilih berdasarkan Error/Akurasi. Pertimbangkan trade-off lain:

  • Risiko: Seberapa fatal jika model salah?

  • Waktu Pelatihan: Apakah model butuh dilatih ulang tiap hari? (Deep Learning vs Decision Tree).

  • Waktu Pengujian (Inference): Apakah prediksi harus realtime (milidetik)?

  • Kompleksitas Ruang: Apakah model muat di memori perangkat kecil (IoT/HP)?

  • Interpretabilitas: Bisakah kita menjelaskan ALASAN model mengambil keputusan? (Penting untuk medis/hukum).

  • Kemudahan Program: Seberapa susah maintenance kodenya?

4. Aspek Etis

Pembangunan model harus memperhatikan dampak sosial.

  • Bias: Pastikan data latih tidak mengandung bias diskriminatif (misal: model kredit yang bias terhadap gender atau ras tertentu).

  • Stereotyping: Hindari model yang memperkuat stereotip negatif kelompok tertentu.

  • Fairness: Model harus adil bagi semua sub-kelompok populasi.

Summary

Keberhasilan proyek ML dinilai dari dampak bisnis, bukan sekadar skor akurasi. Pemilihan model harus mempertimbangkan Trade-off antara akurasi, kecepatan (komputasi), penggunaan memori, dan Interpretabilitas (transparansi). Prosesnya bersifat iteratif, dimulai dari eksperimen kecil. Aspek Etika wajib diperhatikan untuk mencegah bias dan diskriminasi yang dapat merugikan masyarakat atau reputasi perusahaan.