Back to Latihan UAS IF3170

Problem Set: Geometry & Optimization Models

Mata Pelajaran: Inteligensi Artifisial (IF3170)

Topik: Supervised Learning (Linear Models & SVM)

Estimasi Waktu: 75 Menit

Total Nilai: 40 Poin

Tujuan Pembelajaran

Setelah menyelesaikan bagian ini, mahasiswa diharapkan dapat:

  1. Melakukan simulasi manual pelatihan model Regresi Logistik menggunakan Stochastic Gradient Ascent.

  2. Menentukan Hyperplane optimal dan Margin pada Support Vector Machine (SVM) Linear.

  3. Memilih fungsi Kernel yang tepat untuk data non-linear.

  4. Mengevaluasi kinerja model klasifikasi menggunakan metrik Precision, Recall, dan F1-Score.

Petunjuk Umum

  • Kerjakan soal secara berurutan.

  • Tuliskan langkah perhitungan secara detail.

  • Gunakan pembulatan 3 angka di belakang koma.

Soal 1. Pelatihan Regresi Logistik & Evaluasi Recall (10 Poin)

Fokus: Konsep dasar optimasi gradien (SGD), fungsi Sigmoid, dan evaluasi kinerja pada kasus medis.

Anda sedang melatih model Regresi Logistik sederhana untuk mendeteksi penyakit diabetes berdasarkan kadar gula darah.

  • Fitur (): Kadar Gula Darah (dinormalisasi).

  • Target (): 1 (Diabetes), 0 (Sehat).

  • Model: .

  • Bobot Awal (): .

  • Learning Rate (): 0.1.

Diberikan satu data latih baru: Data A: (Pasien diabetes dengan gula darah tinggi).

Pertanyaan:

a. (Prediksi Awal) Hitung probabilitas prediksi bahwa Data A menderita diabetes menggunakan bobot awal.

  • Rumus Sigmoid: .

b. (Update Bobot) Lakukan satu langkah update bobot menggunakan Stochastic Gradient Ascent (SGA) berdasarkan error dari Data A. Tuliskan nilai (bias) dan yang baru.

  • Rumus Update: . (Ingat untuk bias).

c. (Evaluasi Kinerja - Recall) Misalkan setelah pelatihan selesai, model digunakan untuk memprediksi 5 pasien di data uji dengan hasil sebagai berikut:

PasienStatus Asli (y)Prediksi Model (​)
P111
P210
P300
P411
P501

Hitung nilai Recall dari model tersebut. Jelaskan implikasi medis jika nilai Recall rendah pada kasus deteksi penyakit ini.

Soal 2. SVM Linear: Geometry & Precision (12 Poin)

Fokus: Konsep Support Vector, perhitungan Margin manual, dan evaluasi presisi.

Diberikan dataset 2D sederhana yang linearly separable sebagai berikut:

  • Kelas Positif (+1): ,

  • Kelas Negatif (-1): ,

Pertanyaan:

a. (Identifikasi Support Vector) Gambarkan titik-titik tersebut pada koordinat Kartesius. Secara visual atau logika, tentukan titik mana saja yang menjadi Support Vector. (Hint: Cari titik terluar yang saling berhadapan antar kelas).

b. (Hyperplane Optimal) Tentukan persamaan garis pemisah optimal () yang berada tepat di tengah-tengah antara Support Vector kelas positif dan negatif. Tentukan nilai vektor bobot dan bias .

c. (Perhitungan Margin) Hitung lebar Margin () dari model SVM yang Anda buat pada poin (b) menggunakan rumus .

d. (Evaluasi Kinerja - Precision) Sebuah sistem deteksi spam email menggunakan SVM. Dari 100 email yang diprediksi sebagai “Spam” oleh model, ternyata 80 di antaranya memang benar spam, dan 20 sisanya adalah email penting (bukan spam). Sementara itu, ada 10 email spam yang gagal terdeteksi (diprediksi bukan spam).

  • Hitung nilai Precision model ini.

  • Jika Anda adalah pengguna email, apakah Anda lebih mementingkan Precision tinggi atau Recall tinggi? Jelaskan alasan Anda.

Soal 3. SVM Non-Linear & Kernel Trick (8 Poin)

Fokus: Menangani data yang tidak terpisah linear.

Perhatikan data 1D berikut:

  • Kelas Merah (-1):

  • Kelas Biru (+1):

Pertanyaan:

a. (Visualisasi Masalah) Gambarkan data tersebut pada garis bilangan. Apakah data ini bisa dipisahkan oleh sebuah titik (pemisah linear 1D) tanpa error?

b. (Transformasi Fitur) Usulkan sebuah fungsi pemetaan sederhana (misalnya menaikkan dimensi ke ) agar data tersebut menjadi terpisah secara linear (linearly separable) di dimensi baru.

  • Hitung nilai untuk semua titik.

  • Gambarkan sketsa pemisahannya di dimensi baru.

c. (Pemilihan Kernel) Jika Anda menggunakan SVM dengan Kernel RBF (Radial Basis Function), parameter apa yang harus diatur agar boundary keputusan melengkung cukup fleksibel untuk membungkus kelas Biru? Jelaskan dampak jika parameter tersebut () terlalu besar.

Soal 4. Regresi Linear: Outlier & Metrics (6 Poin)

Fokus: Metrik evaluasi regresi dan sensitivitas model.

Anda membangun model prediksi harga rumah. Mayoritas rumah berharga 500 juta - 2 Milyar. Namun, ada satu data outlier (rumah mewah) seharga 100 Milyar yang masuk ke data uji.

Pertanyaan:

  1. Dampak Outlier: Jika model Anda memprediksi rumah mewah tersebut seharga 2 Milyar (error = 98 Milyar), bandingkan dampak error ini terhadap metrik MSE (Mean Squared Error) dan MAE (Mean Absolute Error). Metrik mana yang nilainya akan melonjak lebih drastis? Jelaskan mengapa secara matematis.

  2. Pemilihan Metrik: Jika tujuan bisnis Anda adalah membuat model yang robust (tahan) terhadap data properti mewah yang jarang terjadi (tidak ingin performa keseluruhan “terlihat” hancur hanya gara-gara satu rumah mewah), metrik mana yang sebaiknya Anda jadikan acuan utama?

Soal 5. Karakteristik Model (Matrix Matching) (4 Poin)

Fokus: Pemahaman sifat dasar algoritma.

Cocokkan karakteristik di kolom kiri dengan algoritma yang paling tepat di kolom kanan. (Satu algoritma bisa dipilih lebih dari satu kali, atau tidak sama sekali).

KarakteristikPilihan Algoritma
1. Output utamanya adalah nilai probabilitas kelas (0 s.d 1).A. Linear Regression
2. Bertujuan memaksimalkan jarak (gap) antara data terluar dua kelas.B. Logistic Regression
3. Menggunakan Least Square Error sebagai fungsi objektif.C. Support Vector Machine (SVM)
4. Hanya titik-titik tertentu (sparse) yang mempengaruhi posisi garis keputusan.

Jawaban: