Back to Latihan UAS IF3170

Problem Set: Geometry & Optimization Models (Paket C - Revisi)

Mata Kuliah: Inteligensi Artifisial

Topik: Geometry & Optimization Models (Logistic Regression, Multi-class Non-Linear SVM)

Sifat: Latihan Mandiri

BAGIAN I: Logistic Regression (Stochastic Gradient Ascent)

Soal 1: Prediksi Risiko Penyakit Jantung

Diberikan dataset latih untuk memprediksi risiko penyakit jantung (: Risiko Tinggi, : Risiko Rendah) berdasarkan dua fitur: Tekanan Darah () dan Kolesterol ().

NoTekanan Darah (x1​)Kolesterol (x2​)Risiko (Y)
1210
2451
3320
4561

Model Hipotesis (Pembanding):

Seorang ahli jantung memberikan model aturan praktis (rule-based) sederhana sebagai pembanding:

Tugas Pelatihan:

Lakukan pelatihan model Logistic Regression Anda sendiri menggunakan Stochastic Gradient Ascent (SGA) dengan ketentuan:

  • Inisialisasi Bobot: .

  • Bias: selalu disertakan.

  • Learning Rate (): 0.1

  • Fungsi Aktivasi: Sigmoid

  • Jumlah Epoch: 2 Epoch (Urutan data: 1 2 3 4, diulang 2 kali).

Instruksi:

a. Pelatihan Model: Lengkapi tabel perhitungan manual SGA di bawah ini (tuliskan hingga 3 angka desimal).

b. Prediksi Data Baru: Diberikan pasien baru dengan data .

  • Hitung prediksi kelas menggunakan Model LogReg Hasil Latihan Anda.

  • Hitung prediksi kelas menggunakan Model Hipotesis Ahli.

c. Komparasi Evaluasi: Hitung metrik Akurasi, Presisi, Recall, dan F1-Score untuk kedua model (LogReg vs Ahli) berdasarkan kinerja mereka terhadap Data Latih. Simpulkan model mana yang lebih baik pada data latih ini.

Tabel Kerja (Epoch 1 & 2):

EpochDataInput [1,x1​,x2​]Target yLogit z=wTxPrediksi p=σ(z)Error (y−p)Update ΔwBobot Baru wnew​
1100.622-0.622
12

(Lanjutkan hingga data ke-4 pada Epoch 2)

BAGIAN II: Multi-class SVM Non-Linear (DAGSVM)

Soal 2: Klasifikasi Zona dengan DAGSVM (RBF Kernel)

Diketahui sistem klasifikasi 3 kelas (Zona A, Zona B, Zona C) menggunakan strategi DAGSVM (Directed Acyclic Graph SVM). Sistem ini menggunakan struktur graf eliminasi untuk mempercepat prediksi dibandingkan One-vs-Rest atau One-vs-One standar.

Struktur DAGSVM:

  1. Root Node: Menguji Zona A vs Zona C.

    • Jika Menang A Ke Node Kiri (Uji A vs B).

    • Jika Menang C Ke Node Kanan (Uji B vs C).

  2. Node Lapis 2:

    • Node Kiri (A vs B): Pemenang adalah kelas final.

    • Node Kanan (B vs C): Pemenang adalah kelas final.

Parameter Model (Kernel RBF):

Digunakan RBF Kernel dengan : .

Setiap classifier biner (node) memiliki Support Vector () dan bobot berikut:

  • Model 1 (Root: A vs C):

    • ,

    • ,

    • Bias

    • Aturan: Jika Pilih A (ke Kiri), Jika Pilih C (ke Kanan).

  • Model 2 (Node Kiri: A vs B):

    • ,

    • ,

    • Bias

    • Aturan: Jika Kelas A, Jika Kelas B.

  • Model 3 (Node Kanan: B vs C):

    • ,

    • ,

    • Bias

    • Aturan: Jika Kelas B, Jika Kelas C.

Tugas Hitungan:

Diberikan titik uji baru . Lakukan penelusuran graf DAGSVM untuk menentukan kelasnya.

Instruksi:

  1. Langkah 1 (Root Node - A vs C):

    • Hitung Jarak Kuadrat ke dan .

    • Hitung Nilai Kernel dan .

    • Hitung Skor Keputusan . Tentukan arah penelusuran (Kiri atau Kanan?).

  2. Langkah 2 (Node Berikutnya):

    • Berdasarkan arah dari Langkah 1, pilih model yang relevan (Model 2 atau Model 3).

    • Hitung Jarak Kuadrat ke SV yang relevan untuk model tersebut.

    • Hitung Nilai Kernel.

    • Hitung Skor Keputusan .

  3. Kesimpulan Akhir:

    • Berdasarkan hasil Langkah 2, apa prediksi kelas akhir untuk ?

    • Gambarkan jalur penelusuran keputusan yang diambil.

BAGIAN III: Konsep & Visualisasi

Soal 3: Transformasi Fitur Non-Linear

Bayangkan data 1D di mana Kelas P berada di rentang dan Kelas Q berada di atau .

Tugas:

a. Gambarkan arsitektur pemrosesan data (pipeline) mulai dari input , transformasi , hingga klasifikasi linear.

b. Usulkan fungsi transformasi (misalnya menggunakan polinomial) yang membuat data ini terpisah linear. Tuliskan persamaannya.

c. Gambarkan sketsa posisi data setelah ditransformasi dan di mana letak garis pemisahnya.

BAGIAN IV: Teori & Metrik Evaluasi

Soal 4: Analisis Metrik & Hyperparameter

Isilah tabel berikut mengenai dampak parameter atau kondisi data.

Kondisi / ParameterPada Model…Dampak / Peran UtamaAlasan / Mekanisme
Menggunakan L1 Regularization (Lasso)Linear/Logistic RegressionBobot fitur yang tidak penting menjadi (Mengecil / Nol)L1 menambahkan penalti nilai absolut $
Data Test memiliki distribusi kelas yang Sangat Tidak Seimbang (Imbalanced)Evaluasi Model KlasifikasiMetrik (Akurasi / F1-Score) menjadi tidak dapat dipercayaAkurasi bisa terlihat tinggi hanya dengan memprediksi kelas mayoritas, sementara F1…
Nilai Gamma () pada RBF Kernel terlalu KecilSVM Non-LinearModel cenderung mengalami (Overfitting / Underfitting)Gamma kecil berarti jangkauan pengaruh satu data latih sangat luas/jauh, membuat batas keputusan menjadi terlalu…
Menambah jumlah Epoch terlalu banyak tanpa hentiLogistic Regression (SGA)Model pada data latih semakin bagus, tapi pada data uji risiko (Overfitting / Underfitting) naikModel mulai “menghafal” noise yang ada pada data latih alih-alih pola umum.

BAGIAN V: Matriks Karakteristik Model

Soal 5: Komparasi Model

Berikan tanda centang () jika model memiliki karakteristik tersebut, dan tuliskan Argumentasi Singkat di bawahnya.

KarakteristikNaive BayesNeural Network (MLP)Support Vector Machine (SVM)
Asumsi Independensi Fitur
Argumentasi:
Black Box Model (Sulit Diinterpretasi)
Argumentasi:
Global Optimum Guaranteed (Convex Optimization)
Argumentasi:
Probabilistik Generatif
Argumentasi: