Back to Latihan UAS IF3170
Problem Set: Geometry & Optimization Models (Paket B)
Mata Kuliah: Inteligensi Artifisial
Topik: Geometry & Optimization Models (Linear/Logistic Regression, Multi-class SVM)
Sifat: Latihan Mandiri
BAGIAN I: Logistic Regression (Stochastic Gradient Ascent)
Soal 1: Prediksi Kelulusan Mahasiswa (Update Bobot Iteratif)
Diberikan dataset latih untuk memprediksi kelulusan mahasiswa (: Lulus, : Tidak Lulus) berdasarkan dua fitur: Jam Belajar () dan Kehadiran ().
| No | Jam Belajar (x1) | Kehadiran (x2) | Status Lulus (Y) |
|---|---|---|---|
| 1 | 1 | 1 | 0 |
| 2 | 3 | 3 | 1 |
| 3 | 2 | 1 | 0 |
| 4 | 1 | 3 | 1 |
Lakukan pelatihan model Logistic Regression menggunakan algoritma Stochastic Gradient Ascent (SGA) dengan ketentuan:
-
Inisialisasi Bobot: . (Perhatikan: Bobot awal tidak nol).
-
Bias: selalu disertakan.
-
Learning Rate (): 0.2
-
Fungsi Aktivasi: Sigmoid
-
Jumlah Epoch: 1 Epoch (Urutan data sesuai nomor: 1 2 3 4).
Instruksi:
a. Lengkapi tabel perhitungan manual di bawah ini (tuliskan hingga 3 angka di belakang koma).
b. Lakukan Self-Evaluation pada akhir Epoch 2: Prediksi kembali label kelas data latih menggunakan bobot akhir (Threshold ).
c. Hitung Akurasi dan F1-Score (anggap Kelas 1 sebagai Positif).
Tabel Kerja (Epoch 1 & 2):
| Epoch | Data Ke- | Input Augmented [1,x1,x2] | Target y | Logit z=wTx | Prediksi p=σ(z) | Error (y−p) | Update Δw=η(y−p)x | Bobot Baru wnew |
| 1 | 1 | 0 | 0.574 | -0.574 | ||||
| 1 | 2 | … | … | … | … | … | … | … |
| … | … | … | … | … | … | … | … | … |
BAGIAN II: Multi-class SVM (Analitik & Strategi)
Soal 2: Pembangunan Model Multi-class (OVR / OVO / DAGSVM)
Diketahui dataset sederhana dengan 3 kelas: Merah (R), Hijau (G), dan Biru (B). Data direpresentasikan dalam koordinat 2D ().
| Data Point | Koordinat (x1,x2) | Kelas |
| R | ||
| G | ||
| B |
Anda diminta membangun sistem klasifikasi SVM Multi-class untuk data ini. Karena SVM dasar adalah klasifikasi biner, Anda harus memecahnya menjadi beberapa sub-masalah.
Tugas:
Pilih SALAH SATU strategi berikut: One-vs-Rest (OVR) ATAU One-vs-One (OVO).
Kemudian, bangunlah model-model SVM (Hyperplane) yang diperlukan secara manual.
Instruksi:
-
Strategi: Tuliskan strategi yang Anda pilih (OVR atau OVO).
-
Identifikasi Model: Tuliskan pasangan kelas/grup apa saja yang akan dilatih. (Minimal 3 Model).
-
Pembangunan Model: Untuk SETIAP model yang Anda identifikasi di poin 2, tentukan persamaan Hyperplane terbaiknya ().
-
Petunjuk: Gunakan intuisi geometri sederhana untuk mencari garis tengah tegak lurus (perpendicular bisector) antara dua titik terdekat dari kelas yang berlawanan. Tidak perlu perhitungan Lagrange penuh yang panjang, cukup cari garis tengahnya.
-
Contoh Geometri: Garis pemisah antara dan adalah garis vertikal (atau ).
-
| Nama Model | Deskripsi (Kelas vs Kelas) | Persamaan Hyperplane (w1x1+w2x2+b=0) |
| Model 1 | … vs … | … |
| Model 2 | … vs … | … |
| Model 3 | … vs … | … |
-
Prediksi (Voting/Max Score):
Diberikan data baru . Lakukan prediksi kelas menggunakan model-model yang telah Anda buat di atas. Tunjukkan proses voting atau perbandingan skornya hingga didapat kesimpulan kelas akhir.
BAGIAN III: Konsep & Visualisasi
Soal 3: Kernel Trick & Dimensi Tinggi
Bayangkan Anda memiliki dataset 1D sederhana yang tidak terpisah secara linear:
-
Kelas A: (Titik-titik di tengah garis)
-
Kelas B: atau (Titik-titik di ujung kiri dan kanan)
Tugas:
a. Gambarkan posisi titik-titik tersebut pada sumbu 1D. Tunjukkan bahwa tidak ada satu titik pemisah yang bisa memisahkan Kelas A dan B secara sempurna.
b. Usulkan sebuah fungsi pemetaan (mapping function) sederhana yang mentransformasi data 1D ini () menjadi data 2D () atau 1D baru () sehingga data menjadi linearly separable.
- Hint: Pikirkan fungsi kuadrat.
c. Gambarkan hasil transformasi data tersebut di ruang fitur (feature space) yang baru dan gambarkan garis pemisah (linear hyperplane)-nya.
BAGIAN IV: Teori & Metrik Evaluasi
Soal 4: Analisis Peran & Dampak
Isilah tabel berikut mengenai peran parameter atau kondisi tertentu dalam model Geometry/Optimization.
| Kondisi / Parameter | Pada Model… | Dampak / Peran Utama | Alasan / Mekanisme |
| Parameter MinPts (Minimum Points) terlalu besar | DBSCAN (Clustering) | Banyak data akan dianggap sebagai (Core / Noise) | Karena syarat kepadatan menjadi sangat ketat, sehingga… |
| Inisialisasi Bobot Awal () semua Nol | Logistic Regression | Model (Bisa / Tidak Bisa) belajar | Berbeda dengan Neural Network, LogReg adalah model cembung (convex), sehingga inisialisasi nol… |
| Menggunakan RBF Kernel dengan (Gamma) sangat tinggi | SVM Non-Linear | Batas keputusan (boundary) menjadi sangat (Halus / Berlekuk/Kompleks) | Gamma mengontrol jangkauan pengaruh satu data latih. Gamma tinggi berarti jangkauan… |
| Data Latih memiliki Multikolinearitas tinggi (Fitur berkorelasi kuat) | Linear Regression | Koefisien regresi () menjadi (Stabil / Tidak Stabil) | Multikolinearitas menyulitkan model membedakan efek individu tiap fitur, sehingga variansi estimator… |
BAGIAN V: Matriks Karakteristik Model
Soal 5: Komparasi Model
Berikan tanda centang () jika model memiliki karakteristik tersebut, dan tuliskan Argumentasi Singkat di bawahnya.
| Karakteristik | K-Nearest Neighbor (KNN) | Decision Tree (ID3/C4.5) | Support Vector Machine (SVM) |
| Instance-Based Learning (Lazy Learner) | … | … | … |
| Argumentasi: | |||
| Model Geometris (Menggunakan Jarak/Hyperplane) | … | … | … |
| Argumentasi: | |||
| Rawan terhadap Outlier | … | … | … |
| Argumentasi: | |||
| Menghasilkan Rule IF-THEN | … | … | … |
| Argumentasi: |
# KUNCI JAWABAN
Jawaban Soal 1 (Logistic Regression - SGA)
a. Tabel Perhitungan (Ringkasan)
Inisialisasi: ,
Epoch 1:
Data 1 (1,1 | 0): . . . . .
Data 2 (3,3 | 1): . . . . .
Data 3 (2,1 | 0): . . . . .
Data 4 (1,3 | 1): . . . . .
b. Self Evaluation (Data Latih)
Model contoh:
Data 1 (1,1): . 1. (Salah, target 0)
Data 2 (3,3): . 1. (Benar, target 1)
Data 3 (2,1): . 0. (Benar, target 0)
Data 4 (1,3): . 1. (Benar, target 1)
c. Metrik
TP: 2 (Data 2, 4)
TN: 1 (Data 3)
FP: 1 (Data 1 diprediksi 1 padahal 0)
FN: 0
Akurasi:
Precision:
Recall:
F1-Score:
Jawaban Soal 2 (Multi-class SVM)
Pilihan Strategi: One-vs-One (OVO) - Contoh Jawaban
Identifikasi Model:
R vs G: Titik vs . Titik tengah . Garis tegak lurus arah vektor adalah garis dengan gradien -1. Persamaan: (Jika ke arah G, ke arah R).
R vs B: Titik vs . Titik tengah . Garis tegak lurus arah vertikal adalah garis horizontal (atau ).
G vs B: Titik vs . Titik tengah .
Tabel Model:
Nama Model Deskripsi Persamaan Hyperplane (Contoh) M1 R vs G M2 R vs B M3 G vs B (Aproksimasi) Prediksi Data Baru (2, 2):
M1 (R vs G): (Negatif Kelas R menang).
M2 (R vs B): (Negatif Kelas R menang).
M3 (G vs B): (Positif Kelas G menang).
Voting: R (2 suara), G (1 suara), B (0 suara).
Hasil: Kelas Merah (R).
(Jawaban mahasiswa bisa bervariasi pada persamaan garis, yang penting logika geometrinya benar memisahkan dua titik).
Jawaban Soal 3 (Kernel Trick)
a. Gambar 1D:
B --- B --- [ A --- A ] --- B --- B
Jelas tidak bisa dipisahkan oleh satu titik potong.
b. Fungsi Pemetaan:
.
Kelas A () .
Kelas B () .
c. Gambar Feature Space:
Pada sumbu baru , Kelas A berkumpul di kiri (0 s.d 1), Kelas B di kanan (>4).
Garis pemisah (Hyperplane) bisa diletakkan di (atau angka antara 1 dan 4).
Persamaan Linear: .
Jawaban Soal 4 (Teori)
Noise; Syarat ketat membuat banyak data valid yang kurang padat dianggap noise.
Bisa; LogReg convex, gradient akan tetap mengarahkan ke minimum global meski mulai dari 0.
Berlekuk/Kompleks (Overfitting); Jangkauan sempit membuat model membentuk “pulau” kecil di sekitar setiap data latih.
Tidak Stabil; Variansi besar membuat koefisien berubah drastis dengan sedikit perubahan data.
Jawaban Soal 5 (Matriks Model)
Karakteristik KNN ID3/C4.5 SVM Argumentasi Instance-Based - - KNN menyimpan data mentah, SVM/DT membangun model abstrak. Model Geometris - KNN pakai jarak, SVM pakai hyperplane. DT pakai logika aturan. Rawan Outlier - - KNN (jika k kecil) dan SVM (jika C besar) sensitif. DT lebih robust. Rule IF-THEN - - Hanya Decision Tree yang outputnya eksplisit berupa aturan logika.