Back to Latihan UAS IF3170
Problem Set Paket B: Support Vector Machine
Mata Pelajaran: nteligensi Artifisial
Topik: SVM Selection Strategy & Kernel Trick Analysis
Estimasi Waktu: 60 menit
Total Nilai: 100 poin
Tujuan Pembelajaran
Setelah menyelesaikan problem set ini, mahasiswa diharapkan dapat:
-
Mengidentifikasi kandidat Support Vector (SV) dari sekumpulan data sebelum melakukan perhitungan.
-
Menyelesaikan masalah optimasi SVM Linear menggunakan Sistem Persamaan Linear (SPL) pada titik yang relevan.
-
Memilih fungsi Kernel yang tepat berdasarkan karakteristik distribusi data (Linear, Polynomial, RBF, Sigmoid).
-
Menerapkan perhitungan manual Kernel Trick untuk transformasi data non-linear.
Petunjuk Umum
-
Paket B ini memiliki tingkat kesulitan lebih tinggi dari Paket A karena Anda harus menentukan sendiri titik mana yang menjadi Support Vector.
-
Gunakan intuisi visual atau perhitungan jarak Euclidean sederhana untuk memfilter data sebelum masuk ke perhitungan matriks yang rumit.
-
Format pengerjaan tetap menggunakan tabel terpandu (Guided Discovery).
BAGIAN I: SVM Linear (Support Vector Identification)
Bobot: 50 Poin Fokus: Efisiensi komputasi dengan memilih hanya titik yang relevan (Support Vectors) sebelum menyusun SPL.
Soal 1. Seleksi & Optimasi
Diketahui dataset 2D dengan 4 titik sebagai berikut:
- Kelas Negatif (-1):
-
- Kelas Positif (+1):
-
Tugas Anda adalah mencari Optimal Separating Hyperplane. Jangan gunakan semua titik! Identifikasi dulu mana yang berada di “garis depan”.
| Langkah | Instruksi/Pertanyaan | Isian / Jawaban |
| 1 | Identifikasi Support Vector (Visual/Logika) Support Vector adalah titik terluar dari kelasnya yang paling dekat dengan kelas lawan. Hitung jarak antar pasangan terdekat (misal ke , ke , dll) atau gambar sketsa kasar. Titik mana saja yang PASTI BUKAN Support Vector? Jelaskan alasannya. | Titik yang dibuang: 1. (Alasan: Terhalang oleh titik ) 2. (Alasan: Jaraknya lebih jauh dari ) Sisa Kandidat Support Vector: 1. 2. |
| 2 | Susun SPL untuk Kandidat SV Hanya gunakan titik kandidat dari Langkah 1. Gunakan rumus: Susun persamaannya. | Persamaan 1 (untuk ): Persamaan 2 (untuk ): |
| 3 | Persamaan Constraint Tuliskan syarat untuk kandidat SV yang tersisa. | Sehingga: |
| 4 | Selesaikan SPL Substitusi hasil Langkah 3 ke Langkah 2 untuk mencari nilai dan . | Dari Persamaan Constraint, kita tahu hubungan dan . Substitusi ke Persamaan 1: Hasil Akhir: |
| 5 | Verifikasi Titik Non-SV Anda membuang beberapa titik di Langkah 1. Buktikan keputusan itu benar dengan menguji titik tersebut ke fungsi . Apakah hasilnya memenuhi syarat (Zona Aman)? | Fungsi Keputusan: Uji Titik : Apakah ? (Ya/Tidak) Uji Titik : Apakah ? (Ya/Tidak) |
BAGIAN II: SVM Non-Linear (Kernel Strategy)
Bobot: 50 Poin Fokus: Memilih kernel yang tepat berdasarkan bentuk data dan menghitung transformasinya.
Soal 2. Analisis Kernel & Perhitungan
Terdapat 4 jenis Kernel utama: Linear, Polynomial, RBF (Gaussian), dan Sigmoid. Anda diberikan kasus data 1D sebagai berikut:
-
Kelas Positif (+1): Data tersebar di area ekstrem:
-
Kelas Negatif (-1): Data berkumpul di tengah:
| Langkah | Instruksi/Pertanyaan | Isian / Jawaban |
| 1 | Pemilihan Kernel Jika data memiliki pola “Cincin” atau “Terpisah di tengah” (non-linear), kernel mana yang paling efektif untuk memisahkannya? Pilih antara Polynomial atau Linear. Jelaskan alasannya. | Pilihan: Alasan: Kernel Linear hanya bisa membuat batas berupa , sedangkan data ini membutuhkan batas berupa |
| 2 | Simulasi Kernel Polynomial Kita pilih Kernel Polynomial derajat 2 dengan rumus lengkap: Hitung nilai Kernel untuk pasangan: - - - | |
| 3 | Analisis Dimensi Fitur () Jika , maka pemetaan fiturnya adalah . Hitung koordinat baru untuk titik dan di dimensi 3D ini. | Untuk : Untuk : |
| 4 | Hitung Jarak di Feature Space Hitung jarak Euclidean antara titik dan SETELAH ditransformasi (menggunakan hasil Langkah 3). | |
| 5 | Interpretasi Bandingkan jarak di dimensi asli (1D) vs dimensi fitur (3D). Apa efek kernel terhadap keterpisahan data ini? | Jarak Asli: |
Bagian I: SVM Linear (Seleksi)
Langkah Jawaban Kunci Poin 1 Dibuang: (dibelakang ) dan (dibelakang ).
Sisa SV: dan .10 2 ; ; .
(1)
(2)10 3 5 4 Substitusi ke persamaan:
(1)
(2)
Kurangi (2)-(1): .
Cari b: .15 5 .
.
Uji : . Kelas -1. Benar ($-2 Bagian II: SVM Non-Linear
Langkah Jawaban Kunci Poin 1 Polynomial. Karena data -1 diapit oleh data +1. Linear hanya bisa membuat satu garis potong, tidak bisa memisahkan “tengah” dari “pinggir”. 5 2 .
.10 3 .
.15 4
.10 5 Jarak membesar drastis dari 3 menjadi ~9.95. Kernel “melempar” titik ekstrem jauh dari titik tengah, memudahkan pemisahan. 10
Tips Pengerjaan
-
Filter Data: Jangan buang waktu menghitung persamaan untuk titik yang jelas-jelas ada di “belakang”. Titik pasti aman jika saja sudah jadi batas.
-
Rumus Kernel: Perhatikan rumus yang diberikan di soal. Kadang ada tambahan konstanta bias . Jangan terpaku pada saja.
-
Dimensi Fitur: Jika diminta menghitung , lihat koefisien hasil penjabaran aljabar .
-
.
-
Bagian variabel : .
-
Bagian variabel (fitur): . (Koefisien 2 dipecah jadi agar sesuai dot product vector).
-
Red Flags 🚩
-
❌ Menggunakan semua 4 titik untuk SPL: Anda akan memiliki lebih banyak persamaan daripada variabel, atau sistem menjadi tidak konsisten tanpa Slack Variable.
-
❌ Salah menghitung kuadrat Kernel: Ingat urutan operasi: Kalikan dulu (dot product), tambah 1, baru dikuadratkan.