Back to Latihan UAS IF3170
Problem Set: Support Vector Machine
Mata Pelajaran: Machine Learning / Inteligensi Artifisial
Topik: Advanced SV Selection & Multi-class Strategies (OvR vs OvO)
Estimasi Waktu: 75-90 menit
Total Nilai: 100 poin
Tujuan Pembelajaran
Setelah menyelesaikan problem set ini, mahasiswa diharapkan dapat:
-
Menganalisis dataset yang lebih padat (8 titik) untuk mengidentifikasi boundary dan menyingkirkan redundant data sebelum perhitungan.
-
Menyelesaikan SPL dengan 3 variabel (kasus 3 Support Vector) secara manual.
-
Menerapkan dan membandingkan strategi One-vs-Rest (OvR) dan One-vs-One (OvO) untuk klasifikasi multi-kelas.
-
Mengevaluasi kelebihan dan kekurangan masing-masing strategi multi-kelas dalam konteks komputasi dan keseimbangan data.
Petunjuk Umum
-
Anda dituntut untuk memiliki intuisi visual yang kuat sebelum melakukan perhitungan.
-
Pada Nomor 2, Anda tidak diminta menghitung nilai detail, melainkan menyusun arsitektur dan logika keputusan sistem Multi-class.
BAGIAN I: Linear SVM dengan Seleksi Data Masif
Bobot: 50 Poin Fokus: Efisiensi seleksi data. Dari banyak data, hanya sedikit yang berguna (Sparsity of SVM).
Soal 1. Finding the “Golden Three”
Diketahui dataset 2D dengan 8 titik data sebagai berikut:
| Kelas Negatif (-1) | Kelas Positif (+1) |
Tugas Anda adalah menemukan Optimal Separating Hyperplane. Jangan hitung semua! Temukan 3 titik kuncinya (2 dari satu kelas, 1 dari kelas lain) yang menjepit batas.
| Langkah | Instruksi/Pertanyaan | Isian / Jawaban |
| 1 | Visualisasi & Eliminasi (Mental Sandbox) Bayangkan atau sketsa posisi titik-titik tersebut. 1. Identifikasi “Garis Depan” kelas Positif (titik yang paling bawah/dekat dengan negatif). 2. Identifikasi “Garis Depan” kelas Negatif (titik yang paling atas/dekat dengan positif). Sebutkan 3 titik yang menjadi kandidat kuat Support Vector (SV). | Titik Positif Terdepan: 1. 2. (Ada 2 titik sejajar paling bawah di kelas +1) Titik Negatif Terdepan: 1. (Titik paling atas di kelas -1) Kandidat SV: |
| 2 | Formulasi SPL (3 Variabel) Gunakan 3 kandidat SV dari Langkah 1. Rumus: Susun 3 persamaan linear untuk masing-masing titik . | Persamaan 1 (SV Positif A): Persamaan 2 (SV Positif B): Persamaan 3 (SV Negatif): |
| 3 | Persamaan Constraint Syarat . | Hubungan yang didapat: |
| 4 | Solusi SPL Gunakan teknik eliminasi/substitusi. Hint: Kurangi Persamaan 1 dengan Persamaan 2 untuk melihat hubungan dan . | 1. 2. Substitusi ke Constraint: 3. Masukkan semua ke salah satu persamaan awal untuk cari . Hasil: |
| 5 | Analisis Hasil () Hitung dan jelaskan bentuk garis pemisahnya. Apakah garisnya horizontal, vertikal, atau miring? | Persamaan garis: Bentuk Garis: (Horizontal/Vertikal/Miring) |
BAGIAN II: Multi-class SVM Strategies
Bobot: 50 Poin Fokus: Perancangan arsitektur klasifikasi untuk data > 2 kelas (Apel, Jeruk, Mangga).
Soal 2. One-vs-Rest (OvR) vs One-vs-One (OvO)
Kita memiliki dataset dengan 3 Kelas:
-
Kelas A (Apel)
-
Kelas B (Batu)
-
Kelas C (Cacing)
Anda diminta merancang sistem klasifikasi menggunakan SVM.
| Langkah | Instruksi/Pertanyaan | Isian / Jawaban |
| 1 | Skenario One-vs-Rest (OvR) Strategi ini melatih 1 model per kelas. Tuliskan daftar model (Binary Classifier) yang harus dilatih dan apa yang dipisahkan oleh masing-masing model. | Model 1: Melatih Kelas A vs Kelas (B + C) Model 2: Melatih Kelas vs Kelas Model 3: Melatih Kelas vs Kelas Total Model: buah. |
| 2 | Keputusan OvR Misalkan ada data baru . Output skor () dari ketiga model adalah: - Model A: - Model B: - Model C: Kelas mana yang dipilih? Jelaskan mekanismenya. | Kelas Pemenang: Alasan: (Jelaskan konsep Confidence Score / Max Wins pada OvR) |
| 3 | Skenario One-vs-One (OvO) Strategi ini melatih model untuk setiap pasangan kelas. Tuliskan daftar model yang harus dilatih. | Model 1: Kelas A vs Kelas B Model 2: Kelas vs Kelas Model 3: Kelas vs Kelas Total Model: buah. |
| 4 | Keputusan OvO (Voting) Misalkan data baru diuji: - Model (A vs B) A menang - Model (A vs C) C menang - Model (B vs C) B menang Siapa pemenangnya? Jelaskan masalah yang mungkin timbul di sini. | Hasil Voting: A: 1 poin B: poin C: poin Masalah: Terjadi kondisi . Bagaimana cara SVM menyelesaikannya? (Sebutkan satu cara, misal: confidence sum atau DAG). |
| 5 | Analisis Komparatif (Final) Bandingkan kedua strategi ini. Kapan harus pakai OvR, kapan OvO? Isi tabel perbandingan di samping. |
Tabel Langkah 5: Perbandingan Strategi
| Fitur | One-vs-Rest (OvR) | One-vs-One (OvO) |
|---|---|---|
| Jumlah Model (untuk kelas) | ||
| Ukuran Data Training per Model | ||
| Masalah Imbalanced Data | ||
| Waktu Training | ||
| Rekomendasi Penggunaan |
Bagian I: Linear SVM (8 Titik)
Langkah Jawaban Kunci Poin 1 Visualisasi:
Kelas +1 ada di atas (). Garis depannya adalah dan . ( di belakang).
Kelas -1 ada di bawah (). Garis depannya adalah . ( di belakang).
SV: , , .10 2 Dot Product:
, ,
, ,
Persamaan (dengan ):
(1)
(2)
(3)15 3 5 4 Kurangi (2)-(1): .
Substitusi ke hasil di atas:
.
Maka . Substitusi semua ke (1):
Substitusi ke (3):
Solusi: .
.
, .15 5
.
Analisis: Vektor bobot berarti garis normal ke atas.
Garis pemisah: .
Bentuk: Horizontal. Memisahkan dan tepat di tengah ().5 Bagian II: Multi-class SVM
Langkah Jawaban Kunci Poin 1 Model 2: B vs (A+C); Model 3: C vs (A+B). Total 3 Model (sama dengan jumlah kelas ). 5 2 Kelas A. Karena memiliki nilai confidence score paling tinggi/positif (0.8). OvR memilih model yang paling “yakin” bahwa data tersebut adalah miliknya. 10 3 Model 2: A vs C; Model 3: B vs C. Total 3 Model (Rumus ). 5 4 Hasil Voting: A=1, B=1, C=1. Masalah: Seri (Tie).
Solusi: Menggunakan nilai probabilitas/confidence dari masing-masing duel untuk pembobotan, atau menggunakan struktur DAG (Directed Acyclic Graph).10 5 Jumlah Model: OvR = ; OvO = .
Masalah Imbalance: OvR Rentan; OvO Lebih Stabil.
Waktu Training: OvR Lambat (Data besar); OvO Cepat (Data terpecah).
Rekomendasi: OvR untuk Linear/Simple; OvO untuk Kernel/Complex (default LibSVM/Sklearn).20
Tips Pengerjaan Paket C
-
Jangan Terjebak Noise: Titik seperti atau di soal nomor 1 sengaja diletakkan jauh dari perbatasan. Jika Anda memasukkan mereka ke perhitungan SPL, Anda hanya akan mempersulit diri sendiri. Support Vector selalu berada di “barisan terdepan” pertempuran antar kelas.
-
Cek Logika : Di Soal 1, karena datanya simetris kiri-kanan (pusat di ) tapi terpisah atas-bawah, maka wajar jika hanya punya komponen (komponen nol). Garisnya mendatar.
-
Hafalan Multi-class:
-
OvR (One-vs-Rest): “Saya lawan Dunia”. (Rentan depresi/imbalance).
-
OvO (One-vs-One): “Turnamen Duel”. (Adil, tapi banyak pertandingan).
-
Red Flags 🚩
-
❌ Salah identifikasi SV: Jika Anda memilih titik sebagai SV, hasil nanti akan negatif (melanggar syarat SVM) atau SPL tidak konsisten.
-
❌ Menjumlahkan Model OvO: Jangan bilang “Model A vs B ditambah Model B vs C”. Model SVM berdiri sendiri-sendiri, keputusannya digabung lewat Voting.