Problem Set: Geometry & Optimization Models

Mata Kuliah: Inteligensi Artifisial

Topik: Geometry & Optimization Models (Linear/Logistic Regression, SVM)

Sifat: Latihan Mandiri

BAGIAN I: Logistic Regression (Stochastic Gradient Ascent)

Soal 1: Update Bobot Iteratif

Diberikan dataset latih sederhana untuk klasifikasi biner ( $Y \in {0, 1}$ ) dengan dua fitur ( $x_{1}, x_{2}$ ) sebagai berikut:


No	x1	x2	Kelas (Y)
1	2	1	0
2	1	3	1
3	3	2	0
4	0	2	1

Lakukan pelatihan model Logistic Regression menggunakan algoritma Stochastic Gradient Ascent (SGA) dengan ketentuan:

Inisialisasi Bobot: $w = [w_{0}, w_{1}, w_{2}] = [0, 0, 0]$ . (Ingat $x_{0} = 1$ untuk bias).
Learning Rate ( $η$ ): 0.1
Fungsi Aktivasi: Sigmoid $σ (z) = \frac{1}{1 + e ^{- z}}$
Jumlah Epoch: 1 Epoch (Urutan data sesuai nomor: 1 $\to$ 2 $\to$ 3 $\to$ 4, diulang 2 kali).

Instruksi:

a. Lengkapi tabel perhitungan manual di bawah ini (tuliskan hingga 3 angka di belakang koma).

b. Lakukan Self-Evaluation pada akhir Epoch 2: Prediksi kembali label kelas data latih menggunakan bobot akhir (Threshold $0.5$ ).

c. Hitung Akurasi dan F1-Score (anggap Kelas 1 sebagai Positif).

Tabel Kerja (Epoch 1 & 2):


Epoch	Data Ke-	Input Augmented [1,x1,x2]	Target y	Logit z=wTx	Prediksi p=σ(z)	Error (y−p)	Update Δw=η(y−p)x	Bobot Baru wnew
1	1	$[1, 2, 1]$	0	0	0.5	-0.5	$[- 0.05, - 0.1, - 0.05]$	$[- 0.05, - 0.1, - 0.05]$
1	2	…	…	…	…	…	…	…
…	…	…	…	…	…	…	…	…

(Lanjutkan hingga data ke-4 pada Epoch 2)

BAGIAN II: Support Vector Machine (Analitik)

Soal 2: Penurunan SVM & Lagrange Multiplier

Diketahui 3 titik data berikut yang linearly separable:

Kelas Positif (+1): $A (3, 3)$ , $B (4, 3)$
Kelas Negatif (-1): $C (1, 1)$

Anda diminta mencari Optimal Separating Hyperplane dengan metode Lagrange Multiplier secara terpandu.

Instruksi:

Isilah langkah-langkah di bawah ini.

Langkah	Pertanyaan	Isian / Jawaban
1	Tuliskan fungsi Primal SVM (yang ingin diminimalkan) beserta constraint-nya.	Minimize: $\frac{1}{2} ∥ w ∥^{2}$ Subject to: $y (w \cdot x_{i} + b) \geq 1$
2	Tuliskan fungsi Dual SVM (yang ingin dimaksimalkan dalam $α$ ) beserta constraint $α$ .	Maximize: $L_{D} (α) = \sum α_{i} - \frac{1}{2} \sum_{i, j} α_{i} α_{j} y_{i} y_{j} (x_{i} \cdot x_{j})$ Subject to: $α_{i} \geq 0$ dan $\sum α_{i} y_{i} = 0$
3	Hitung nilai Dot Product $(x_{i} \cdot x_{j})$ untuk semua pasangan data (Gram Matrix).	$A \cdot A = 18$ , $A \cdot B = 21$ , $A \cdot C = 6$ $B \cdot B = \dots$ , $B \cdot C = \dots$ , $C \cdot C = \dots$
4	Susun persamaan dari turunan parsial Lagrange atau substitusi nilai ke fungsi Dual. (Asumsikan titik B bukan Support Vector, sehingga $α_{B} = 0$ ).	Persamaan kendala: $α_{A} (1) + α_{B} (1) + α_{C} (- 1) = 0 \Rightarrow α_{A} = α_{C} = α$ . Masukkan ke $L_{D} (α)$ dan sederhanakan dalam variabel $α$ .
5	Cari nilai $α$ optimal dengan menurunkan persamaan langkah 4 terhadap $α$ dan samakan dengan 0.	$\frac{\partial L _{D}}{\partial α} = 0 \Rightarrow α = \dots$
6	Hitung vektor bobot $w$ dari nilai $α$ yang didapat.	$w = \sum α_{i} y_{i} x_{i} = \dots$
7	Hitung bias $b$ menggunakan salah satu Support Vector.	$b = y_{s v} - w \cdot x_{s v} = \dots$

BAGIAN III: Konsep & Visualisasi

Soal 3: Non-Linear SVM & Kernel Trick

Bayangkan dataset 2D berbentuk “Cincin”: Kelas A berada di pusat (lingkaran kecil), dan Kelas B mengelilingi Kelas A (cincin luar). Dataset ini tidak bisa dipisahkan secara linear di 2D.

Tugas:

a. Gambarkan skema/arsitektur proses Kernel Trick. Skema harus menunjukkan alur dari:

Input Space (2D) $\to$ Feature Map Function $ϕ (x)$ $\to$ Feature Space (3D/High Dim) $\to$ Linear Hyperplane.

b. Jelaskan secara singkat mengapa kita menggunakan Kernel Function $K (x_{i}, x_{j})$ alih-alih menghitung transformasi $ϕ (x)$ secara eksplisit.

c. Sebutkan jenis Kernel yang paling cocok untuk kasus “Cincin” ini.

BAGIAN IV: Teori & Metrik Evaluasi

Soal 4: Analisis Metrik & Parameter

Isilah tabel berikut mengenai dampak parameter atau kondisi data terhadap model.


Kondisi / Parameter	Pada Model…	Dampak / Peran Utama	Alasan / Mekanisme
Adanya Outlier Ekstrem pada Data Training	Regresi Linear (Evaluasi MSE)	Nilai MSE akan (Meningkat Drastis / Sedikit Berubah)	Karena MSE menggunakan fungsi kuadrat $(y - \overset{y}{^})^{2}$ , sehingga error besar pada outlier akan…
Adanya Outlier Ekstrem pada Data Training	Regresi Linear (Evaluasi MAE)	Nilai MAE akan (Meningkat Drastis / Sedikit Berubah) dibanding MSE	Karena MAE menggunakan nilai absolut $
Parameter C bernilai Sangat Besar	SVM (Soft Margin)	Margin menjadi (Sempit / Lebar) dan risiko Overfitting (Naik / Turun)	Nilai C besar memberikan penalti/hukuman yang besar pada variabel… ( $ξ$ ), sehingga model memaksakan kebenaran klasifikasi.
Parameter Learning Rate ( $η$ ) terlalu kecil	Logistic Regression	Proses konvergensi menjadi (Cepat / Lambat)	Karena langkah update bobot $Δ w$ menjadi sangat kecil, sehingga butuh…

BAGIAN V: Matriks Karakteristik Model

Soal 5: Komparasi Model

Berikan tanda centang ( $✓$ ) jika model memiliki karakteristik tersebut, dan tuliskan Argumentasi Singkat di bawahnya mengapa model tersebut memilikinya/tidaknya.


Karakteristik	Linear Regression	Logistic Regression	Support Vector Machine (SVM)
Output berupa Probabilitas	…	…	…
Argumentasi:	(Contoh: Tidak, outputnya kontinu tanpa batas)
Memaksimalkan Margin	…	…	…
Argumentasi:
Menggunakan Least Square Error	…	…	…
Argumentasi:
Dapat menangani Non-Linearity dengan Kernel	…	…	…
Argumentasi:

# KUNCI JAWABAN

Jawaban Soal 1 (Logistic Regression)

a. Tabel Perhitungan (Ringkasan)

Inisialisasi: $w = [0, 0, 0]$

Epoch 1:

Data 1 (2,1 | 0): $z = 0$ , $p = 0.5$ , $err = - 0.5$ . $Δ w = 0.1 (- 0.5) [1, 2, 1] = [- 0.05, - 0.1, - 0.05]$ . $w_{ba r u} = [- 0.05, - 0.1, - 0.05]$ .

Data 2 (1,3 | 1): $z = - 0.05 (1) - 0.1 (1) - 0.05 (3) = - 0.3$ . $p \approx 0.426$ . $err = 0.574$ . $Δ w = [0.057, 0.057, 0.172]$ . $w_{ba r u} = [0.007, - 0.043, 0.122]$ .

Data 3 (3,2 | 0): $z = 0.007 (1) - 0.043 (3) + 0.122 (2) = 0.007 - 0.129 + 0.244 = 0.122$ . $p \approx 0.53$ . $err = - 0.53$ . $Δ w = [- 0.053, - 0.159, - 0.106]$ . $w_{ba r u} = [- 0.046, - 0.202, 0.016]$ .

Data 4 (0,2 | 1): $z = - 0.046 + 0.016 (2) = - 0.014$ . $p \approx 0.496$ . $err = 0.504$ . $Δ w = [0.050, 0, 0.101]$ . $w_{ba r u} = [0.004, - 0.202, 0.117]$ .

b. Self Evaluation (Pada Data Latih)

Model: $z = - 0.05 - 0.3 x_{1} + 0.3 x_{2}$

Data 1 (2,1): $z = - 0.05 - 0.6 + 0.3 = - 0.35$ . $p < 0.5 \to$ Prediksi 0. (Benar)

Data 2 (1,3): $z = - 0.05 - 0.3 + 0.9 = 0.55$ . $p > 0.5 \to$ Prediksi 1. (Benar)

Data 3 (3,2): $z = - 0.05 - 0.9 + 0.6 = - 0.35$ . $p < 0.5 \to$ Prediksi 0. (Benar)

Data 4 (0,2): $z = - 0.05 + 0.6 = 0.55$ . $p > 0.5 \to$ Prediksi 1. (Benar)

c. Metrik

TP (Kelas 1 Benar): 2

TN (Kelas 0 Benar): 2

FP: 0, FN: 0

Akurasi: $4/4 = 100%$

F1-Score: $1.0$

Jawaban Soal 2 (SVM)

Langkah Isian / Jawaban
3 $B \cdot B = 16 + 9 = 25$ , $B \cdot C = 4 + 3 = 7$ , $C \cdot C = 1 + 1 = 2$
4 Persamaan Dual: $L = (α_{A} + α_{C}) - \frac{1}{2} [α_{A}^{2} (18) + α_{C}^{2} (2) + 2 α_{A} α_{C} (- 1) (6)]$

Substitusi $α_{A} = α_{C} = α$ :

$L = 2 α - \frac{1}{2} [18 α^{2} + 2 α^{2} - 12 α^{2}] = 2 α - \frac{1}{2} (8 α^{2}) = 2 α - 4 α^{2}$
5 Turunan: $2 - 8 α = 0 \Rightarrow 8 α = 2 \Rightarrow α = 0.25$
6 $w = 0.25 (1) [3, 3] + 0.25 (- 1) [1, 1] = [0.75, 0.75] - [0.25, 0.25] = [0.5, 0.5]$
7 Pakai titik C(1,1) $y = - 1$ :

$b = - 1 - ([0.5, 0.5] \cdot [1, 1]) = - 1 - (0.5 + 0.5) = - 2$

Persamaan Hyperplane: $0.5 x_{1} + 0.5 x_{2} - 2 = 0$

Jawaban Soal 3 (Non-Linear SVM)

a. Skema:

Mahasiswa harus menggambar data 2D (input) masuk ke proses $ϕ$ (mapping) menjadi data 3D yang terpisah bidang datar, lalu dicari linear separator-nya.

b. Alasan Kernel Trick:

Menghitung transformasi $ϕ (x)$ ke dimensi tinggi sangat mahal secara komputasi (bahkan tak hingga). Kernel Trick memungkinkan kita menghitung dot product di dimensi tinggi $K (x, y) = ⟨ ϕ (x), ϕ (y)⟩$ langsung dari input aslinya tanpa perlu tahu koordinat transformasinya.

c. Jenis Kernel:

RBF (Radial Basis Function) atau Polynomial Kernel (derajat 2).

Jawaban Soal 4 (Teori)

Meningkat Drastis; mengkuadratkan error (hukuman berat untuk outlier).

Sedikit Berubah (Lebih Robust); error linear tidak membesar secara eksponensial.

Sempit; Naik (Overfitting); variabel Slack ( $ξ$ ).

Lambat; butuh banyak iterasi untuk mencapai minimum.

Jawaban Soal 5 (Matriks Model)

Karakteristik LogReg SVM Argumentasi
Output Probabilitas $✓$ - LogReg menggunakan Sigmoid menghasilkan nilai 0-1 (probabilitas). SVM outputnya adalah jarak/skor (kecuali dikalibrasi).
Max Margin - $✓$ Ini adalah objective function utama SVM. LogReg memaksimalkan Likelihood.
Least Square Error - - LinReg pakai LSE. LogReg pakai Log-Loss/MLE. SVM pakai Hinge Loss.
Kernel Trick - $✓$ SVM mempermudah penggunaan Kernel lewat Dual Form. LogReg bisa tapi sangat jarang/mahal.

IF Notes

Explorer

Latihan UAS IF3170-2 Bagian II

Problem Set: Geometry & Optimization Models

BAGIAN I: Logistic Regression (Stochastic Gradient Ascent)

BAGIAN II: Support Vector Machine (Analitik)

BAGIAN III: Konsep & Visualisasi

BAGIAN IV: Teori & Metrik Evaluasi

BAGIAN V: Matriks Karakteristik Model

Jawaban Soal 1 (Logistic Regression)

Jawaban Soal 2 (SVM)

Jawaban Soal 3 (Non-Linear SVM)

Jawaban Soal 4 (Teori)

Jawaban Soal 5 (Matriks Model)

Graph View

Table of Contents

Backlinks


Langkah	Isian / Jawaban
3	$B \cdot B = 16 + 9 = 25$ , $B \cdot C = 4 + 3 = 7$ , $C \cdot C = 1 + 1 = 2$
4	Persamaan Dual: $L = (α_{A} + α_{C}) - \frac{1}{2} [α_{A}^{2} (18) + α_{C}^{2} (2) + 2 α_{A} α_{C} (- 1) (6)]$ Substitusi $α_{A} = α_{C} = α$ : $L = 2 α - \frac{1}{2} [18 α^{2} + 2 α^{2} - 12 α^{2}] = 2 α - \frac{1}{2} (8 α^{2}) = 2 α - 4 α^{2}$
5	Turunan: $2 - 8 α = 0 \Rightarrow 8 α = 2 \Rightarrow α = 0.25$
6	$w = 0.25 (1) [3, 3] + 0.25 (- 1) [1, 1] = [0.75, 0.75] - [0.25, 0.25] = [0.5, 0.5]$
7	Pakai titik C(1,1) $y = - 1$ : $b = - 1 - ([0.5, 0.5] \cdot [1, 1]) = - 1 - (0.5 + 0.5) = - 2$


Karakteristik	LogReg	SVM	Argumentasi
Output Probabilitas	$✓$	-	LogReg menggunakan Sigmoid menghasilkan nilai 0-1 (probabilitas). SVM outputnya adalah jarak/skor (kecuali dikalibrasi).
Max Margin	-	$✓$	Ini adalah objective function utama SVM. LogReg memaksimalkan Likelihood.
Least Square Error	-	-	LinReg pakai LSE. LogReg pakai Log-Loss/MLE. SVM pakai Hinge Loss.
Kernel Trick	-	$✓$	SVM mempermudah penggunaan Kernel lewat Dual Form. LogReg bisa tapi sangat jarang/mahal.