Back to IF3170 Inteligensi Artifisial
Overview
-
1
-
2
-
3
-
4
-
Pendalaman SVM
Susunan (Perkiraan)
BAGIAN 1: Probabilistic & Tree-Based Models
Fokus: Model berbasis logika diskrit, pohon keputusan, dan probabilitas.
Topik:
-
Naive Bayes Classifier (Konsep & Hitungan Manual)
-
Bayesian Networks (BN) (Struktur, D-Separation, Inferensi)
-
Decision Tree Learning (DTL) (ID3, Entropy, Information Gain, Pruning)
Struktur & Pasangan Topik-Soal:
-
Studi Kasus (Hitungan Berat): Naive Bayes Prediction.
- Diberikan data latih kecil (kategorikal). Mahasiswa diminta menghitung probabilitas posterior langkah demi langkah untuk satu data uji.
-
Studi Kasus Multi-Bagian: DTL Construction.
-
Diberikan tabel data sederhana.
-
Sub-soal a: Hitung Entropy awal sistem.
-
Sub-soal b: Hitung Information Gain untuk menentukan Root Node terbaik.
-
-
Diagramming/Visualisasi: Bayesian Network Analysis.
- Diberikan gambar graf BN. Mahasiswa diminta menentukan apakah node A dan B independen (D-Separation) jika node C diketahui (shaded).
-
Tabel Analisis/Komparatif: Isu DTL (Overfitting).
- Membandingkan strategi Pre-pruning vs Post-pruning (Reduced Error Pruning vs Rule Post-Pruning) dalam tabel kelebihan dan kekurangan.
-
Benar/Salah (dengan Alasan): Konsep Probabilitas.
- Pernyataan tentang asumsi “Naive” pada Naive Bayes atau tentang Explaining Away pada BN.
BAGIAN 2: Geometry & Optimization Models
Fokus: Model yang bekerja di ruang vektor kontinu, menggunakan hyperplane, dan optimasi gradien.
Topik:
-
Regresi Linear & Logistik (Konsep, SGD, Fungsi Sigmoid)
-
Support Vector Machine (SVM) (Margin, Kernel, Support Vectors)
Struktur & Pasangan Topik-Soal:
-
Studi Kasus (Hitungan Berat - Iteratif): Update Bobot Regresi Logistik.
- Diberikan 1 data latih , bobot awal , dan learning rate . Mahasiswa menghitung prediksi , error, dan nilai bobot baru menggunakan Stochastic Gradient Ascent (SGA) untuk 1 iterasi.
-
Studi Kasus Multi-Bagian: SVM Hyperplane & Margin.
-
Diberikan 3 titik data pada koordinat 2D (misal: 2 positif, 1 negatif).
-
Sub-soal a: Identifikasi mana yang menjadi Support Vector.
-
Sub-soal b: Tentukan persamaan garis pemisah (hyperplane) optimal.
-
-
Diagramming/Visualisasi: SVM Non-Linear & Kernel.
- Diberikan gambar data yang tidak terpisah secara linear (misal: cincin). Mahasiswa diminta menggambarkan ide transformasi ke dimensi tinggi atau memilih Kernel yang tepat (RBF/Poly).
-
Isian Singkat Terstruktur: Linear Regression Metrics.
- Mengisi dampak pada metrik MSE dan MAE jika terdapat outlier ekstrem pada data regresi.
-
Pilihan Ganda (Matrix): Karakteristik Model.
- Mencocokkan karakteristik (misal: “Output Probabilitas”, “Margin Maksimal”, “Least Square Error”) ke model yang tepat (LogReg, SVM, LinReg).
BAGIAN 3: Unsupervised Learning & Evaluation
Fokus: Pengelompokan data tanpa label dan cara validasi/evaluasi seluruh jenis model.
Topik:
-
Clustering (K-Means, DBSCAN, Evaluasi Cluster)
-
Pengukuran Kinerja & Validasi (Confusion Matrix, ROC, K-Fold, McNemar)
Struktur & Pasangan Topik-Soal:
-
Studi Kasus Multi-Bagian: Simulasi K-Means.
-
Diberikan 8 data dengan 4 fitur (2 kategorikal dan 2 numerikal). 2 data diantaranya adalah 2 centroid awal.
-
Sub-soal a: Tentukan cluster data dengan K-Means, constraint berhenti yang dapat dipilih: 1) Max dist dari cluster < x (sebuah jarak), 2) Max iterasi pencarian centroid sejumlah n, atau 3) Centroid konvergen (tidak berubah lagi dari centroid awal)
-
Sub-soal b: Prediksikan data ke sebuah cluster
-
Sub-soal c: Abaikan centroid awal, pilih k terbaik dengan elbow method. Tentukan clusterisasi K-meansnya lagi.
-
-
Studi Kasus (Hitungan): Simulasi DBScan.
-
Diberikan data yang sama dengan Studi kasus 1
-
Mahasiswa diminta membuat matriks jarak berdasarkan 2 fitur numerikal, kemudian membuat clusterisasinya
-
-
Diagramming/Visualisasi (Modifikasi): DBSCAN Density.
- Diberikan sekumpulan titik. Mahasiswa diminta melingkari titik mana yang berstatus Core, Border, dan Noise berdasarkan parameter Epsilon & MinPts tertentu.
-
Tabel Analisis/Komparatif: Skema Validasi.
- Membandingkan Hold-out Validation, K-Fold Cross Validation, dan Bootstrapping berdasarkan skenario ukuran data (Data Kecil vs Data Besar).
-
Benar/Salah (dengan Alasan): Evaluasi Cluster.
- Pernyataan tentang interpretasi Silhouette Coefficient atau kelemahan Purity dalam evaluasi clustering.