Back to IF3170 Inteligensi Artifisial

Overview


Susunan (Perkiraan)

BAGIAN 1: Probabilistic & Tree-Based Models

Fokus: Model berbasis logika diskrit, pohon keputusan, dan probabilitas.

Topik:

  • Naive Bayes Classifier (Konsep & Hitungan Manual)

  • Bayesian Networks (BN) (Struktur, D-Separation, Inferensi)

  • Decision Tree Learning (DTL) (ID3, Entropy, Information Gain, Pruning)

Struktur & Pasangan Topik-Soal:

  1. Studi Kasus (Hitungan Berat): Naive Bayes Prediction.

    • Diberikan data latih kecil (kategorikal). Mahasiswa diminta menghitung probabilitas posterior langkah demi langkah untuk satu data uji.
  2. Studi Kasus Multi-Bagian: DTL Construction.

    • Diberikan tabel data sederhana.

    • Sub-soal a: Hitung Entropy awal sistem.

    • Sub-soal b: Hitung Information Gain untuk menentukan Root Node terbaik.

  3. Diagramming/Visualisasi: Bayesian Network Analysis.

    • Diberikan gambar graf BN. Mahasiswa diminta menentukan apakah node A dan B independen (D-Separation) jika node C diketahui (shaded).
  4. Tabel Analisis/Komparatif: Isu DTL (Overfitting).

    • Membandingkan strategi Pre-pruning vs Post-pruning (Reduced Error Pruning vs Rule Post-Pruning) dalam tabel kelebihan dan kekurangan.
  5. Benar/Salah (dengan Alasan): Konsep Probabilitas.

    • Pernyataan tentang asumsi “Naive” pada Naive Bayes atau tentang Explaining Away pada BN.

BAGIAN 2: Geometry & Optimization Models

Fokus: Model yang bekerja di ruang vektor kontinu, menggunakan hyperplane, dan optimasi gradien.

Topik:

  • Regresi Linear & Logistik (Konsep, SGD, Fungsi Sigmoid)

  • Support Vector Machine (SVM) (Margin, Kernel, Support Vectors)

Struktur & Pasangan Topik-Soal:

  1. Studi Kasus (Hitungan Berat - Iteratif): Update Bobot Regresi Logistik.

    • Diberikan 1 data latih , bobot awal , dan learning rate . Mahasiswa menghitung prediksi , error, dan nilai bobot baru menggunakan Stochastic Gradient Ascent (SGA) untuk 1 iterasi.
  2. Studi Kasus Multi-Bagian: SVM Hyperplane & Margin.

    • Diberikan 3 titik data pada koordinat 2D (misal: 2 positif, 1 negatif).

    • Sub-soal a: Identifikasi mana yang menjadi Support Vector.

    • Sub-soal b: Tentukan persamaan garis pemisah (hyperplane) optimal.

  3. Diagramming/Visualisasi: SVM Non-Linear & Kernel.

    • Diberikan gambar data yang tidak terpisah secara linear (misal: cincin). Mahasiswa diminta menggambarkan ide transformasi ke dimensi tinggi atau memilih Kernel yang tepat (RBF/Poly).
  4. Isian Singkat Terstruktur: Linear Regression Metrics.

    • Mengisi dampak pada metrik MSE dan MAE jika terdapat outlier ekstrem pada data regresi.
  5. Pilihan Ganda (Matrix): Karakteristik Model.

    • Mencocokkan karakteristik (misal: “Output Probabilitas”, “Margin Maksimal”, “Least Square Error”) ke model yang tepat (LogReg, SVM, LinReg).

BAGIAN 3: Unsupervised Learning & Evaluation

Fokus: Pengelompokan data tanpa label dan cara validasi/evaluasi seluruh jenis model.

Topik:

  • Clustering (K-Means, DBSCAN, Evaluasi Cluster)

  • Pengukuran Kinerja & Validasi (Confusion Matrix, ROC, K-Fold, McNemar)

Struktur & Pasangan Topik-Soal:

  1. Studi Kasus Multi-Bagian: Simulasi K-Means.

    • Diberikan 8 data dengan 4 fitur (2 kategorikal dan 2 numerikal). 2 data diantaranya adalah 2 centroid awal.

    • Sub-soal a: Tentukan cluster data dengan K-Means, constraint berhenti yang dapat dipilih: 1) Max dist dari cluster < x (sebuah jarak), 2) Max iterasi pencarian centroid sejumlah n, atau 3) Centroid konvergen (tidak berubah lagi dari centroid awal)

    • Sub-soal b: Prediksikan data ke sebuah cluster

    • Sub-soal c: Abaikan centroid awal, pilih k terbaik dengan elbow method. Tentukan clusterisasi K-meansnya lagi.

  2. Studi Kasus (Hitungan): Simulasi DBScan.

    • Diberikan data yang sama dengan Studi kasus 1

    • Mahasiswa diminta membuat matriks jarak berdasarkan 2 fitur numerikal, kemudian membuat clusterisasinya

  3. Diagramming/Visualisasi (Modifikasi): DBSCAN Density.

    • Diberikan sekumpulan titik. Mahasiswa diminta melingkari titik mana yang berstatus Core, Border, dan Noise berdasarkan parameter Epsilon & MinPts tertentu.
  4. Tabel Analisis/Komparatif: Skema Validasi.

    • Membandingkan Hold-out Validation, K-Fold Cross Validation, dan Bootstrapping berdasarkan skenario ukuran data (Data Kecil vs Data Besar).
  5. Benar/Salah (dengan Alasan): Evaluasi Cluster.

    • Pernyataan tentang interpretasi Silhouette Coefficient atau kelemahan Purity dalam evaluasi clustering.