Back to IF3170 Inteligensi Artifisial

Problem Set Regresi & Pelatihan: Lanjutan

Estimasi Waktu: 100 - 120 menit

Tujuan Pembelajaran:

  1. Mampu membedakan fungsi biaya dan metode optimasi untuk Regresi Linear (LSE) dan Regresi Logistik (MLE).
  2. Mampu menghitung parameter Regresi Linear (, ) menggunakan metode LSE.
  3. Mampu mensimulasikan proses pelatihan Regresi Logistik menggunakan Stochastic Gradient Ascent (SGA).
  4. Mampu menginterpretasikan koefisien model dan konsep inti (Log-Odds, Hyperplane, R2-Score).

Bagian I: Teori dan Konsep (15 Soal)

A. True/False (5 Soal)

Instruksi: Tentukan apakah pernyataan berikut Benar (True) atau Salah (False) dan jelaskan secara singkat alasannya.

No.PernyataanJawaban (T/F)
I.1Metode Least Square Estimator (LSE) digunakan untuk melatih Regresi Logistik dengan cara memaksimalkan Sum of Squared Errors (SSE).
I.2Stochastic Gradient Ascent (SGA) disebut “Ascent” (Naik) karena tujuannya adalah memaksimalkan Log Conditional Likeliood (LCL), bukan meminimalkan error.
I.3Output dari Regresi Linear adalah probabilitas (nilai antara 0 dan 1), sedangkan output dari fungsi Sigmoid (Regresi Logistik) adalah nilai kontinu (bisa 0 atau 1).
I.4Dalam Regresi Logistik, Hyperplane () adalah permukaan keputusan di mana model memprediksi probabilitas tepat 0.5.
I.5Metrik R2-Score adalah ukuran evaluasi utama untuk Regresi Logistik, yang mengukur seberapa banyak variasi log-odds yang dapat dijelaskan oleh model.

B. Multiple Choice Multiple Answer (MCMA) (5 Soal)

Instruksi: Pilih minimal dua (2) jawaban yang paling tepat.

I.6. (Karakteristik Regresi Linear)

Pilih tiga (3) pernyataan yang paling tepat mendeskripsikan Regresi Linear Sederhana (SLR).

A. Menggunakan Maximum Likelihood Estimator (MLE) sebagai cost function. B. Bertujuan meminimalkan Sum of Squares of the Residuals (SSE). C. Koefisien (slope) dapat dihitung menggunakan . D. Menggunakan fungsi Sigmoid untuk membatasi output prediksi. E. Dievaluasi menggunakan metrik seperti Mean Absolute Error (MAE) dan R2-Score.

I.7. (Konsep Regresi Logistik)

Pilih tiga (3) konsep inti dari Regresi Logistik.

A. Model ini secara fundamental memodelkan Log-Odds (Logit) sebagai kombinasi linear dari fitur-fitur input. B. Decision Surface yang memisahkan kelas-kelas adalah sebuah Hyperplane. C. Menggunakan Least Square Estimator (LSE) untuk menemukan parameter terbaik. D. Fungsi Sigmoid () digunakan untuk mengubah output linear () menjadi probabilitas. E. Koefisien berarti “setiap kenaikan 1 unit akan menaikkan probabilitas sebesar “.

I.8. (Pelatihan Regresi Logistik - SGA)

Pilih tiga (3) pernyataan yang benar mengenai Stochastic Gradient Ascent (SGA).

A. SGA memperbarui bobot setelah menghitung error dari satu epoch penuh (seluruh data). B. (learning rate) adalah parameter yang mengontrol seberapa besar langkah pembaruan bobot pada setiap iterasi. C. Aturan pembaruan menggunakan error sebagai sinyal untuk koreksi. D. SGA lebih cepat per iterasinya dibandingkan Batch Gradient Ascent karena hanya menggunakan satu data acak. E. SGA dijamin menemukan global maximum LCL dalam satu epoch.

I.9. (Interpretasi Koefisien)

Manakah dua (2) interpretasi koefisien () yang benar?

A. Regresi Linear: berarti kenaikan 1 unit akan menaikkan nilai sebesar 0.5 unit. B. Regresi Linear: berarti kenaikan 1 unit akan menaikkan log-odds sebesar 0.5. C. Regresi Logistik: berarti kenaikan 1 unit akan menaikkan log-odds (Logit) dari sebesar 0.5. D. Regresi Logistik: berarti kenaikan 1 unit akan menaikkan probabilitas sebesar 0.5.

I.10. (LSE vs MLE)

Pilih dua (2) perbedaan fundamental antara LSE dan MLE.

A. LSE bertujuan meminimalkan SSE (Error Kuadrat). B. LSE bertujuan memaksimalkan SSE (Error Kuadrat). C. MLE bertujuan meminimalkan LCL (Log-Likelihood). D. MLE bertujuan memaksimalkan LCL (Log-Likelihood).

C. Matching (5 Soal)

Instruksi: Pasangkan istilah di Kiri dengan definisi atau formula terbaik di Kanan.

IstilahKonsep Kritis Regresi
I.11. LSE (Least Square Est.)
I.12. MLE (Max Likelihood Est.)
I.13. Logit (Log-Odds)
I.14. Sigmoid Function
I.15. Hyperplane

Bagian II: Perhitungan dan Analisis Kasus (15 Soal)

D. Perhitungan Regresi Linear (LSE) (4 Soal)

Diberikan 4 data latih untuk memprediksi Harga (Y) berdasarkan Ukuran (X).

No.Ukuran (X)Harga (Y)
1109
22011
33015
44017

II.1. Hitunglah nilai rata-rata (Mean X) dan (Mean Y).

II.2. Hitunglah koefisien (slope) menggunakan formula LSE: .

II.3. Hitunglah koefisien (intercept) menggunakan formula .

II.4. Tuliskan hipotesis (model regresi) dan hitung Mean Absolute Error (MAE) dari model Anda pada data latih.

E. Simulasi Pelatihan Regresi Logistik (SGA) (6 Soal)

Diberikan 1 data latih dan 1 data latih kedua.

  • Data 1: , (Kelas Positif). (Angka ‘1’ pertama pada adalah untuk bias).

  • Data 2: , (Kelas Negatif).

  • Bobot awal (yaitu ).

  • Learning Rate .

  • Gunakan .

II.5. (Data 1): Hitung menggunakan bobot awal.

II.6. (Data 1): Hitung (probabilitas prediksi).

II.7. (Data 1): Hitung “error” .

II.8. (Data 1): Hitung bobot baru menggunakan aturan update SGA: untuk , , dan .

II.9. (Data 2): Menggunakan bobot baru dari II.8, hitung untuk Data 2.

II.10. (Data 2): Hitung untuk Data 2.

F. Esai Analisis Kasus Kritis (5 Soal)

II.11. (Interpretasi Koefisien)

Seorang analis data memiliki dua model:

  1. Model LR (Harga Rumah): .

  2. Model LogR (Lulus/Gagal): .

    Jelaskan interpretasi dari dan dalam konteks bisnis yang jelas.

II.12. (Masalah LR untuk Klasifikasi)

Jelaskan dua (2) alasan utama mengapa menggunakan Regresi Linear (LSE) + Threshold 0.5 adalah ide yang buruk untuk masalah klasifikasi, dibandingkan dengan Regresi Logistik.

II.13. (Fungsi Biaya: LSE vs MLE)

Jelaskan secara konseptual mengapa Regresi Linear menggunakan Least Square Estimator (LSE) sementara Regresi Logistik menggunakan Maximum Likelihood Estimator (MLE). Mengapa LSE tidak cocok untuk Regresi Logistik?

II.14. (Epoch dan dalam SGA)

Apa yang dimaksud dengan “Epoch” dalam konteks SGA? Jelaskan apa yang akan terjadi jika Learning Rate () diatur terlalu tinggi atau terlalu rendah.

II.15. (R2-Score vs MAE)

Jelaskan perbedaan interpretasi antara R2-Score = 0.75 dan MAE = 10.5 pada sebuah model Regresi Linear. Metrik mana yang lebih mudah dipahami oleh pemangku kepentingan non-teknis?