Back to IF3170 Inteligensi Artifisial
Problem Set Regresi & Pelatihan: Lanjutan
Estimasi Waktu: 100 - 120 menit
Tujuan Pembelajaran:
- Mampu membedakan fungsi biaya dan metode optimasi untuk Regresi Linear (LSE) dan Regresi Logistik (MLE).
- Mampu menghitung parameter Regresi Linear (, ) menggunakan metode LSE.
- Mampu mensimulasikan proses pelatihan Regresi Logistik menggunakan Stochastic Gradient Ascent (SGA).
- Mampu menginterpretasikan koefisien model dan konsep inti (Log-Odds, Hyperplane, R2-Score).
Bagian I: Teori dan Konsep (15 Soal)
A. True/False (5 Soal)
Instruksi: Tentukan apakah pernyataan berikut Benar (True) atau Salah (False) dan jelaskan secara singkat alasannya.
| No. | Pernyataan | Jawaban (T/F) |
|---|---|---|
| I.1 | Metode Least Square Estimator (LSE) digunakan untuk melatih Regresi Logistik dengan cara memaksimalkan Sum of Squared Errors (SSE). | |
| I.2 | Stochastic Gradient Ascent (SGA) disebut “Ascent” (Naik) karena tujuannya adalah memaksimalkan Log Conditional Likeliood (LCL), bukan meminimalkan error. | |
| I.3 | Output dari Regresi Linear adalah probabilitas (nilai antara 0 dan 1), sedangkan output dari fungsi Sigmoid (Regresi Logistik) adalah nilai kontinu (bisa 0 atau 1). | |
| I.4 | Dalam Regresi Logistik, Hyperplane () adalah permukaan keputusan di mana model memprediksi probabilitas tepat 0.5. | |
| I.5 | Metrik R2-Score adalah ukuran evaluasi utama untuk Regresi Logistik, yang mengukur seberapa banyak variasi log-odds yang dapat dijelaskan oleh model. |
B. Multiple Choice Multiple Answer (MCMA) (5 Soal)
Instruksi: Pilih minimal dua (2) jawaban yang paling tepat.
I.6. (Karakteristik Regresi Linear)
Pilih tiga (3) pernyataan yang paling tepat mendeskripsikan Regresi Linear Sederhana (SLR).
A. Menggunakan Maximum Likelihood Estimator (MLE) sebagai cost function. B. Bertujuan meminimalkan Sum of Squares of the Residuals (SSE). C. Koefisien (slope) dapat dihitung menggunakan . D. Menggunakan fungsi Sigmoid untuk membatasi output prediksi. E. Dievaluasi menggunakan metrik seperti Mean Absolute Error (MAE) dan R2-Score.
I.7. (Konsep Regresi Logistik)
Pilih tiga (3) konsep inti dari Regresi Logistik.
A. Model ini secara fundamental memodelkan Log-Odds (Logit) sebagai kombinasi linear dari fitur-fitur input. B. Decision Surface yang memisahkan kelas-kelas adalah sebuah Hyperplane. C. Menggunakan Least Square Estimator (LSE) untuk menemukan parameter terbaik. D. Fungsi Sigmoid () digunakan untuk mengubah output linear () menjadi probabilitas. E. Koefisien berarti “setiap kenaikan 1 unit akan menaikkan probabilitas sebesar “.
I.8. (Pelatihan Regresi Logistik - SGA)
Pilih tiga (3) pernyataan yang benar mengenai Stochastic Gradient Ascent (SGA).
A. SGA memperbarui bobot setelah menghitung error dari satu epoch penuh (seluruh data). B. (learning rate) adalah parameter yang mengontrol seberapa besar langkah pembaruan bobot pada setiap iterasi. C. Aturan pembaruan menggunakan error sebagai sinyal untuk koreksi. D. SGA lebih cepat per iterasinya dibandingkan Batch Gradient Ascent karena hanya menggunakan satu data acak. E. SGA dijamin menemukan global maximum LCL dalam satu epoch.
I.9. (Interpretasi Koefisien)
Manakah dua (2) interpretasi koefisien () yang benar?
A. Regresi Linear: berarti kenaikan 1 unit akan menaikkan nilai sebesar 0.5 unit. B. Regresi Linear: berarti kenaikan 1 unit akan menaikkan log-odds sebesar 0.5. C. Regresi Logistik: berarti kenaikan 1 unit akan menaikkan log-odds (Logit) dari sebesar 0.5. D. Regresi Logistik: berarti kenaikan 1 unit akan menaikkan probabilitas sebesar 0.5.
I.10. (LSE vs MLE)
Pilih dua (2) perbedaan fundamental antara LSE dan MLE.
A. LSE bertujuan meminimalkan SSE (Error Kuadrat). B. LSE bertujuan memaksimalkan SSE (Error Kuadrat). C. MLE bertujuan meminimalkan LCL (Log-Likelihood). D. MLE bertujuan memaksimalkan LCL (Log-Likelihood).
C. Matching (5 Soal)
Instruksi: Pasangkan istilah di Kiri dengan definisi atau formula terbaik di Kanan.
| Istilah | Konsep Kritis Regresi |
|---|---|
| I.11. LSE (Least Square Est.) | |
| I.12. MLE (Max Likelihood Est.) | |
| I.13. Logit (Log-Odds) | |
| I.14. Sigmoid Function | |
| I.15. Hyperplane |
Bagian II: Perhitungan dan Analisis Kasus (15 Soal)
D. Perhitungan Regresi Linear (LSE) (4 Soal)
Diberikan 4 data latih untuk memprediksi Harga (Y) berdasarkan Ukuran (X).
| No. | Ukuran (X) | Harga (Y) |
|---|---|---|
| 1 | 10 | 9 |
| 2 | 20 | 11 |
| 3 | 30 | 15 |
| 4 | 40 | 17 |
II.1. Hitunglah nilai rata-rata (Mean X) dan (Mean Y).
II.2. Hitunglah koefisien (slope) menggunakan formula LSE: .
II.3. Hitunglah koefisien (intercept) menggunakan formula .
II.4. Tuliskan hipotesis (model regresi) dan hitung Mean Absolute Error (MAE) dari model Anda pada data latih.
E. Simulasi Pelatihan Regresi Logistik (SGA) (6 Soal)
Diberikan 1 data latih dan 1 data latih kedua.
-
Data 1: , (Kelas Positif). (Angka ‘1’ pertama pada adalah untuk bias).
-
Data 2: , (Kelas Negatif).
-
Bobot awal (yaitu ).
-
Learning Rate .
-
Gunakan .
II.5. (Data 1): Hitung menggunakan bobot awal.
II.6. (Data 1): Hitung (probabilitas prediksi).
II.7. (Data 1): Hitung “error” .
II.8. (Data 1): Hitung bobot baru menggunakan aturan update SGA: untuk , , dan .
II.9. (Data 2): Menggunakan bobot baru dari II.8, hitung untuk Data 2.
II.10. (Data 2): Hitung untuk Data 2.
F. Esai Analisis Kasus Kritis (5 Soal)
II.11. (Interpretasi Koefisien)
Seorang analis data memiliki dua model:
-
Model LR (Harga Rumah): .
-
Model LogR (Lulus/Gagal): .
Jelaskan interpretasi dari dan dalam konteks bisnis yang jelas.
II.12. (Masalah LR untuk Klasifikasi)
Jelaskan dua (2) alasan utama mengapa menggunakan Regresi Linear (LSE) + Threshold 0.5 adalah ide yang buruk untuk masalah klasifikasi, dibandingkan dengan Regresi Logistik.
II.13. (Fungsi Biaya: LSE vs MLE)
Jelaskan secara konseptual mengapa Regresi Linear menggunakan Least Square Estimator (LSE) sementara Regresi Logistik menggunakan Maximum Likelihood Estimator (MLE). Mengapa LSE tidak cocok untuk Regresi Logistik?
II.14. (Epoch dan dalam SGA)
Apa yang dimaksud dengan “Epoch” dalam konteks SGA? Jelaskan apa yang akan terjadi jika Learning Rate () diatur terlalu tinggi atau terlalu rendah.
II.15. (R2-Score vs MAE)
Jelaskan perbedaan interpretasi antara R2-Score = 0.75 dan MAE = 10.5 pada sebuah model Regresi Linear. Metrik mana yang lebih mudah dipahami oleh pemangku kepentingan non-teknis?
Bagian I: Teori dan Konsep
A. True/False
No. Pernyataan Jawaban I.1 Metode Least Square Estimator (LSE) digunakan untuk melatih Regresi Logistik… False (LogR menggunakan MLE; LSE meminimalkan SSE, bukan memaksimalkan). I.2 Stochastic Gradient Ascent (SGA) disebut “Ascent” (Naik) karena tujuannya adalah memaksimalkan Log Conditional Likeliood (LCL)… True (Ascent untuk Maksimasi LCL; Descent untuk Minimasi Error). I.3 Output dari Regresi Linear adalah probabilitas… False (Kebalikan. LR Kontinu; LogR/Sigmoid Probabilitas 0-1). I.4 Dalam Regresi Logistik, Hyperplane () adalah permukaan keputusan di mana model memprediksi probabilitas tepat 0.5. True (Jika , maka ). I.5 Metrik R2-Score adalah ukuran evaluasi utama untuk Regresi Logistik… False (R2-Score untuk Regresi Linear. LogR menggunakan metrik Klasifikasi seperti Akurasi, F1, atau LCL). B. Multiple Choice Multiple Answer (MCMA)
I.6. B, C, E (A salah, LR pakai LSE. D salah, LR tidak pakai Sigmoid).
I.7. A, B, D (C salah, LogR pakai MLE. E salah, menaikkan log-odds, bukan probabilitas secara linear).
I.8. B, C, D (A salah, SGA update per data, bukan epoch. E salah, SGA tidak dijamin global optimum, apalagi dalam 1 epoch).
I.9. A, C (B salah, itu interpretasi LogR. D salah, itu interpretasi LogR yang salah).
I.10. A, D (LSE = Minimalkan Error Kuadrat; MLE = Maksimalkan Log-Likelihood).
C. Matching
Istilah Konsep Kritis Regresi I.11. LSE (Least Square Est.) I.12. MLE (Max Likelihood Est.) I.13. Logit (Log-Odds) I.14. Sigmoid Function I.15. Hyperplane Bagian II: Perhitungan dan Analisis Kasus
D. Perhitungan Regresi Linear (LSE)
II.1. Rata-rata:
II.2. Koefisien (slope):
10 9 -15 -4 60 225 20 11 -5 -2 10 25 30 15 5 2 10 25 40 17 15 4 60 225 Total
II.3. Koefisien (intercept):
II.4. Hipotesis dan MAE:
(Real) (Error Absolut) 10 9 20 11 30 15 40 17 Total Error Absolut:
MAE:
E. Simulasi Pelatihan Regresi Logistik (SGA)
II.5. (Data 1): Hitung (Bobot Awal )
II.6. (Data 1): Hitung
II.7. (Data 1): Hitung “error” ()
II.8. (Data 1): Hitung Bobot Baru ()
,
II.9. (Data 2): Hitung (Bobot Baru )
II.10. (Data 2): Hitung
(Prediksi untuk Data 2 (Kelas 0) adalah 0.645, yang masih salah, tapi bobotnya sudah mulai bergerak).
F. Esai Analisis Kasus Kritis
II.11. (Interpretasi Koefisien)
Model LR (): Interpretasi ini linear dan langsung. “Untuk setiap kenaikan 1 meter persegi luas bangunan, harga rumah diprediksi naik sebesar 2.5 juta Rupiah (atau 2.5 unit mata uang), dengan asumsi faktor lain tetap.”
Model LogR (): Interpretasi ini non-linear (Log-Odds). “Untuk setiap kenaikan 1 jam belajar, log-odds (logit) mahasiswa tersebut untuk Lulus (Y=1) diprediksi meningkat sebesar 0.8.” Ini bukan berarti probabilitasnya naik 80%.
II.12. (Masalah LR untuk Klasifikasi)
Output Tidak Terbatas: Output Regresi Linear adalah kontinu ( hingga ). Outputnya bisa 1.5 atau -0.2, yang tidak dapat diinterpretasikan sebagai probabilitas kelas. Regresi Logistik (Sigmoid) “memaksa” output menjadi 0-1.
Sensitivitas terhadap Outlier: LSE (yang digunakan LR) sangat sensitif terhadap outlier. Satu titik data outlier yang ekstrim dapat menggeser seluruh garis regresi (hiperplane), yang akan mengacaukan threshold 0.5 dan menyebabkan kesalahan klasifikasi pada banyak data lain.
II.13. (Fungsi Biaya: LSE vs MLE)
Regresi Linear (LSE): Asumsi dasarnya adalah error (residual) terdistribusi normal. Dalam kasus ini, meminimalkan error kuadrat (LSE) secara matematis setara dengan memaksimalkan likelihood. Jadi, LSE adalah cara yang efisien untuk mencapai tujuan.
Regresi Logistik (MLE): Outputnya adalah probabilitas, dan error-nya tidak terdistribusi normal (mengikuti distribusi Bernoulli). Jika kita mencoba menggunakan LSE pada output 0/1, fungsi biayanya menjadi non-konveks (banyak minimum lokal), sehingga optimasi gagal. MLE (memaksimalkan LCL) memberikan fungsi biaya yang konveks, yang dapat dioptimasi dengan andal oleh Gradient Ascent.
II.14. (Epoch dan dalam SGA)
Epoch: Satu epoch adalah satu kali iterasi penuh di mana algoritma telah melihat (dan berlatih) pada setiap data dalam training set tepat satu kali. (Jika data di-shuffle, ini berarti satu putaran penuh).
Terlalu Tinggi: Langkahnya terlalu besar. Model akan “melompati” (overshoot) titik maximum (atau minimum). Pelatihan menjadi tidak stabil dan mungkin tidak akan pernah konvergen (berhenti di solusi baik).
Terlalu Rendah: Langkahnya terlalu kecil. Model akan konvergen, tetapi akan membutuhkan waktu yang sangat lama (sangat banyak epoch) untuk mencapai titik maximum (atau minimum).
II.15. (R2-Score vs MAE)
R2-Score = 0.75: Ini adalah metrik relatif. “Model (fitur) ini berhasil menjelaskan 75% dari varians (keragaman) data output Y. 25% sisanya tidak terjelaskan (disebabkan oleh noise atau fitur lain).” Ini mengukur kekuatan model.
MAE = 10.5: Ini adalah metrik absolut dan menggunakan unit yang sama dengan output Y. “Rata-rata, prediksi model ini meleset (salah) sebesar 10.5 unit (misal, 10.5 juta Rupiah) dari harga sebenarnya.”
Lebih Mudah Dipahami: MAE hampir selalu lebih mudah dipahami oleh pemangku kepentingan non-teknis karena menggunakan unit bisnis yang familier (misal: “Prediksi Anda salah 10.5 juta”). R2-Score (proporsi varians) lebih abstrak secara statistik.