Back to IF3170 Inteligensi Artifisial

Topic

Questions/Cues

  • Apa definisi Supervised Learning?

  • Apa itu Inductive Learning?

  • Apa itu Training Set?

  • Apa tujuan utama dari proses belajar ini?

  • Apa itu hipotesis h?

  • Apa hubungan antara h dan f?

  • Apa beda Klasifikasi dan Regresi?

Reference Points

  • IF3170-Materi-08-Seg-02 - Learning - Supervised.pdf (Slide 3-4)

  • Tom Mitchell, “Machine Learning”, 1997.

Supervised Learning: Belajar dari Contoh Berlabel

Supervised Learning adalah paradigma pembelajaran mesin di mana agen belajar dari sekumpulan data yang sudah diberi label dengan benar. Setiap data poin dalam set pelatihan terdiri dari pasangan input-output.

  • Input: Disebut juga fitur, atribut, atau variabel independen (disimbolkan dengan X).

  • Output: Disebut juga label, target, atau variabel dependen (disimbolkan dengan y atau f(x)).

Training Set adalah koleksi dari pasangan <data, label> ini. Analogi sederhananya adalah belajar dengan seorang “guru” yang memberikan soal (input) beserta kunci jawabannya (output).

Inductive Learning: Dari Spesifik ke Umum

Proses belajar dalam Supervised Learning disebut Inductive Learning. Ini adalah proses untuk menyimpulkan sebuah fungsi umum dari contoh-contoh spesifik.

  • Fungsi Target (f): Ini adalah fungsi “ideal” atau “sebenarnya” yang memetakan input ke output. Dalam dunia nyata, kita tidak pernah tahu bentuk pasti dari fungsi ini.

  • Hipotesis (h): Ini adalah fungsi yang dipelajari oleh algoritma dari data latih. Tujuannya adalah agar h bisa mengaproksimasi atau mendekati f (h ≈ f) sebaik mungkin.

Alur prosesnya adalah:

  1. Algoritma menerima Training Set.

  2. Melalui proses Inductive Learning, algoritma menghasilkan sebuah Hipotesis h.

  3. Hipotesis h ini kemudian digunakan untuk membuat prediksi pada data baru yang belum pernah dilihat (unseen data).

Klasifikasi vs. Regresi

Supervised Learning umumnya dibagi menjadi dua jenis tugas utama, tergantung pada domain dari label/outputnya:

  1. Klasifikasi (Classification):

    • Tujuannya adalah memprediksi label kategori/diskrit.

    • Domain dari labelnya adalah sebuah himpunan nilai yang terbatas.

    • Contoh: Memprediksi apakah sebuah email adalah ‘spam’ atau ‘bukan spam’; mengklasifikasikan spesies bunga (‘setosa’, ‘versicolor’, ‘virginica’).

  2. Regresi (Regression):

    • Tujuannya adalah memprediksi nilai numerik/kontinu.

    • Domain dari labelnya bisa berupa nilai riil apa pun.

    • Contoh: Memprediksi harga rumah berdasarkan luasnya; memprediksi suhu besok hari.

Summary

Supervised Learning adalah proses Inductive Learning di mana sebuah model belajar dari training set yang berisi pasangan input-output berlabel. Tujuannya adalah untuk menemukan sebuah fungsi hipotesis (h) yang dapat mengaproksimasi fungsi target (f) yang tidak diketahui, sehingga model dapat melakukan generalisasi untuk memprediksi output pada data baru, baik dalam bentuk kategori (Klasifikasi) maupun nilai kontinu (Regresi).