Back to IF3170 Inteligensi Artifisial

Topic: Model Validation Schemes (Pengukuran Kinerja Model - Part 1)

Questions/Cues

  • Posisi Fase Modeling (CRISP-DM)

  • Konsep Hold-out Validation

  • Pembagian Train/Val/Test

  • Konsep K-Fold Cross Validation

  • Kelebihan K-Fold

  • Konsep Bootstrapping

  • Kapan pakai Bootstrapping?

Reference Points

  • Slides: 1-10

  • Topik: Validasi Model

1. Fase Modeling dalam CRISP-DM

Dalam siklus hidup proyek data mining (CRISP-DM), pengukuran kinerja model berada erat kaitannya dengan fase Modeling dan Evaluation.

  • Input: Data yang sudah disiapkan (Data Preparation).

  • Proses: Memilih teknik, mendesain tes (Test Design), membangun model, dan menilai model (Assess Model).

  • Penting: Desain eksperimen (Design of Experiments / DoE) sangat krusial untuk memastikan hasil model valid dan bisa digeneralisasi.

2. Skema Validasi 1: Hold-out Validation

Metode paling sederhana namun umum digunakan.

  • Konsep: Dataset dibagi secara acak menjadi tiga bagian terpisah:

    1. Training Data: Untuk melatih model (belajar pola).

    2. Validation Data: Untuk menyetel parameter (hyperparameter tuning) dan evaluasi sementara.

    3. Test Data: Untuk evaluasi akhir kinerja model (data ini tidak boleh disentuh selama proses training/tuning).

  • Proses:

    1. Split data (misal 60:20:20).

    2. Latih model dengan berbagai konfigurasi pada Training Data.

    3. Pilih konfigurasi terbaik berdasarkan kinerja di Validation Data.

    4. Latih ulang model terbaik (opsional: gabung train+val) dan uji pada Test Data.

3. Skema Validasi 2: K-Fold Cross Validation

Metode yang lebih robust (kokoh) untuk estimasi kinerja, terutama jika data terbatas.

  • Konsep:

    1. Dataset dibagi menjadi K bagian (folds) yang sama besar.

    2. Lakukan iterasi sebanyak K kali.

    3. Pada setiap iterasi, gunakan 1 fold sebagai Validation Data dan sisa (K-1) fold sebagai Training Data.

    4. Kinerja akhir adalah rata-rata dari K nilai skor validasi.

  • Keuntungan: Seluruh data pernah digunakan sebagai data latih dan data uji, sehingga mengurangi bias akibat pembagian data yang “beruntung” atau “sial”.

4. Skema Validasi 3: Bootstrapping Validation

Metode resampling yang mengambil sampel secara acak dengan pengembalian (with replacement).

  • Konsep:

    1. Dari dataset berukuran N, ambil sampel sebanyak N kali secara acak (bisa ada data ganda). Ini jadi Training Set.

    2. Data yang tidak terpilih (out-of-bag) menjadi Test Set.

  • Kegunaan: Sangat berguna untuk dataset yang sangat kecil di mana pembagian hold-out akan menyisakan terlalu sedikit data untuk pelatihan.

  • Catatan: Sampel bootstrap memiliki tumpang tindih data yang lebih tinggi dibanding cross-validation.

Summary

Validasi model krusial untuk memastikan generalisasi. Hold-out Validation membagi data menjadi Train/Val/Test secara statis, sederhana tapi rentan bias pada data kecil. K-Fold Cross Validation mengatasi ini dengan rotasi data validasi sebanyak K kali, memberikan estimasi yang lebih stabil. Bootstrapping menggunakan sampling dengan pengembalian (replacement), ideal untuk dataset yang sangat kecil guna memaksimalkan penggunaan data.