Back to IF3170 Inteligensi Artifisial

Topic: 4. Cluster Evaluation (Validity)

Questions/Cues

  • Mengapa Perlu Evaluasi?

  • Internal Measures (Konsep)

  • Cohesion vs Separation

  • Silhouette Coefficient

  • Studi Kasus: Hitung Silhouette

  • External Measures (Konsep)

  • Purity

  • Studi Kasus: Hitung Purity

  • Perbandingan Metode Evaluasi

Reference Points

  • Slide 48-51 (Motivasi)

  • Slide 52-57 (Internal Measures)

  • Slide 58-60 (External Measures)

1. Motivasi: Mengapa Evaluasi Cluster Penting?

Dalam Unsupervised Learning, kita tidak memiliki label kelas (“kunci jawaban”) saat proses pelatihan. Namun, evaluasi tetap krusial untuk:

  1. Menghindari Apophenia: Mencegah algoritma menemukan pola semu pada data acak (random noise). Algoritma clustering akan selalu membagi data, bahkan jika datanya hanya semut yang menyebar acak. Kita butuh metrik untuk tahu apakah pembagian itu bermakna.

  2. Membandingkan Algoritma: Menentukan apakah K-Means bekerja lebih baik daripada DBSCAN untuk dataset spesifik.

  3. Tuning Parameter: Membantu memilih parameter optimal, seperti menentukan jumlah cluster () terbaik pada K-Means (menggunakan Elbow Method yang berbasis evaluasi internal).

2. Internal Measures (Evaluasi Internal)

Metode ini digunakan saat TIDAK ADA label kelas eksternal (ground truth). Penilaian didasarkan murni pada struktur geometri data hasil clustering.

Dua Pilar Kualitas Internal:

  • Cohesion (Kekompakan): Seberapa dekat/mirip objek-objek di dalam satu cluster.

    • Diukur dengan Within-Cluster Sum of Squares (WSS) atau SSE.

    • Target: Semakin kecil semakin baik (anggota cluster saling berpelukan erat).

  • Separation (Pemisahan): Seberapa jauh jarak antar cluster yang berbeda.

    • Diukur dengan Between-Cluster Sum of Squares (BSS).

    • Target: Semakin besar semakin baik (antar kelompok saling menjauh).

Silhouette Coefficient ():

Metrik yang menggabungkan cohesion dan separation untuk setiap titik data .

Rumus:

  • : Rata-rata jarak titik ke semua titik lain di cluster sendiri (mengukur cohesion).

  • : Rata-rata jarak titik ke semua titik di cluster tetangga terdekat (mengukur separation). Cluster tetangga adalah cluster lain yang rata-rata jaraknya paling minimal terhadap .

Interpretasi Nilai (-1 s.d 1):

  • Mendekati +1: Cluster Sangat Baik. (Jauh dari musuh, dekat dengan teman).

  • Sekitar 0: Overlapping. Titik berada di perbatasan/bimbang antar dua cluster.

  • Negatif: Mis-clustered. Titik lebih dekat ke cluster tetangga daripada clusternya sendiri.

3. Studi Kasus 1: Perhitungan Silhouette (Detail Slide 57)

Data: Kita akan menghitung Silhouette untuk titik A1(2,5).

  • Cluster 1 (Home): A1(2,5), A2(3,4), A3(4,6)

  • Cluster 2 (Neighbor): B1(8,3), B2(9,2), B3(10,5)

  • Cluster 3 (Other): C1(6,10), C2(7,8), C3(8,9)

Langkah 1: Hitung - Cohesion

Rata-rata jarak A1 ke teman se-cluster (A2, A3).

Langkah 2: Hitung - Separation

Rata-rata jarak A1 ke semua cluster lain, ambil yang paling kecil.

  • Ke Cluster 2:

    • , ,

    • Rata-rata =

  • Ke Cluster 3:

    • , ,

    • Rata-rata =

  • Pilih Minimum:

Langkah 3: Hitung Nilai Silhouette

Kesimpulan: Nilai 0.718 cukup tinggi (dekat ke 1), menandakan A1 berada di cluster yang tepat dan terpisah cukup baik dari cluster tetangga.

4. External Measures (Evaluasi Eksternal)

Metode ini digunakan ketika kita MEMILIKI label kelas asli (ground truth). Biasanya digunakan dalam riset untuk memvalidasi performa algoritma baru menggunakan dataset standar (seperti Iris dataset).

Purity (Kemurnian):

Mengukur sejauh mana sebuah cluster hanya berisi data dari satu kategori kelas saja. Ini mirip dengan mengukur “akurasi” klasifikasi untuk setiap cluster.

Rumus:

?

  • Ambil kelas mayoritas di setiap cluster.

  • Jumlahkan anggota kelas mayoritas tersebut dari semua cluster.

  • Bagi dengan total data ().

5. Studi Kasus 2: Perhitungan Purity (Detail Slide 60)

Total Data (): 17 Dokumen.

Cluster: 3 buah.

Label Asli: 🔴 (Merah/A), 🔵 (Biru/B), 🟢 (Hijau/C).

ClusterKomposisi Data (Label Asli)Kelas DominanJumlah Dominan
Cluster I🔴🔴🔴🔴🔴🔵 (5 Merah, 1 Biru)Merah5
Cluster II🔴🔵🔵🔵🔵🟢 (1 Merah, 4 Biru, 1 Hijau)Biru4
Cluster III🔴🔴🟢🟢🟢 (2 Merah, 3 Hijau)Hijau3

Perhitungan:

Interpretasi: Sekitar 70.6% data dikelompokkan dengan “benar” sesuai kelas mayoritasnya. Cluster I sangat murni (hanya 1 error), sedangkan Cluster III paling kotor (hampir seimbang antara Merah dan Hijau).

6. Perbandingan Kapan Menggunakan Apa

Kondisi DataMetode EvaluasiAlasan
Data Riil / WildInternal (Silhouette, Elbow)Kita tidak punya label. Kita hanya bisa percaya pada geometri (kerapatan data).
Data BenchmarkExternal (Purity, NMI)Kita punya label tersembunyi. Kita ingin menguji apakah algoritma mampu menemukan kembali label tersebut.
Menentukan KInternal (Elbow Method)Mencari keseimbangan variansi intra-cluster.

Summary

Evaluasi Cluster adalah tahap validasi untuk memastikan hasil algoritma bermakna dan bukan sekadar random chance. Metode dibagi dua: Internal Measures (seperti Silhouette Coefficient) digunakan saat tanpa label, berfokus pada keseimbangan kohesi (kedekatan internal) dan separasi (jarak eksternal). Nilai Silhouette positif tinggi indikasi cluster yang baik. External Measures (seperti Purity) digunakan saat label asli tersedia, mengukur konsistensi anggota cluster terhadap kelas aslinya. Meskipun Purity mudah dihitung, ia bias terhadap jumlah cluster yang besar, sehingga hasil harus diinterpretasi dengan hati-hati.