Naive Bayes Classifier

Back to IF3170 Inteligensi Artifisial

Topic: Naive Bayes Classifier (Supervised Learning)

Questions/Cues

Apa itu Naive Bayes?

Mengapa disebut “Naive”?

Rumus Prediksi Utama

Tahap Learning

Tahap Classification

Contoh Kasus (Tennis)

Reference Points

File: 28. IF3170_Materi09_Seg02_AI-NaiveBayes.pdf

Modul: Supervised Learning

1. Konsep Dasar Naive Bayes

Naive Bayes adalah Probabilistic Classifier dalam Supervised Learning.

Target Fungsi: Memetakan input ke kelas dari himpunan terbatas $V$ .

Prinsip: Menggunakan Teorema Bayes untuk memprediksi kelas yang paling mungkin ( $v_{M A P}$ ) berdasarkan atribut yang diamati.

Asumsi “Naive”: Mengasumsikan bahwa setiap atribut bersifat saling lepas (conditionally independent) satu sama lain jika kelasnya diketahui. Meskipun asumsi ini jarang terjadi di dunia nyata, performa Naive Bayes seringkali sangat baik.

2. Algoritma Pembelajaran (Learning Algorithm)

Tujuan tahap ini adalah membangun “Probability Model” dari data latih.

Input: Dataset dengan atribut $a_{1}, a_{2}, ..., a_{n}$ dan target kelas $v_{j}$ .

Proses:

Hitung frekuensi setiap kelas target $P (v_{j})$ .

Hitung frekuensi setiap nilai atribut untuk setiap kelas $P (a_{i} ∣ v_{j})$ .

3. Tahap Klasifikasi (Prediction)

Untuk data baru (unseen data) dengan atribut $⟨ a_{1}, a_{2}, ..., a_{n} ⟩$ , kita mencari kelas $v_{M A P}$ (Maximum a Posteriori) dengan rumus:

$v_{M A P} = argmax_{v_{j} \in V} P (v_{j} ∣ a_{1}, a_{2}, ..., a_{n})$

Menggunakan Teorema Bayes dan asumsi independensi, rumusnya disederhanakan menjadi:

$v_{NB} = argmax_{v_{j} \in V} P (v_{j}) \prod_{i} P (a_{i} ∣ v_{j})$

$P (v_{j})$ : Prior probability (peluang kelas muncul secara umum).

$\prod P (a_{i} ∣ v_{j})$ : Likelihood (peluang atribut muncul jika kelasnya $v_{j}$ , dikalikan untuk semua atribut).

4. Studi Kasus: Play Tennis

Diberikan data cuaca (Outlook, Temp, Humidity, Windy) untuk menentukan Play=Yes/No.

Learning: Hitung tabel probabilitas.

$P (Pl a y = Y es) = 9/14$ , $P (Pl a y = N o) = 5/14$ .

$P (S u nn y ∣ Y es) = 2/9$ , $P (S u nn y ∣ N o) = 3/5$ , dst.

Query: $⟨ S u nn y, C oo l, H i g h, T r u e ⟩$ ?

Hitung Yes: $P (Y es) \times P (S u nn y ∣ Y es) \times P (C oo l ∣ Y es) \times P (H i g h ∣ Y es) \times P (T r u e ∣ Y es)$

$= \frac{9}{14} \times \frac{2}{9} \times \frac{3}{9} \times \frac{3}{9} \times \frac{3}{9} \approx 0.0053$

Hitung No: $P (N o) \times P (S u nn y ∣ N o) \times P (C oo l ∣ N o) \times P (H i g h ∣ N o) \times P (T r u e ∣ N o)$

$= \frac{5}{14} \times \frac{3}{5} \times \frac{1}{5} \times \frac{4}{5} \times \frac{3}{5} \approx 0.0206$

Keputusan: $0.0206 > 0.0053$ , maka prediksi Play = No.

Summary

Naive Bayes adalah pengklasifikasi probabilistik yang efisien yang memprediksi kelas dengan memilih probabilitas tertinggi ( $P (v_{j}) \times \prod P (a_{i} ∣ v_{j})$ ). Kekuatan utamanya terletak pada asumsi independensi atribut yang menyederhanakan perhitungan kompleks menjadi perkalian probabilitas sederhana berdasarkan frekuensi data latih.

Spaced Repetition Questions

1. Mengapa Naive Bayes disebut "Naive"?

Karena algoritma ini mengasumsikan bahwa semua atribut input bersifat independen satu sama lain (tidak saling mempengaruhi) jika kelas targetnya diketahui, padahal kenyataannya atribut seringkali berkorelasi.

2. Apa rumus utama untuk mengklasifikasikan data baru menggunakan Naive Bayes?

$Cl a ss i f i c a t i o n = argmax_{v_{j}} P (v_{j}) \prod_{i} P (a_{i} ∣ v_{j})$

(Peluang Prior Kelas dikali dengan Produk Peluang Likelihood setiap atribut).

IF Notes

Explorer

Naive Bayes Classifier

Questions/Cues

Reference Points

1. Konsep Dasar Naive Bayes

2. Algoritma Pembelajaran (Learning Algorithm)

3. Tahap Klasifikasi (Prediction)

4. Studi Kasus: Play Tennis

Graph View

Table of Contents

Backlinks