Back to MA2281 Statistika nonparametrik
Topic: Uji Wilcoxon Rank-Sum & Mann-Whitney U Test
Questions/Cues
Definisi Dasar
Kapan digunakan?
Asumsi Utama
Analogi Sederhana
Reference Points
PDF: 3. Uji Wilcoxon Rank-Sum
PDF: 4. Mann-Whitney U Test
PDF: Catatan Kuis 1 Statnonpar
Konsep Dasar & Tujuan
Apa itu Uji Wilcoxon Rank-Sum / Mann-Whitney U?
Ini adalah uji statistik non-parametrik yang digunakan untuk membandingkan dua populasi yang independen (saling bebas).
Tujuannya: Menentukan apakah dua sampel berasal dari populasi dengan distribusi yang sama (khususnya melihat perbedaan median atau lokasi pusat data).
Kapan Kita Menggunakannya?
Data Tidak Normal: Ketika data Anda melanggar asumsi normalitas (misalnya, ada outlier ekstrim atau menceng).
Sampel Kecil: Ketika jumlah sampel sedikit sehingga sulit memastikan distribusi normal.
Data Ordinal: Atau data interval/rasio yang diubah menjadi peringkat.
Hubungan dengan Uji-t (t-test):
Jika Uji-t (parametrik) membandingkan rata-rata (mean) dengan asumsi data normal, maka Wilcoxon/Mann-Whitney adalah alternatifnya yang membandingkan peringkat (rank) tanpa asumsi normalitas.
Analogi Pemula:
Bayangkan sebuah lomba lari antara Tim A dan Tim B.
Uji Parametrik (t-test): Kita menghitung rata-rata waktu lari. Jika satu orang di Tim A sangat lambat (outlier), rata-rata tim hancur.
Uji Non-Parametrik (Wilcoxon): Kita tidak peduli waktunya, tapi urutan finish-nya. Siapa yang juara 1, 2, 3, dst. Jika juara 1 dari Tim A, juara 2 dari Tim A, dan juara 3 dari Tim A, kita bisa bilang Tim A lebih cepat, tidak peduli berapa detik waktu mereka.
Prosedur & Perhitungan (Step-by-Step)
Langkah 1: Penggabungan & Peringkat
Gabungkan data dari kedua sampel ( dan ) menjadi satu kelompok besar. Urutkan dari nilai terkecil ke terbesar.
Berikan peringkat (ranking) mulai dari 1 sampai (total data).
Langkah 2: Penanganan “Ties” (Angka Kembar)
Jika ada nilai yang sama persis (ties), peringkatnya adalah rata-rata dari peringkat yang seharusnya ditempati.
Contoh: Data ke-7 dan ke-8 nilainya sama. Maka keduanya mendapat peringkat: .
Langkah 3: Penjumlahan Peringkat ()
Pisahkan kembali data ke kelompok asal. Hitung jumlah peringkat untuk sampel yang lebih kecil (), sebut ini . Hitung juga untuk sampel besar ().
Validasi: . Ini adalah rumus jumlah deret aritmatika.
Contoh Kasus & Perhitungan Manual
Skenario:
Kita membandingkan efisiensi bahan bakar dua jenis ban.
Catatan: Untuk contoh manual ini, kita ambil 5 mobil pertama dari tiap grup sebagai sampel independen.
Data Mentah:
Ban Radial (A): 4.2, 4.7, 6.6, 7.0, 6.7
Ban Belted (B): 4.1, 4.9, 6.2, 6.9, 6.8
Langkah 1: Urutkan & Ranking Gabungan
Nilai Asal Kelompok Peringkat (Rank) 4.1 Belted (B) 1 4.2 Radial (A) 2 4.7 Radial (A) 3 4.9 Belted (B) 4 6.2 Belted (B) 5 6.6 Radial (A) 6 6.7 Radial (A) 7 6.8 Belted (B) 8 6.9 Belted (B) 9 7.0 Radial (A) 10 Langkah 2: Hitung Wilcoxon Rank Sum ()
Jumlahkan peringkat masing-masing kelompok:
(Radial):
(Belted):
Validasi: Total . Rumus: . (Cocok).
Langkah 3: Hitung Mann-Whitney ()
Transformasi menjadi untuk melihat “jumlah kemenangan”.
U_A = W_A - \frac{n_A(n_A+1)}{2} = 28 - \frac{5(6)}{2} = 28 - 15 = \mathbf{13}$$$$U_B = W_B - \frac{n_B(n_B+1)}{2} = 27 - \frac{5(6)}{2} = 27 - 15 = \mathbf{12}
Hasil Akhir ( Statistik):
Kita ambil nilai terkecil: .
Perbedaan: Statistik vs
1. Wilcoxon Rank Sum ():
Apa itu? Murni jumlah peringkat.
Kelemahan: Nilainya bergantung pada seberapa banyak sampel yang Anda miliki. Makin banyak sampel, makin besar nilai . Sulit dibandingkan antar studi.
Dalam Contoh: .
2. Mann-Whitney ():
Apa itu? Jumlah pasangan dimana satu grup “mengalahkan” grup lain.
Interpretasi:
artinya: Ada 13 kejadian di mana skor Radial > skor Belted (jika diadu satu lawan satu).
artinya: Ada 12 kejadian di mana skor Belted > skor Radial.
Keunggulan: Nilainya selalu antara sampai . Lebih terstandarisasi.
Dalam Contoh: (skor minimum).
Statistik Uji ( vs )
Rumus Transformasi:
U_1 = w_1 - \frac{n_1(n_1+1)}{2}$$$$U_2 = w_2 - \frac{n_2(n_2+1)}{2}
Pengambilan Keputusan:
Bandingkan nilai hitung dengan Tabel Kritis.
Tolak jika . (Perhatikan: di sini kita mencari nilai yang kecil atau ekstrim).
Aproksimasi Normal (Sampel Besar)
Kapan menggunakan pendekatan Normal?
Ketika ukuran sampel cukup besar (biasanya dan , atau salah satu ), distribusi statistik mendekati distribusi Normal (Kurva Lonceng).
Parameter Statistik Z:
Kita menstandarisasi nilai menjadi nilai (Z-score):
Dimana:
Mean (): Nilai harapan rata-rata.
Standar Deviasi (): Ukuran penyebaran peringkat.
Catatan: Jika menggunakan Z-score, bandingkan dengan tabel Z standar (misal untuk ).
Uji Wilcoxon Rank-Sum (dan ekuivalensinya, Mann-Whitney U Test) adalah metode statistik non-parametrik untuk membandingkan dua sampel independen tanpa asumsi normalitas. Inti metodenya adalah mengubah data menjadi peringkat (ranks). Statistik adalah jumlah peringkat salah satu grup, sedangkan statistik adalah ukuran “dominasi” satu grup terhadap grup lain (jumlah kemenangan head-to-head). Keduanya ekuivalen secara matematis: . Untuk sampel besar (), kita menggunakan aproksimasi Normal (Z-score) untuk menarik kesimpulan.
Ad Libitum: Pendalaman Teknis & Matematis
Bagian ini membahas detail matematis untuk penanganan ties (angka kembar) dan bukti ekuivalensi.
1. Koreksi Varians untuk Data Ties (Angka Kembar)
Rumus varians TERKOREKSI (jika ada ties):
: Banyaknya angka yang sama dalam satu grup kembar.
Faktor mengurangi varians karena angka kembar mengurangi variasi peringkat yang mungkin.
2. Ekuivalensi Matematis
pada dasarnya menghitung: “Jika kita pasangkan setiap anggota Grup A dengan setiap anggota Grup B, berapa kali A menang?“.
3. Implementasi Code (Python)
from scipy.stats import mannwhitneyu # Data dari contoh di atas radial = [4.2, 4.7, 6.6, 7.0, 6.7] belted = [4.1, 4.9, 6.2, 6.9, 6
Spaced Repetition Questions (Review)
1. Apa perbedaan interpretasi antara nilai W (Wilcoxon) dan U (Mann-Whitney)?
adalah jumlah peringkat absolut (bergantung ukuran sampel), sedangkan merepresentasikan jumlah “kemenangan” head-to-head antar grup (lebih terstandarisasi antara 0 hingga ).
2. Dalam contoh perhitungan di atas, mengapa U = 12 dipilih sebagai statistik uji?
Karena dalam uji dua sisi, kita memilih nilai minimum antara (13) dan (12). Nilai yang lebih kecil menunjukkan pemisahan distribusi yang lebih kuat (salah satu grup mendominasi peringkat ujung).
3. Jika kita memiliki data: Grup A [10, 10] dan Grup B [20, 30], berapakah nilai U untuk Grup A?
Grup A nilainya (10, 10) lebih kecil dari semua Grup B (20, 30).
Rank A: 1.5, 1.5 → .
.
Artinya Grup A menang 0 kali melawan Grup B.