Back to MA2281 Statistika nonparametrik
Topic: Runs Test (Uji Runtun/Iterasi)
Questions/Cues
Definisi Dasar
Apa itu “Run”?
Hipotesis ()
Kapan Digunakan?
Logika Pengujian
Reference Points
- PDF: 5. Runs Test
Konsep Dasar & Tujuan
Apa itu Runs Test?
Runs Test adalah uji statistik non-parametrik yang digunakan untuk menentukan apakah urutan kejadian dalam sampel bersifat acak (random) atau tidak.
Mengapa Penting?
Banyak uji statistik (seperti t-test atau ANOVA) berasumsi data diambil secara acak. Runs test memvalidasi asumsi tersebut. Jika data memiliki pola (tren atau siklus), berarti data tersebut tidak acak.
Definisi “Run” (Runtun):
Sebuah “Run” adalah sub-urutan dari simbol identik yang berurutan.
Simbol: Bisa berupa kategori (Laki/Perempuan) atau tanda matematis (+/-).
Analogi Pemula:
Bayangkan Anda melempar koin:
Hasil 1:
G G G G G A A A A A(Tidak acak, “Runs” sedikit, berkelompok).Hasil 2:
G A G A G A G A G A(Tidak acak, “Runs” terlalu banyak, selang-seling sempurna).Hasil 3:
G G A G A A A G A G(Tampak acak, “Runs” moderat).Runs Test mendeteksi apakah jumlah run terlalu sedikit atau terlalu banyak.
Prosedur Dasar
- Konversi Data ke Simbol Biner
Runs test membagi data menjadi dua kategori eksklusif:
Data Kualitatif: L/P, Sukses/Gagal, Kepala/Ekor.
Data Kuantitatif: Diubah menjadi
+(di atas median) dan-(di bawah median). Catatan: Nilai yang sama persis dengan median diabaikan/dibuang.2. Identifikasi Parameter
: Jumlah simbol tipe pertama.
: Jumlah simbol tipe kedua.
(nu): Total jumlah runs yang terjadi.
3. Hipotesis
: Urutan data adalah acak.
: Urutan data tidak acak.
Contoh Kasus 1: Data Kualitatif (Poll)
Skenario:
Survei terhadap 12 orang () mengenai penggunaan produk. Urutan responden dicatat berdasarkan jenis kelamin (M=Male, F=Female).
Data Urutan:
M M F F F M F F M M M M
Langkah Analisis:
Kelompokkan Runs:
(M M) (F F F) (M) (F F) (M M M M)
Hitung Parameter:
(F) = 5
(M) = 7
(Jumlah run) = 5
Kesimpulan:
Melihat tabel statistik (Tabel A.18 di referensi), untuk , nilai memiliki P-value > 0.05.
Keputusan: Terima . Data diambil secara acak.
Contoh Kasus 2: Data Kuantitatif (Mesin Cat)
Skenario (Example 16.7):
Mesin pengisi cat diuji untuk melihat apakah volume cat bervariasi secara acak.
Data (Liter): 3.6, 3.9, 4.1, 3.6, 3.8, 3.7, 3.4, 4.0, 3.8, 4.1, 3.9, 4.0, 3.8, 4.2, 4.1
Langkah 1: Tentukan Median ()
Urutkan data untuk cari median (atau hitung manual dari data di atas). Diketahui Median = 3.9.
Langkah 2: Konversi ke Simbol (+/-)
Bandingkan setiap data dengan 3.9:
3.6 (< 3.9) -
3.9 (= 3.9) Abaikan
4.1 (> 3.9) +
…dan seterusnya.
Hasil Urutan:
Langkah 3: Hitung Runs
(-) (+) (----) (+) (-) (++) (-) (+) (-) (++)
(tanda -) = 6
(tanda +) = 7
(jumlah runs) = 8
Keputusan:
Dari tabel, P-value untuk (dengan ) adalah besar (P=1.0).
Terima : Variasi mesin bersifat acak.
Runs Test untuk Dua Sampel
Fungsi Alternatif:
Runs Test juga bisa digunakan sebagai alternatif Uji Wilcoxon/Mann-Whitney untuk menguji apakah dua populasi memiliki distribusi yang sama.
Logika:
Gabungkan kedua sampel dan urutkan. Tandai asal sampel (A atau B).
Jika benar (distribusi sama): A dan B akan tercampur rata Banyak Runs.
Jika salah (beda mean): A akan mengumpul di kiri, B di kanan (atau sebaliknya) Sedikit Runs.
Kelemahan: Kurang powerful dibanding Wilcoxon, dan sulit menangani ties antar grup.
Aproksimasi Normal (Sampel Besar)
Jika dan , distribusi jumlah runs () mendekati Normal.
Mean ():
Varians ():
Statistik Z:
Runs Test adalah metode non-parametrik untuk mengevaluasi keacakan sebuah urutan data. Sebuah “Run” adalah serangkaian simbol identik yang berurutan. Uji ini bekerja dengan membandingkan jumlah runs () yang diamati dengan jumlah runs yang diharapkan secara statistik. Jumlah runs yang terlalu sedikit mengindikasikan pengelompokan (trend), sedangkan runs yang terlalu banyak mengindikasikan pola osilasi sistematis. Untuk data kuantitatif, data dikonversi menjadi simbol positif/negatif relatif terhadap median.
Ad Libitum: Pendalaman Teknis
1. Interpretasi Ekstrim Runs
Runs Sangat Sedikit (Clustering/Trend):
Contoh: ++++++------ ().
Ini menunjukkan adanya bias sistematis. Dalam kontrol kualitas, ini bisa berarti mesin bergeser (drift) dari settingan awal seiring waktu.
Runs Sangat Banyak (Mixing/Cyclical):
Contoh: +-+-+-+-+-+- ().
Ini menunjukkan keteraturan buatan. Data random jarang sekali berselang-seling sesempurna ini.
2. Perbandingan dengan Wilcoxon Rank-Sum
Meskipun Runs Test (Wald-Wolfowitz) bisa digunakan untuk menguji dua sampel (), ia memiliki power yang lebih rendah dibandingkan Wilcoxon Rank-Sum.
Wilcoxon: Memanfaatkan besaran peringkat (magnitude of ranks).
Runs Test: Hanya memanfaatkan urutan grup (clustering of groups).
Runs test dua sampel umumnya hanya sensitif jika perbedaan antar populasi sangat ekstrem (misal: tidak ada overlap sama sekali).
3. Rumus Varians
Rumus varians Runs Test terlihat kompleks:
Rumus ini diturunkan dari teori kombinatorik hipergeometrik. Pembagian dengan adalah penyesuaian derajat kebebasan.
Spaced Repetition Questions (Review)
1. Apa yang dimaksud dengan "Run" dalam konteks uji ini?
Run adalah sub-urutan dari satu atau lebih simbol identik yang muncul berurutan dalam rangkaian data. Contoh: AA adalah satu run, B adalah satu run.
2. Jika data adalah angka (kuantitatif), bagaimana cara kita melakukan Runs Test?
Tentukan median sampel terlebih dahulu. Ubah setiap data menjadi tanda + jika di atas median, dan - jika di bawah median. Data yang sama persis dengan median dibuang.
3. Apa yang diindikasikan jika jumlah runs (v) jauh lebih kecil dari nilai harapan?
Mengindikasikan bahwa data tidak acak karena adanya pengelompokan (clustering) atau tren tertentu (misal: data awal positif semua, data akhir negatif semua).
4. Mengapa Runs Test dianggap kurang "powerful" dibanding Wilcoxon untuk membandingkan dua populasi?
Karena Runs Test hanya melihat urutan grup (apakah grup A dan