Back to MA2281 Statistika nonparametrik

Topic

Questions/Cues

  • Apa definisi teknis Korelasi Spearman?
  • Apa perbedaan fundamental Pearson vs. Spearman?
  • Bagaimana rumus rs​ diturunkan?
  • Bagaimana langkah-langkah detail perhitungannya?
  • Bagaimana contoh perhitungan dengan data riil?
  • Bagaimana penanganan data kembar (ties) yang benar?
  • Bagaimana cara menginterpretasikan nilai rs​?
  • Bagaimana prosedur lengkap uji hipotesis (sampel kecil & besar)?
  • Apa saja keunggulan spesifik menggunakan rs​?

Reference Points

  • Dr. Sandy Vantika - 5-Koefisien-Korelasi-Peringkat.pdf
  • Walpole - Walpole - Spearman.pdf
  • Kvam - Kvam - Spearman, Kendall's Tau.pdf

Konsep Fundamental dan Perbedaan Kunci

Koefisien Korelasi Peringkat Spearman (rs​) adalah ukuran asosiasi nonparametrik yang merupakan padanan dari koefisien korelasi Pearson konvensional. Disebut nonparametrik karena proses inferensinya (pengambilan kesimpulan) bebas dari asumsi distribusi populasi tertentu. Ia dihitung dengan cara mengganti nilai numerik aktual dari data dengan peringkatnya (ranks).

  • Perbedaan Fundamental: Pearson vs. Spearman
    • Asumsi: Korelasi Pearson mengasumsikan bahwa data sampel diambil dari distribusi normal bivariat. Sebaliknya, Spearman tidak memerlukan asumsi normalitas sama sekali. Data hanya perlu setidaknya berada pada skala ordinal.
    • Jenis Hubungan: Pearson secara spesifik mengukur kekuatan dan arah hubungan linier (garis lurus). Spearman mengukur hubungan monotonik, yaitu hubungan di mana variabel secara konsisten bergerak ke arah yang sama (naik atau turun) tetapi tidak harus dalam garis lurus. Ini membuat Spearman lebih andal untuk data yang memiliki hubungan melengkung (kurvilinier) yang jelas.

Perhitungan Koefisien Spearman (​)

Perhitungan rs​ didasarkan pada peringkat data, bukan nilai aslinya.

  1. Formula
    • Formula Konseptual (dari Pearson): Formula Spearman secara konseptual adalah formula Pearson yang diterapkan pada peringkat ui​=rank(xi​) dan vi​=rank(yi)
    • Formula Praktis (Sederhana): Jika tidak ada data kembar (ties), formula di atas dapat disederhanakan secara aljabar menjadi:
      • Di mana di​ adalah selisih antara peringkat untuk setiap pasangan data (di​=ui​−vi​).
      • n adalah jumlah pasangan data.
  2. Langkah-langkah Perhitungan dan Contoh
    • Tujuan: Mengukur hubungan antara kandungan Tar dan Nikotin pada 10 merk rokok.
    • Langkah 1: Beri Peringkat pada setiap variabel secara terpisah. Peringkat 1 untuk nilai terendah, dan seterusnya.
    • Langkah 2: Tangani Data Kembar (Ties). Jika ada nilai yang sama, gunakan rata-rata dari peringkat yang seharusnya mereka tempati (disebut midranks). Pada contoh ini, merk Marlboro dan Kool sama-sama memiliki Tar 17. Mereka seharusnya menempati peringkat 4 dan 5, sehingga keduanya diberi peringkat (4+5)/2 = 4.5.
    • Langkah 3: Hitung selisih peringkat (di​) dan kuadratkan (di2​).
Cigarette BrandTar Content (xi​)Nicotine Content (yi​)Rank (xi​)Rank (yi​)di​di2​
Viceroy140.92.02.00.00.00
Marlboro171.14.54.00.50.25
Chesterfield281.69.09.00.00.00
Kool171.34.56.0-1.52.25
Kent161.03.03.00.00.00
Raleigh130.81.01.00.00.00
Old Gold241.57.08.0-1.01.00
Philip Morris251.48.07.01.01.00
Oasis181.26.05.01.01.00
Players312.010.010.00.00.00
Total5.50
  • Langkah 4: Masukkan ke dalam formula.

Interpretasi dan Uji Hipotesis

Interpretasi Nilai rs​: Nilai rs​ selalu berada di antara -1 dan +1.

  • +1: Asosiasi positif sempurna; peringkat kedua variabel identik.
  • -1: Asosiasi negatif sempurna; peringkat kedua variabel berbanding terbalik.
  • Dekat 0: Menunjukkan tidak ada korelasi atau hubungan yang sangat lemah.

Uji Hipotesis: Digunakan untuk menguji apakah ada korelasi di tingkat populasi (ρ=0).

  1. Hipotesis:
    • H0​:ρ=0 (Tidak ada korelasi).
    • H1​: Bisa berupa (dua arah), (satu arah, positif), atau (satu arah, negatif).
  2. Prosedur Sampel Kecil (n sesuai tabel):
    • Cari nilai kritis dari Tabel A.21 berdasarkan jumlah pasangan n dan tingkat signifikansi α. Tabel ini menggunakan n, bukan derajat kebebasan.
    • Contoh Uji Hipotesis: Uji hipotesis untuk data rokok dengan α=0.01.
      • H0​:ρ=0
      • H1​:ρ>0
      • Daerah Kritis: Dari Tabel A.21 untuk n=10 dan α=0.01 (satu arah), nilai kritisnya adalah rs​>0.745.
      • Perhitungan: rs​ hitung adalah 0.967.
      • Keputusan: Karena 0.967>0.745, kita menolak H0​. Ada bukti signifikan adanya korelasi positif antara tar dan nikotin.
  3. Prosedur Sampel Besar (Aproksimasi Normal):
    • Ketika n melebihi nilai di tabel (seringkali n>10 atau n>30), distribusi rs​ mendekati distribusi normal dengan rata-rata 0 dan varians 1/(n−1).​
    • Hitung z
    • Bandingkan nilai Z ini dengan nilai kritis dari tabel normal standar (misal, 1.645 untuk α=0.05 satu arah).

Summary

Koefisien Korelasi Peringkat Spearman (rs​) adalah ukuran nonparametrik yang andal untuk hubungan monotonik (baik linier maupun tidak), yang dihitung berdasarkan peringkat data. Karena tidak memerlukan asumsi normalitas, ia memiliki keunggulan fleksibilitas dibandingkan korelasi Pearson. Perhitungannya menggunakan formula sederhana yang melibatkan selisih peringkat (di​), dan signifikansinya dapat diuji menggunakan nilai kritis dari tabel untuk sampel kecil atau aproksimasi normal (uji-Z) untuk sampel besar.