Back to MA2281 Statistika nonparametrik

Topic

Questions/Cues

  • Apa itu Kendall’s Tau (τ)?
  • Apa konsep pasangan Konkordan & Diskordan?
  • Bagaimana formula & perhitungan τ?
  • Bagaimana cara menangani data kembar (ties)?
  • Bagaimana cara menginterpretasikan nilai τ?
  • Apa perbedaan utama Tau Kendall dengan Spearman?
  • Bagaimana prosedur uji hipotesis untuk τ?

Konsep Dasar Kendall’s Tau (τ)

Tau Kendall (τ) adalah ukuran alternatif nonparametrik untuk ketergantungan bivariat (hubungan antara dua variabel). 1 Diperkenalkan oleh Maurice George Kendall pada tahun 1938, metode ini bekerja dengan cara menghitung jumlah pasangan pengamatan yang “konkordan” dan “diskordan” dalam sebuah sampel. 2

  • Pasangan Konkordan dan Diskordan
    • Konsep ini adalah inti dari Tau Kendall. Untuk setiap dua pasang pengamatan, dan , kita membandingkan urutannya.
    • Pasangan Konkordan (Concordant): Pasangan yang berurutan ke arah yang sama. Artinya, jika ​, maka ​ juga. Atau jika , maka juga.
    • Pasangan Diskordan (Discordant): Pasangan yang berurutan ke arah yang berlawanan. Artinya, jika ​, tetapi . Atau sebaliknya.
    • Tujuan: Untuk mengetahui apakah secara umum pasangan dalam data cenderung konkordan (indikasi korelasi positif) atau diskordan (indikasi korelasi negatif).

Perhitungan dan Formula

Perhitungan τ didasarkan pada jumlah pasangan konkordan (nc​) dan diskordan (nD​) dari total semua kemungkinan pasangan unik, yaitu

  1. Formula Utama (Tanpa Data Kembar)

    • Formula yang paling intuitif didasarkan pada selisih antara jumlah pasangan konkordan dan diskordan, dinormalisasi dengan total jumlah pasangan.
  2. Langkah-langkah Perhitungan:

    • Ambil semua kemungkinan pasangan unik dari observasi Anda.
    • Untuk setiap pasangan, tentukan apakah itu konkordan atau diskordan.
    • Hitung jumlah total nc​ dan nD​.
    • Masukkan nilai-nilai ini ke dalam formula τ.
  3. Penanganan Data Kembar (Ties)

    • Jika ada pasangan yang memiliki nilai yang sama (kembar) baik pada variabel X maupun Y, pasangan tersebut tidak dihitung sebagai konkordan maupun diskordan.
    • Dalam kasus ini, penyebut dalam formula disesuaikan untuk hanya mencakup pasangan yang tidak kembar.

Interpretasi dan Perbandingan dengan Spearman

Interpretasi Nilai τ:

  • Sama seperti Spearman, nilai τ berkisar dari -1 hingga +1.
  • +1: Semua pasangan adalah konkordan (korelasi positif sempurna).
  • -1: Semua pasangan adalah diskordan (korelasi negatif sempurna).
  • 0: Jumlah pasangan konkordan sama dengan diskordan (tidak ada asosiasi).

Perbedaan Utama dengan Spearman’s rs​:

  1. Interpretasi Probabilistik: Ini adalah keunggulan terbesar Tau Kendall. Nilai τ memiliki interpretasi probabilistik langsung yang tidak dimiliki Spearman. Hubungannya dapat dijelaskan sebagai odds-ratio:

    • Di mana P(C) adalah probabilitas pasangan acak bersifat konkordan, dan P(D) adalah probabilitasnya bersifat diskordan.
    • Contoh: Jika . Ini berarti, setiap pasangan pengamatan dua kali lebih mungkin untuk menjadi konkordan daripada diskordan. 5
  2. Kompleksitas Komputasi: Untuk dataset besar, perhitungan Tau Kendall lebih intensif. Kompleksitasnya adalah O(n2), dibandingkan dengan Spearman yang lebih efisien yaitu O(nlogn).

Uji Hipotesis Sampel Besar

Untuk sampel yang cukup besar, kita bisa menggunakan aproksimasi normal untuk menguji hipotesis nol bahwa tidak ada korelasi di populasi (H0​:τ=0).

  • Statistik Uji Z: ​​
  • Prosedur: Nilai zτ​ yang dihitung kemudian dibandingkan dengan nilai kritis dari distribusi normal standar (misalnya, 1.96 untuk α=0.05 uji dua arah) untuk membuat keputusan menolak atau tidak menolak H0​.

Summary

  • Tau Kendall (τ) adalah koefisien korelasi nonparametrik yang mengukur asosiasi dengan menghitung proporsi pasangan konkordan (searah) dan diskordan (berlawanan arah) dalam data. Keunggulan utamanya dibandingkan Spearman adalah interpretasi probabilistiknya yang jelas sebagai rasio peluang antara pasangan konkordan dan diskordan, meskipun secara komputasi lebih berat untuk dataset besar. Signifikansinya untuk sampel besar dapat diuji menggunakan statistik Z yang didekati dengan distribusi normal.