Uji Kruskal-Wallis (Kelompok 5) [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

Tugas Mata Kuliah Statistik Nonparametrik



ANALISIS VARIAN RANKING SATU ARAH KRUSKAL-WALLIS



Kelompok 5 Kelas 2E :



1. Imansyah



(11.6712)



2. Martha B. T. Napitupulu



(11.6773)



3. Martini Pratiwi



(11.6776)



4. Ni Putu Sumartini



(11.6811)



5. Salindri Trikusuma Wardhani (11.6892) 6. Yesdi Christian Calvin



Dosen : Dewita Nasution, M.Sc.



(11.6958)



SEKOLAH TINGGI ILMU STATISTIK 2013



Analisis Varian Ranking Satu Arah Kruskal-Wallis Analisis varian ranking satu arah Kruskal-Wallis atau biasa disebut Uji KruskalWallis pertama kali diperkenalkan oleh William H. Kruskal dan W. Allen Wallis pada tahun 1952. Uji ini merupakan salah satu uji statistik nonparametrik dalam kasus k sampel independen. Uji Kruskal-Wallis digunakan untuk menguji apakah k sampel independen berasal dari populasi yang berbeda, dengan kata lain uji ini dapat digunakan untuk menguji hipotesis nol bahwa k sampel independen berasal dari populasi yang sama atau identik dalam hal harga rata-ratanya. Oleh karena itu, uji Kruskal-Wallis juga merupakan perluasan dari uji Mann-Whitney. Menurut D.C. Montgomery (2005), apabila asumsi kenormalan yang dibutuhkan oleh metode statistika parametrik tidak dapat dipenuhi, maka peneliti dapat menggunakan metode alternatif sebagai pengganti analisis varian satu arah (One way ANOVA) yaitu Kruskal-Wallis Test. Sedangkan menurut Wayne W. Daniel dalam bukunya Applied Nonparametric Statistic, beberapa syarat yang harus dipenuhi dalam menggunakan Kruskal-Wallis Test adalah: 1. Pengamatan harus bebas satu sama lain (tidak berpasangan/independent). 2. Tipe data setidak-tidaknya adalah ordinal. 3. Variabel yang diamati merupakan variabel yang berdistribusi kontinyu.



Dasar Pemikiran dan Metode Data untuk pengujian Kruskal-Wallis pada umumnya dituangkan dalam tabel N baris dan k kolom. Banyaknya sampel yang terpilih dituliskan dalam tabel secara baris, sedangkan kelompok atau kategori yang tersedia dituliskan secara kolom. Dalam penghitungan uji Kruskal-Wallis ini, masing-masing nilai observasi diberi ranking secara keseluruhan dalam satu rangkaian. Pemberian ranking diurutkan dari nilai yang terkecil hingga nilai yang terbesar. Nilai yang terkecil diberi ranking 1 dan nilai yang terbesar diberi ranking N (dimana N adalah jumlah seluruh observasi). Apabila terdapat angka yang sama, maka ranking dari nilai-nilai tersebut adalah rata-rata ranking dari nilainilai observasi tersebut. Jika seluruh nilai observasi telah diberi ranking, langkah selanjutnya adalah menghitung jumlah ranking dari masing-masing kolom (Rj). Samp el



Kelompok / Kategori



1



X11



R11



X12



R12







X1k



R1k



2



X21



R21



X22



R22







X2k



R2k



Xn1 -



Rn1 R1



Xn2 -



Rn2 R2



… …



Xnk -



Rnk Rk



. . . nj Rj



Selanjutnya, uji Kruskal-Wallis dapat didefinisikan dengan rumus:



2 k 12 R j H   3( N  1)  Rumus N ( N  1) i 1 n j



dimana, H: nilai Kruskal-Wallis dari hasil penghitungan Rj: jumlah rank dari kelompok/kategori ke-j nj : banyaknya kasus dalam sampel pada kelompok/kategori ke-j k: banyaknya kelompok/kategori N: jumlah seluruh observasi (N=n1+n2+n3+………..+nk) Jika ditemukan angka sama sebanyak lebih dari 25% nilai observasi sehingga mengakibatkan banyak nilai ranking yang sama, maka perlu adanya koreksi pada rumus penghitungan uji Kruskal-Wallis, dengan faktor koreksinya adalah:



1 dimana,







T 3 N N



1 



 t 3  t  Rumus 3 N N



t : banyaknya nilai observasi tertentu yang sama pada serangkaian nilai observasi N : jumlah seluruh observasi (N=n1+n2+n3+………..+nk)



Sehingga rumus uji Kruskal-Wallis dengan kasus angka sama berjumlah banyak adalah:



2



H 



k 12 R j  3( N  1)  N ( N  1) i 1 n j



1







T 3 N N



Rumus (8.3)



Metode dan Prosedur 1. Penentuan Hipotesis Nol dan Hipotesis Alternatif H0 : k sampel berasal dari populasi yang sama H1 : k sampel berasal dari populasi yang berbeda 2. Menentukan Tes Statistik / Statistik Uji Karena tujuannya adalah menguji apakah k sampel independen berasal dari populasi yang sama maka uji statistik yang kita gunakan adalah uji Kruskal-Wallis dengan statistik ujinya H yang berdistribusi Chi-Square dengan derajat bebas (k-1). 3. Menentukan Tingkat Signifikansi Tingkat signifikansi  adalah bilangan yang mencerminkan besarnya peluang menolak hipotesis nol ketika hipotesis nol bernilai benar. 4. Distribusi Sampling H mendekati distribusi Chi-Square dengan derajat bebas (k-1). Nilai H dapat dihitung dengan Rumus (8.1). Adapun ketentuan penggunaan tabel adalah sebagai berikut: a. Jika k=3 dan nj  5 (j=1;2;3), Tabel O dapat digunakan untuk menentukan nilai yang berkaitan dengan harga di bawah H0. b. Dalam kasus lain, dapat digunakan Tabel C dengan derajat bebas (k-1).



5. Daerah Penolakan Daerah penolakan terdiri dari semua harga H yang sedemikian besar sehingga kemungkinan yang berkaitan dengan terjadinya harga – harga itu di bawah H 0 sama dengan atau kurang dari . 6. Keputusan H0 akan ditolak jika nilai H  (k-1) atau nilai p-value   sebaliknya H0 akan gagal ditolak jika nilai H < (k-1) atau nilai p-value > .



Ringkasan Prosedur 1. Berilah ranking pada masing – masing nilai observasi dengan urutan dari ranking 1 hingga N. 2. Tentukan harga R (jumlah ranking) untuk masing – masing kelompok atau kategori. 3. Jika ditemukan angka sama sebanyak lebih dari 25% nilai observasi, maka hitunglah harga H dengan menggunakan Rumus (8.3). Jika tidak, gunakanlah Rumus (8.1). 4. Metode untuk menilai signifikansi harga observasi H bergantung pada besarnya k dan banyaknya sampel pada setiap kelompok/kategori tersebut. a. Jika k=3 dan nj  5 (j=1;2;3), Tabel O dapat digunakan untuk menentukan nilai yang berkaitan dengan harga di bawah H0. b. Dalam kasus lain, dapat digunakan Tabel C dengan derajat bebas (k-1). 5. Jika kemungkinan yang berkaitan dengan harga observasi H adalah sama atau kurang dari , maka tolak H0 dan terima H1.



Contoh Soal Uji Kruskal-Wallis Contoh 1 Untuk membandingkan tingkat keefektifan dari 3 macam metode diet, maka sebanyak 22 orang mahasiswi yang dipilih dari suatu universitas dibagi ke dalam 3 kelompok yang



mana masing-masing kelompok mengikuti program diet selama empat minggu sesuai dengan metode yang telah dibuat. Setelah program diet berakhir, maka diperoleh banyaknya berat badan yang hilang (dalam kg) dari mahasiswi-mahasiswi tersebut sebagai berikut: Metode Diet 1 Berat Badan Samp (BB) yg el hilang 1 5,3 2 4,2 3 3,7 4 7,2 5 6,0 6 4,8



Metode Diet 2 Berat Badan Samp (BB) yg el hilang 1 6,3 2 8,4 3 9,3 4 6,5 5 7,7 6 8,2 7 9,5



Metode Diet 3 Berat Badan Samp (BB) yg el hilang 1 2,4 2 3,1 3 3,7 4 4,1 5 2,5 6 1,7 7 5,3 8 4,5 9 1,3



Untuk menguji Ho yang menyatakan bahwa tingkat keefektifan dari ketiga metode diet di atas adalah sama, terhadap hipotesis alternatif yang menyatakan bahwa tingkat keefektifan ketiga metode di atas adalah tidak sama (α = 5%). Jawaban : o Hipotesis H0 : tingkat keefektifan dari ketiga metode diet adalah sama H1 : tingkat keefektifan dari ketiga metode diet adalah tidak sama o Tes Statistik : Kruskal-Wallis Test o Tingkat Signifikansi : α=5%, o Distribusi sampling : H mendekati distribusi Chi-Square dengan derajat bebas (k-1), sehingga wilayah kritis dapat ditentukan dengan menggunakan Tabel C. o Penghitungan n1=6 ; n2=7 ; n3=9 ; N= n1 + n2 + n3 = 22



Metode Diet 1 BB yg Rankin hilang g 5,3 12,5 4,2 9 3,7 6,5 7,2 17 6,0 14 4,8 11



Metode Diet 2 BB yg Ranking hilang 6,3 15 8,4 20 9,3 21 6,5 16 7,7 18 8,2 19 9,5 22



R1 = 70



R2 = 131



Metode Diet 3 BB yg Rankin hilang g 2,4 3 3,1 5 3,7 6,5 4,1 8 2,5 4 1,7 2 5,3 12,5 4,5 10 1,3 1 R3 = 52



2 k 12 R j H   3( N  1)  N ( N  1) i 1 n j



[



]



12 702 1312 522 ¿ + + −3 ( 22+1 ) 22(22+1) 6 7 9



= 15,633 o Daerah penolakan : H  (k-1) atau p-value   o Keputusan :



0,05(2) = 5,991 Karena 15,633 > 5,991



H > 0,05(2) , maka Tolak H0



o Kesimpulan : Dengan tingkat kepercayaan 95 %, belum cukup bukti untuk menyatakan bahwa tingkat keefektifan dari ketiga metode diet tersebut adalah sama.



Contoh 2 Manajemen restoran fastfood sangat ingin tahu pendapat langganannya mengenai pelayanan, kebersihan dan kualitas makanan dari restorannya. Pihak management ingin membandingkan hasil rating pelanggan untuk tiga shift yang berbeda, yaitu:



Shift 1: 16.00 – midnight ; Shift 2: midnight – 08.00 ; Shift 3: 08.00 – 16.00 Pelanggan diberi kesempatan untuk mengisi kartu saran. Pada penelitian ini 10 kartu saran (customer card) dipilih secara random, untuk setiap shift. Rating digolongkan dalam empat kategori yaitu 4 = sempurna, 3 = baik, 2 = biasa, 1 = buruk. Diperoleh data seperti dibawah ini: 16.00 Midnight 08.00 Midnight 08.00 16.00 4 3 3 4 4 1 3 2 3 4 2 2 3 3 1 3 4 3 3 3 4 3 3 2 2 2 4 3 3 1 Dengan tingkat kepercayaan 95%, dapatkah pihak manajemen mengatakan bahwa karyawannya memberikan pelayanan, kebersihan, dan kualitas makanan yang sama sepanjang hari? Jawaban : o Hipotesis H0 : Tidak ada perbedaan rating pelanggan untuk pelayanan, kebersihan, dan kualitas makanan antara ketiga shift tersebut. H1 : Ada perbedaan rating pelanggan untuk pelayanan pelayanan, kebersihan, dan kualitas makanan antara ketiga shift tersebut. o Tes Statistik : Kruskal-Wallis Test. Persoalan di atas merupakan persoalan k sampel independent. Karena data berada pada skala pengukuran ordinal (ranking), maka Kruskal-Wallis Test dapat digunakan. o Tingkat Signifikansi : α = 0,05 o Distribusi sampling : H mendekati distribusi Chi-Square dengan derajat bebas (k-1), sehingga wilayah kritis dapat ditentukan dengan menggunakan Tabel C.



o Penghitungan n1= n2= n3=10 ; N= n1 + n2 + n3 = 30 16.00Midnight 4 4 3 4 3 3 3 3 2 3



Rank



Ran k



4



∑T



16.5 27 6.5 6.5 16.5 27 16.5 16.5 6.5 16.5 R2 = 156 3 Penghitungan untuk angka sama dengan koreksi: T =t −t Nilai Observas i t T



1 3 24



27 27 16.5 27 16.5 16.5 16.5 16.5 6.5 16.5 R1 = 186.5



Midnight08.00 3 4 2 2 3 4 3 3 2 3



2 6 210



[



3 14 2730



7 336



08.0016.00 3 1 3 2 1 3 4 2 4 1



16.5 2 16.5 6.5 2 16.5 27 6.5 27 2 R3 = 122.5



(24 +210+2730+336 ) = 3 k 30 2 −30 N −N 12 Rj ∑ −3 ( N +1 ) N (N + 1) j=1 n j H= 3300 ΣT ¿ 1− 3 26970 N −N 3



]



12 186,52 1562 122.52 + + −3 (30+1) 30(30+1) 10 10 10 ¿ 3300 1− 26970 = 3,01 o Daerah penolakan : H  (k-1) atau p-value   o Keputusan :



0,05(2) = 5,991 Karena 3,01 < 5,991



Rank



H < 0,05(2) , maka gagal tolak H0



o Kesimpulan : Dengan tingkat kepercayaan 95 %, belum cukup bukti untuk menyatakan bahwa ada perbedaan rating pelanggan untuk pelayanan, kebersihan, dan kualitas makanan antara ketiga shift tersebut.



Contoh 3 Sebuah perusahaan ingin mengetahui apakah terdapat perbedaan keterlambatan masuk kerja antara pekerja yang rumahnya jauh atau dekat dari lokasi perusahaan. Misalkan jarak rumah dikategorikan dekat ( kurang dari 10 km), sedang (10 – 15 km) dan jauh ( lebih dari 15 km). Keterlambatan masuk kerja dihitung dalam menit keterlambatan selama sebulan terakhir. Penelitian dilakukan pada tiga kelompok pekerja dengan sampel acak, dengan masingmasing sampel untuk yang memiliki jarak rumah dekat sebanyak 5 sampel, jarak sedang sebanyak 4 sampel dan jauh sebanyak 3 sampel. Ujilah dengan tingkat kepercayaan 95 %. Datanya sebagai berikut : Dekat 59 110 132 143 165



Sedang 77 99 128 144



Jauh 89 102 121



Jawaban : o Hipotesis H0 : Tidak ada perbedaan lama keterlambatan antara tiga kategori pekerja berdasarkan jarak rumahnya. H1 : Ada perbedaan lama keterlambatan antara tiga kategori pekerja berdasarkan jarak rumahnya o Tes Statistik : Kruskal-Wallis Test. Karena data berada pada skala pengukuran rasio (lama keterlambatan), maka kruskal-wallis dapat digunakan. o Tingkat Signifikansi : α = 0,05 o Penghitungan



n1= 5 ; n2= 4 ; n3= 3 ; N= n1 + n2 + n3 = 12 Dekat 59 110 132 143 165



Rank 1 6 9 10 12 R1 = 38



Sedang 77 99 128 144



Rank 2 4 8 11



Jauh 89 102 121



R2 = 25



Rank 3 5 7



R3 = 15



2



k



Rj 12 H= −3( N +1) ∑ N (N +1) j=1 n j



[



2



2



2



]



12 38 25 15 ¿ + + −3(13) 12(13) 5 4 3 = 1,004



o Daerah penolakan : p-value   o Keputusan : Karena k=3 dan nj  5 (j=1;2;3), maka kita dapat menggunkan Tabel O untuk menentukan nilai yang berkaitan dengan harga di bawah H0. Dari tabel O untuk nilai



n1=5



,



n2=4



, dan



n3=3



, p-value untuk H =



1,004 adalah lebih besar dari 0,103 (p-value > 0,103). Karena p-value > 0,05 , maka gagal tolak H0 o Kesimpulan : Dengan tingkat kepercayaan 95 %, belum cukup bukti untuk menyatakan bahwa ada perbedaan lama keterlambatan antara tiga kategori pekerja berdasarkan jarak rumahnya.



Daftar Pustaka Siegel, Sidney. 1985. Statistik Nonparametrik untuk Ilmu-Ilmu Sosial. Jakarta. PT Gramedia Pustaka Utama. Daniel, Wayne W. 1978. Applied Nonparametric Statistics. United States of America. PWS-KENT Publishing Company.



Saleh, Samsubar. 1985. Statistik Nonparametrik. Yogyakarta. BPFE-Yogyakarta.