Cara Mengatasi Data Berdistribusi Tidak Normal [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

Cara Mengatasi Data Berdistribusi Tidak Normal Hanif Akhtar December 17, 2017 SPSS Statistika Uji Asumsi Ketika kita hendak melakukan analisis statistik parametrik, seperti melakukan uji korelasi product moment, salah satu asumsi yang harus dipenuhi adalah distribusi data kita normal. Oleh karena itu sebelum melakukan analisis statistik parametrik, terlebih dahulu kita harus melihat apakah data kita terdistribusi normal atau tidak. Bagaimana cara untuk melihat data kita normal atau tidak? Berikut akan diberikan contoh penelitian fiktif tentang “Hubungan antara IQ dengan prestasi”. Data fiktif dapat didownload di sini



1. 2. 3. 4.



Uji Normalitas di SPSS Sebelum menguji hipotesis kita yakni “ada hubungan antara IQ dengan prestasi”, maka kita uji terlebih dahulu normalitas data IQ dan prestasi kita. Ada berbagai cara untuk menguji normalitas di SPSS, seperti dengan melihat histogram dan nilai skewness dan kurtosis serta dengan uji kolmogorov-smirnov. Contoh kali ini kita akan menggunakan uji kolmogorov-smirnov. Uji normalitas dengan kolmogorov-smirnov dilakukan dengan membandingkan distribusi empirik data kita dengan distribusi normal yang diharapkan. Karena merupakan uji beda, maka nilai p yang diharapkan adalah yang tidak signifikan, yakni p>0,05. Hal ini menunjukkan bahwa tidak ada perbedaan antara kedua distribusi itu, yang berarti distribusi data empirik kita adalah normal. Untuk menguji normalitas di SPSS dapat dilakukan dengan cara Klik analyze – descriptive statistics – explore Masukkan variabel IQ dan prestasi ke dependent list Klik plots, lalu centang histogram dan normality plots with tests Klik continue lalu OK



Dari output tersebut dapat kita lihat, variabel IQ memiliki nilai kolmogorov-smirnov sebesar 0,53 dan p=0,200 (p>0,05), dengan demikian tidak ada perbedaan antara distribusi empirik data kita dengan distribusi normal ideal, oleh karena itu distribusi data variabel IQ normal. Sedangkan pada variabel prestasi memiliki nilai kolmogorovsmirnov sebesar 0,105 dan p=0,027 (p0,05). Dengan demikian distribusi data variabel prestasi normal. Begitu juga pada variabel IQ yang memiliki p>0,05, sehingga variabel IQ juga terdistribusi normal. Dengan demikian masalah ketidaknormalan data kita sudah teratasi.



Transformasi Data Jika beberapa ahli tidak setuju dengan cara menghapus data-data ekstrem, cara lain yang bisa ditempuh adalah dengan transformasi data. Transformasi data dilakukan dengan mengubah data kita dengan formula tertentu tergantung dari bentuk grafik kita. Sebelum melakukan transformasi data, kita harus tahu terlebih dahulu bagaimana bentuk grafik kita. Cara melihat grafik data kita adalah dengan cara 1. Klik analyze – descriptive statistics – frequencies 2. Masukkan variabel prestasi dan pilih menu chart, pilih histogram dan centang show normal curve on histogram. 3. Klik continue dan OK, maka akan diperoleh output seperti berikut.



Grafik tersebut menggambarkan kurve kita condong ke kanan. Beberapa kemungkinan grafik yang akan muncul adalah sebagai berikut.



Sumber gambar: http://i-codee.blogspot.co.id Panduan transformasi data berdasarkan bentuk grafik dapat dilihat di tabel di bawah. Bentuk Grafik Histogram Moderate positive skewness Substansial positive skewness Severe positive skewness Moderate negative skewness Substansial negative skewness Severe negative skewness



Bentuk Transformasi Data SQRT(x) LG10(x) 1/x SQRT(k-x) LG10(k-x) 1/(k-x)



k = nilai tertinggi dari data mentah x



1. 2. 3. 4.



Jika kita kembali ke data kita dan melihat grafik histogram kita, maka bentuk grafik kita adalah moderate negative skewness, sehingga transformasi data yang kita pakai adalah SQRT(k-x). K adalah nilai tertinggi dari data mentah variabel prestasu, yakni 86. Untuk mentransformasi data, kita dapat melakukan langkah berikut Klik transform – compute variable. Pada kotak target variable, kita ketik nama variabel baru kita, misal trans_prestasi Pada numeric expression, masukkan formula kita yakni SQRT(86-prestasi) klik OK



Kembali lagi ke data kita, maka kita sudah memiliki variabel baru bernama trans_prestasi yang tidak lain adalah transformasi data dari variabel prestasi. Untuk melihat apakah transformasi data kita berhasil atau tidak, kita uji kembali normalitas data kita dengan kolmogorov smirnov.



Dari hasil uji kolmogorov-smirnov, diperoleh p>0,05, sehingga dapat dikatakan bahwa variabel transformasi prestasi ini terdistribusi secara normal. Catatan mengenai transformasi data:  Transformasi data tidak hanya dapat digunakan untuk mengatasi ketidaknormalan data, tapi juga dapat digunakan untuk mengatasi pelanggaran asumsi lainnya, seperti lineraritas dan homogentitas varians pada uji beda. Meskipun umum digunakan, namun penggunaan transformasi data sendiri juga tidak lepas dari pro dan kontra. Beberapa diskusi terkait dapat dilihat di sini  Jika transformasi data dilakukan, maka data yang ditampilkan dalam laporan kita tetaplah data asli. Namun data yang digunakan untuk uji statistik parametrik menggunakan data transformasi.  Jika uji statistik dilakukan untuk mengkorelasikan dua atau lebih variabel, maka setiap variabel juga harus ditransformasikan dalam bentuk yang sama. Artinya, dalam contoh di atas, variabel IQ juga harus ditransformasi ke bentuk SQRT(k-IQ).



Mengubah Analisis ke Non-Parametrik Cara terakhir jika dengan menghapus outliers dan mentransformasi data kita belum berhasil adalah dengan mengubah teknik analisis kita ke analisis non-parametrik. Analisis non-parametrik tidak memerlukan asumsi normalitas seperti yang diperlukan pada analisis parametrik. Meskipun demikian, power test analisis non-parametrik ini tentu lebih lemah jika dibandingkan dengan analisis parametrik. Beberapa teknik analisis pengganti analisis parametrik disajikan dalam tabel di bawah ini. Analisis Parametrik



Analisis Non Parametrik



Fungsi



Paired sample t-test



Uji tanda Uji Wilcoxon



Meneliti perbedaan dalam suatu kelompok



Independent sample t-test



Uji Mann-Whitney U;



Membandingkan dua sample bebas



Anava satu jalur



Anava dengan menggunakan peringkat Kruskal-Wallis



Membandingkan tiga kelompok atau lebih



Anava dua jalur



Anava dua jalur Friedman



Korelasi Pearson



Korelasi peringkat Spearman



Membandingkan tiga kelompok atau lebih dengan menggunakan dua faktor yang berbeda Mengetahui hubungan korelasi linier antara dua perubah



Update! Sebelum menjudge data kita tidak normal, ada baiknya membaca artikel ini dulu. Cara menguji normalitas yang benar ada di situ.