Tugas Biostatistik [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

TUGAS BIOSTATISTIK ANALISIS KORELASI DAN ANALISIS REGRESI



Disusun oleh : Nama : Sri Setyorini NIM: 011714253003



PROGRAM STUDI ILMU KEDOKTERAN TROPIS JENJANG MAGISTER FAKULTAS KEDOKTERAN UNIVERSITAS AIRLANGGA SURABAYA 2017



1. Pendahuluan Berbagai fenomena yang terjadi dalam kehidupan selalu menimbulkan berbagai pertanyaan, mengapa itu terjadi ?, bagaimana itu terjadi ?, dan pertanyaanpertanyaan lain yang pada dasarnya menunjukan keingintahuan manusia untuk dapat memahami dan menjelaskannya. Kompleksnya masalah yang terjadi baik secara bersamaan maupun beriringan berakibat pada tidak sederhananya jawaban yang bisa dimunculkan. Keadaan ini telah mendorong manusia untuk memilih dan memilahmilah berbagai kejadian serta mengkajinya sebagai upaya untuk memahaminya. Apabila terjadi suatu gejala yang sama dengan gradasi yang berbeda dengan latar sebab (secara rasional) yang sama, manusia mencoba mengkaji perbedaan tersebut dengan memunculkan pertanyaan apakah perbedaan tersebut benar-benar merupakan perbedaan yang nyata ataukah tidak ?, bila terjadi gejala yang sama dengan gradasi yang berbeda dan latar sebab yang berbeda, manusiapun akan mencari jawabannya terhadap perbedaan tersebut. Ketika pengkajian terhadap masalahmasalah tersebut dilakukan, manusia mencoba mengkaitkan antara satu gejala dengan gejala lainnya, baik itu terhadap gejala yang menunjukan kesamaan ataupun perbedaan. Secara sederhana jawaban terhadap masalah-masalah tersebut terkadang dicukupkan pada jawaban yang bersifat Common Sense dengan menunjuk pada bukti empiris (dengan keterbatasan pengamatan) serta mengkaitkannya dengan gejala yang mengiringinya. Akan tetapi bukti-bukti empiris (dalam penggunaan Common Sense, bukti empiris umumnya berrsifat tunggal karena keterbatasan pengamatan) yang teramati pada dasarnya merupakan masalah yang kompleks pula sehingga memerlukan pendalaman dan pengulangan pengamatan baik secara beriringan ataupun bersamaan, dalam upaya ini frekuensi kejadian serta representasi kejadian terhadap kejadian secara keseluruhan menjadi penting untuk dikaji sebelum dimunculkan jawabannya. Dalam kaitan ini maka Statistik menjadi alat bantu yang penting guna mengkaji dan menganalisa berbagai gejala tersebut, sehingga dapat diperoleh bukti-bukti statistik yang dapat memperkuat bukti-bukti empiris (Common Sense), dan Ilmu Statistik telah lama mengembangkan alat untuk menganalisis berbagai hubungan antara gejala-gejala yang bergradasi atau bervariasi. Statistik berasal dari kata STATISTIC yang berarti kumpulan angka-angka yang terkadang disusun dalam tabel atau daftar, sering pula disertai dengan diagram atau grafik dan keterangan lain yang dipandang perlu. Atau sering pula diartikan



sebagai sekumpulan angka. Sedangkan yang dimaksud dengan statistika atau yang dikenal dalam bahasa Inggris STATISTICS (menggunakan S), adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan bahan/keterangan, pengolahan, penyajian dan analisis, penarikan kesimpulan serta pembuatan kesimpulan/ keputusan yang beralasan berdasarkan analisis yang dilakukan. Sebagai alat analisis, ilmu statistika meliputi dua kelompok bidang kerja, yaitu statistika deskriptif dan statistika inferensia yang masing-masing berkaitan dengan model analisis yang berbeda. Sedangkan jika dikelompokkan dalam cara statistika bekerja, dapat dikelompokkan dalam dua kelompok yaitu statistika parametrik dan statistika non parametrik. a.



Statistika Deskriptif dan Inferensia Statistika deskriptif adalah bidang ilmu pengetahuan statistika yang mempelajari tata cara penyusunan, penyajian dan penggambaran data yang telah dikumpulkan. Ruang lingkup dari statistika deskriptif meliputi : 1. Distribusi frekuensi 2. Pengukuran nilai sentral (mean, modus, median dan standar deviasi), dispersi, skewness dan kurtosis. 3. Penyajian data dalam bentuk grafik (histogram, polygon, ogive) 4. Angka Indeks Statistika inferensia adalah bidang ilmu statistika yang mempelajari tata cara penarikan kesimpulan mengenai keseluruhan populasi berdasarkan data yang ada yang disebut sampel. Di dalamnya berisi estimasi parameter, uji hipotesis, prediksi dan perhitungan derajat asosiasi antar variabel. Adapun ruang lingkup dari statistika inferensia meliputi : 1. Probabilitas 2. Distribusi data 3. Estimasi parameter 4. Uji hipotesis termasuk di dalamnya uji chi square dan analisis variansi 5. Analisis regresi 6. Analisis korelasi 7. Analisis Time Series



b.



Statistika Parametrik dan Statistika Nonparametrik Inferensia yang dilakukan terhadap data dengan persyaratan bahwa datanya memiliki distribusi tertentu (misalnya normal) dengan keterjaminan homogenitas



variansi disebut statistika parametrik. Sedangkan apabila inferensia terhadap data yang dianalisis tidak memenuhi syarat berdistribusi tertentu atau free distribution disebut statistika nonparametrik. Dengan kata lain uji statistik nonparametrik merupakan uji dengan tidak memperhatikan syarat-syarat distribusi data. Kegunaan Statistik Dalam Bidang Kesehatan a. Memberi keterangan tentang masalah-masalah kesehatan masyarakat yang dihadapi serta hal-hal perlu mendapat prioritas. b. Memberikan keterangan penyebaran penyakit berdasarkan orang yang diserang, waktu penyerangan, luasnya wilayah serang dan kecenderungannya. c. Memperkirakan perkembangan suatu penyakit dengan berdasarkan periodisasinya / trend. d. Memperkirakan faktor-faktor penyebab masalah, fakta yang akan dan telah terjadi. e. Memperkirakan sumber daya dan potensi pemanfaatan serta pengembangannya dalam upaya mengantisipasi permasalahan yang terjadi. f. Merencanakan upaya yang efektif, efisien berdasarkan kenyataan, prioritas dan sumber daya yang tersedia. g. Memahami, menganalisis data dan informasi guna membantu mengambil keputusan. h. Menganalisis hambatan pelaksanaan program kesehatan masyarakat serta alternatif pemecahannya. i. Menilai hasil-hasil kegiatan yang telah dicapai. j. Mendokumentasikan semua data kesehatan masyarakat, untuk dapat dibandingkan dengan daerah lain atau keadaan yang akan datang.. Dalam suatu penelitian yang mengamati lebih dari satu faktor atau peubah (variabel), biasanya akan timbul persoalan tentang relasi atau hubungan di antara faktor-faktor yang diamati dalam penelitian. Untuk mengetahui bentuk hubungan di antara faktor-faktor tersebut dapat digunakan analisis regresi yang merupakan hubungan sebab akibat. Dalam analisis regresi, bentuk hubungan di antara faktor dinyatakan dalam bentuk hubungan fungsional yang dinyatakan dalam suatu persamaan dan disebut persamaan regresi. Persamaan regresi dapat ditentukan dari sebaran data hasil pengamatan dan bentuknya merupakan garis lurus (linier) atau dalam bentuk non linier (lengkung). Sebagai tindak lanjut dari analisis regresi dapat ditentukan pula kadar atau keeratan hubungan di antara faktor-faktor tersebut. Untuk



mengetahui dan mengukur keeratan hubungan di antara faktor-faktor dapat dipergunakan koefisien korelasi untuk faktor yang berbentuk kuantitatif, sedangkan untuk faktor yang berbentuk kualitatif pengukuran kadar hubungan atau kadar ketergantungan dapat digunakan berbagai uji yang di antaranya adalah uji khi-kuadrat untuk data yang tersaji dalam tabel kontingensi.



2. Analisis Regresi Istilah "regresi" pertama kali diperkenalkan oleh Sir Francis Galton pada tahun 1886. Galton menemukan adanya tendensi bahwa orang tua yang memiliki tubuh tinggi, memiliki anak-anak yang tinggi pula dan orang tua yang pendek memiliki anak-anak yang pendek pula. Kendati demikian, ia mengamati ada kecenderungan bahwa tinggi anak bergerak menuju rata-rata tinggi populasi secara keseluruhan. Dengan kata lain ketinggian anak yang amat tinggi atau orang tua yang amat pendek cenderung bergerak ke arah rata-rata tinggi populasi. Inilah yang disebut hukum Galton mengenai regresi universal. Dalam bahasa Galton ia menyebutnya sebagai regresi menuju medikritas. Interpretasi modern mengenai regresi agak berlainan dengan regresi versi Galton. Secara umum. analisis regresi pada dasarnya adalah studi mengenai ketergantungan variabel dependen (terikat) dengan satu atau lebih variabel independen (variabel penjelas/bebas), dengan tujuan untuk mengestimasi dan/atau memprediksi rata-rata populasi atau nilai rata-rata variabel dependen berdasarkan nilai variabel independen yang diketahui. Hasil analisis regresi adalah berupa koefisien untuk masing-masing variabel independen. Koefisien ini diperoleh dengan cara memprediksi nilai variabel dependen dengan suatu persamaan; Koefisien regresi dihitung dengan dua tujuan sekaligus: Fertama, meminimumkan penyimpangan antara nilai aktual dan nilai estimasi variabel dependen berdasarkan data yang ada . Dalam analisis regresi, selain mengukur kekuatan hubungan antara dua variabel atau lebih, juga menunjukkan arah hubungan antara variabel dependen dengan variabel 2 independen. Variabel dependen diasumsikan random/stokastik, yang berarti mempunyai distribusi probabilistik. Variabel independen/bebas diasumsikan memiliki nilai tetap (dalam pengambilan sampel yang berulang)



Teknik estimasi variabel dependen yang melandasi analisis regresi disebut Ordinary Least Squares (pangkat kuadrat terkecil biasa). Metode OLS diperkenalkan pertama kali oleh Carl Friedrich Gauss, seorang ahli matematika dari Jerman. Inti metode OLS adalah mengestimasi suatu garis regresi dengan jalan meminimalkan jumlah dari kuadrat kesalahan setiap observasi terhadap garis tersebut. Regresi linear adalah alat statistik yang dipergunakan untuk mengetahui pengaruh antara satu atau beberapa variabel terhadap satu buah variabel. Variabel yang mempengaruhi sering disebut variabel bebas, variabel independen atau variabel penjelas, sedangkan variabel yang dipengaruhi sering disebut dengan variabel terikat atau variabel dependen. Gujarati (2006) juga mendefinisikan analisis regresi sebagai kajian terhadap hubungan satu variabel yang disebut sebagai variabel yang diterangkan (the explained variabel) dengan satu atau dua variabel yang menerangkan (the explanatory). Tujuan menggunakan analisis regresi ialah 1. Membuat estimasi rata-rata dan nilai variabel tergantung dengan didasarkan pada nilai variabel bebas. 2. Menguji hipotesis karakteristik dependensi 3. Untuk meramalkan nilai rata-rata variabel bebas dengan didasarkan pada nilai variabel bebas diluar jangkaun sample. Terdapat 2 (dua) metode analisis regresi linier (Linear Regression Analysis), yaitu: analisis regresi linier sederhana dan analisis regresi linier berganda (multiple). Disebut regresi sederhana jika melibatkan satu variabel bebas (X) dengan satu variabel terikat (Y), sedangkan disebut regresi berganda (multiple) jika melibatkan lebih dari satu variabel bebas (X1, X2, …, Xk) dengan satu variabel terikat (Y). Disebut regresi linier karena variabel bebasnya berpangkat satu. Pada analisis regresi ada beberapa persyaratan (asumsi) yang harus dipenuhi diantaranya adalah: Variabel X dan variabel Y memiliki skala pengukuran sekurangkurangnya interval.



X2 adalah variabel bebas ke-2 Xk adalah variabel bebas ke-k



β0, β1, β2, βk adalah koefesien regresi. ε adalah gallat atau error Jika k=1, maka model regresi tersebut dinamakan regresi linier sederhana, jika k>1, maka persamaan regresi tersebut dinamakan regresi linier berganda. Untuk menghitung nilai-nilai koefesien regresi dapat dilakukan dengan Metode Kuadrat Terkecil (Least Square Method) atau dengan bantuan paket program statistik seperti (SPSS, Minitab, SAS, S-Plus dan lain-lain). Setelah koefesien regresi diperoleh langkah selanjutnya adalah melakukan pengujian terhadap koefesienkoefesien tersebut. Ada dua tahap yang harus dilakukan dalam pengujian ini, yaitu: 1. Pengujian secara keseluruhan (simultan) dengan uj-F. a. Hipotesis pada pengujian ini adalah: H0: β0= β1= β2=...= βk=0 . Artinya, semua variabel bebas tidak berpengaruh terhadap variabel terikat. H1: Sekurang-kurangnya ada sebuah βi ≠ 0. Artinya, ada variabel bebas yang berpengaruh terhadap variabel terikat. b. Statistik uji yang akan digunakan adalah Uji-F dari distribusi F-Snedecor melalui daftar ANOVA.



c. Kriteria ujinya adalah tolak H0, jika F-hitung > F-tabel, dimana F-tabel = F1-α;k:nk-1. Jika H0 ditolak maka dilanjutkan dengan pengujian secara individual(parsial). Pengujian secara individual (Parsial) a. Hipotesis pada pengujian ini adalah: H0: βi = 0. Artinya, tidak ada pengaruh variabel ke-i terhadap variabel terikat. H1: βi ≠ 0. Artinya, ada pengaruh variabel ke-i terhadap variabel terikat. b. Statistik uji yang akan digunakan adalah Uji-t dari distribusi t-Student dengan rumus:



c. Kriteria ujinya adalah tolak H0, jika p-value < α atau t-hitung > t-tabel, dimana ttabel = t1-α/2;n-k-1. Jika H0 ditolak artinya ada pengaruh yang nyata antara variabel ke-i terhadap variabel terikat. Koefisien Determinasi Koefisien determinasi berguna untuk mengetahui sumbangan dari masing-masing variabel bebas terhadap variabel tidak bebas. Dalam penelitian ini dipergunakan rumus sebagai berikut :



3. Analisis Korelasi Analisis korelasi bertujuan untuk mengukur kekuatan asosiasi (hubungan) linear antara dua variabel. Korelasi tidak menunjukkan hubungan fungsional atau dengan kata lain, analisis korelasi tidak membedakan antara variabel dependen dengan variabel independen. Korelasi menyatakan derajat hubungan antara dua



variabel tanpa memperhatikan variabel mana yang menjadi peubah. Karena itu hubugan korelasi belum dapat dikatakan sebagai hubungan sebab akibat. Dalam analisis korelasi akan diperoleh nilai koefesien korelasi yang menyatakan ukuran keeratan hubungan antara satu variabel dengan variabel lain.



Korelasi Linier Sederhana (r) dan Koefisien Determinasi (R=r2)  Koefisien Korelasi (r) merupakan ukuran hubungan linier/derajat keeratan antara variabel bebas (X) dan variabel takbebas (Y).  Nilai r berkisar antara -1 sampai +1.  Nilai r + (positif) menunjukan korelasi positif, artinya semakin besar nilai X maka akan semakin besar nilai Y, dan sebaliknya nilai r – (negatif) menunjukan korelasi negatif, artinya semakin besar nilai X maka semakin kecil nilai Y. Jika nilai r mendekati +1 atau -1, maka X dan Y memiliki korelasi linier yang tinggi.   



Jika nilai r = +1 atau r = -1 maka X dan Y memiliki korelasi linier sempurna. Jika nilai r = 0 maka X dan Y tidak memiliki relasi (hubungan) linier (dalam kasus r mendekati 0, anda dapat melanjutkan analisis ke regresi eksponensial). Koefisien Determinasi (R) merupakan ukuran proporsi keragaman (variansi) total nilai variabel takbebas (Y) yang dapat dijelaskan oleh nilai variabel bebas (X) melalui hubungan linier.



Rentang Koefisien Korelasi  0.00 - 0.20 : Hubungan yang sangat kecil dan bisa diabaikan (sangat tidak erat)  0.21 - 0.40 : Hubungan yang kecil (tidak erat)  0.41 - 0.70 : Hubungan yang cukup erat  0.71 - 0.90 : Hubungan yang erat  0.91 - 1.00 : Hubungan yang sangat erat Penetapan dan Interpretasi Koefisien Korelasi dan Koefisien Determinasi  Koefisien Korelasi Produk Momen-Pearson Penentuan koefisien korelasi untuk variabel dengan skala minimal interval.











Koefisien Korelasi Rank Spearman : rs Koefisien Korelasi Rank Spearman digunakan untuk penentuan koefisien korelasi pada variabel dengan skala minimal ordinal, sehingga obyek-obyek yang diteliti dapat di-ranking dalam rangkaian terurut.



Korelasi Ganda



Korelasi yang terdiri dari dua variabel bebas (X1, X2) serta satu variabel terikat (Y). apabila perumusan masalahnya terdiri dari tiga masalah, maka hubungan antara masing-masing variabel dilakukan dengan cara perhitungan korelasi sederhana, oleh karena itu berikut ini hanya akan dikemukakan cara perhitungan ganda antara X1, dan X2 dengan Y, yang bila dibagankan akan nampak sebagai berikut :



X1 Y X2



Adapun untuk menghitung koefisien korelasi ganda dapat digunakan rumus berikut: 



Cara pertama



Menggunakan rumus sebagai berikut



r2yx1+r2yx2 - 2ryx1.ryx2.rx1x2 Ry.x1x2 = 1 – r2x1x2



Uji signifikansi Korelasi Ganda : Fh







=



(R2/2) : (1-R2)/(n-3)



Fh








Ft



=



Korelasi signifikan



Korelasi Parsial Korelasi parsial adalah korelasi antara satu variabel bebas dengan variabel terikat



dengan dengan variabel bebas lainnya bersifat tetap. Sebagai contoh korelasi dengan dua variabel bebas : X1, X2 dan Y, maka korelasi parsial anara X1 dengan Y dikontrol oleh variabel X2 dan korelasi X2 denga Y dikontrol oleh X1 adapun rumusnya adalah sbb :



Korelasi X1 dengan Y dikontrol oleh X2 ry1.2



=



ry1



ry2 .r12



-



(1 – ry22) (1 - r122) Korelasi X2 dengan Y dikontrol oleh X1: ry2.1



=



ry2



-



ry1 .r12



(1 – ry12) (1 - r122) uji signifikansi korelasi parsial :



th



=



r



N -3



1 - r2 th



th



>



>



tt



=



Korelasi signifikan



tt



=



Korelasi tidak signifikan



4. Persyaratan Analisis Dalam melakukan analisis data yang menggunakan teknik korelasional dengan dua berntuk perhitungan yaitu korelsi product moment dan regresi diperlukan asumsi – asumsi tertentu agar intrepretasi terhadap hisilnya dapat dipertanggungjawabkan dilihat dari sudut pandang statistika. Dalam hubungan ini, asumsi/persyaratan yang perlu dipenuhi adalah : Korelasi product momen/Pearson:



 sampel diambil secara acak  ukuran sampel minimum dipenuhi  data sampel masing-masing variabel berdidtribusi normal  bentuk regresi linier (Santosa Murwani. 2000. h 32) Sementara itu menurut Dennis E. Hinkle menyatakan bahwa analisis menggunakan korelasi Pearson perlu memenuhi dua kondisi yaitu :  Variabel yang dikorelasikan harus berpasangan bagi individu atau subjek yang sama.  variabel yang dikorelasikan skala pengukurannya harus interval atau rasio, dan hubungannya harus bersifat linier.  Homogenitas kelompok Regresi (Fred N. KerlingerElazar J. Pedhazur : 1973 : 47)  Skor Variabel Y (dependent Variable) harus berdistribusi normal untuk setiap nilai X, sedangkan untuk variabel bebas (X) tidak disyaratkan berdidtribusi normal.  Skor variabel dependen (Y) mempunyai varians yang sama (homogenitas variansi) untuk setiap nilai variabel bebas (X). Dengan memperhatikan persyaratan di atas, nampak bahwa asumsi normalitas distribusi serta homogenitas variansi diperlukan baik dalam perhitungan korelasi maupun regresi, sedangkan asumsi-asumsi lainnya lebih bersifat pra analisa.



DAFTAR PUSTAKA



Prasetyowati, Didin Astriani, 2016. Analisis Statistik (Teori dan Aplikasi Menggunakan SPSS). Fakultas Ilmu Komputer Universitas Indo Global Mandiri : Palembang Suharjo, Bambang, 2013. Statistika Terapan. Graha Ilmu : Yogyakarta Sungkawa, Iwa, 2013. Penerapan Analisis Regresi dan korelasi dalam Menentukan Arah Hubungan antara Dua Faktor Kualitatif pada Tabel Kontingensi. Jurnal Mat Stat, Vol. 13 No. 1: 33-41