Regresi Logistik Dengan MINITAB [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

Regresi Logistik Dengan MINITAB 5 Model regresi logistic



Regresi Logistik dengan Minitab Seorang peneliti ingin mengetahui pengaruh 10 kelompok tingkat pendapatan pertahun terhadap status keluarga sehat. Data sebagai berikut :



Kelompo k 1 2 3 4 5 6 7 8 9 10



Tingkat pendapatan (juta) 6 8 10 13 15 20 25 30 35 40



jumlah keluarga 40 50 60 80 100 70 65 50 40 25



keluarga sehat 8 12 18 28 45 36 39 33 30 20



Langkah-langkah : Buat layout untuk dimasukkan kedalam worksheet minitab. Layoutnya menjadi :



Tingkat pendapatan (juta)



status 6 8 10 13 15 20 25 30 35 40 6 8 10



frekuensi 1 1 1 1 1 1 1 1 1 1 0 0 0



8 12 18 28 45 36 39 33 30 20 32 38 42



13 15 20 25 30 35 40



0 0 0 0 0 0 0



52 55 34 26 17 10 5



keterangan : status = 1  sehat status = 0  tidak sehat Langkah analisis dimulai dengan memilih menu Stat – Regression – Binary Logistic Regression



Masukkan data peubah respon yaitu status ke Response, lalu masukkan data dalam kolom frekuensi ke dalam kolom frequency, pada model masukkan peubah penjelas yaitu tingkat pendapatan.



Klik Option – Link Function Logit – OK



Hasil Output : Binary Logistic Regression: status versus Tingkat pendapatan (juta) Link Function: Logit



Response Information Variable status



Value 1 0 Total



Count 269 311 580



(Event)



Frequency: frekuensi



Logistic Regression Table



Predictor Constant Tingkat pendapatan (juta)



Coef -1.60234 0.0790658



Predictor Constant Tingkat pendapatan (juta)



Upper



SE Coef 0.204034 0.0101125



Z -7.85 7.82



P 0.000 0.000



Odds Ratio



95% CI Lower



1.08



1.06



1.10



Output di atas ini sesungguhnya merupakan output untuk uji Wald (uji parsial) yang digunakan untuk menguji manakah dari perubah penjelas yang berpengaruh terhadap peubah respon. Hipotesis yang diuji adalah: H0 : tingkat pendapatan tidak berpengaruh terhadap status H1 : tingkat pendapatan berpengaruh terhadap status Tolak H0 jika p-value < alpha (0,05)



Kesimpulan : p-value (0.00) < alpha (0.05) maka tolak H0 yang artinya cukup bukti untuk menyatakan bahwa jumlah pendapatan berpengaruh nyata terhadap status kesehatan pada taraf nyata 5%. Selain uji Wald output di atas menunjukkan koefisien regresi logistik. Sehingga persamaan regresi logistiknya adalah: Dengan model peluang logit adalah g(x) = -1.60234+0.0791tingkat pendapatan Log-Likelihood = -365.301 Test that all slopes are zero: G = 70.404, DF = 1, P-Value = 0.000



Uji G merupakan uji simultan yang digunakan untuk mengetahui peran seluruh peubah penjelas dalam model. Hipotesis yang diuji adalah: H0 : Semua peubah penjelas tidak berpengaruh terhadap status kesehatan H1 : minimal ada 1 peubah penjelas berpengaruh terhadap status kesehatan Tolak H0 jika p-value < alpha (0,05) Kesimpulan : Pada output di atas terlihat p-value (0.000) < alpha (0.05) berarti tolak H0. Hal ini berarti bahwa minimal ada 1 peubah penjelas yang berpengaruh nyata terhadap status kesehatan pada taraf nyata 5%. Goodness-of-Fit Tests Method Pearson Deviance Hosmer-Lemeshow



Chi-Square 2.34682 2.35415 2.31913



DF 8 8 6



P 0.968 0.968 0.888



Pengujian model logit dilakukan dengan melihat nilai statistic Goodness of fit. Metode yang sering digunakan untuk Goodness of fit data kategori adalah Pearson, Deviance dan Hosmer-Lemeshow. Hipotesis yang diuji adalah: H0 : model layak H1 : model tidak layak Tolak H0 jika p-value < alpha (0,05) Kesimpulan : Dari ketiga metode yang digunakan, terlihat bahwa semua p-value nya bernilai > 0,05 sehingga terima H0 jadi dapat disimpulkan bahwa model layak. Table of Observed and Expected Frequencies: (See Hosmer-Lemeshow Test for the Pearson Chi-Square Statistic) Value 1 Obs Exp 0 Obs Exp Total



Group 4 5



1



2



3



20 23.5



18 18.5



28 28.8



45 39.7



70 66.5 90



42 41.5 60



52 51.2 80



55 60.3 100



6



7



8



Total



36 34.6



39 38.5



63 64.7



20 20.7



269



34 35.4 70



26 26.5 65



27 25.3 90



5 4.3 25



311 580



Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs



Number



Percent



Summary Measures



Concordant Discordant Ties Total



54118 20943 8598 83659



64.7 25.0 10.3 100.0



Somers' D Goodman-Kruskal Gamma Kendall's Tau-a



0.40 0.44 0.20



Sedangkan output bagian terakhir menjelaskan tentang keragaman peubah Y yang dapat dijelaskan oleh peubah penjelas. Untuk melihat sejauh mana keragaman peubah Y yang dapat dijelaskan oleh peubah-peubah penjelas, digunakan persen keragaman concordant. Pada kasus ini terlihat nilai percent untuk concordant 64,7%. Hal ini berarti bahwa keragaman peubah respon (status kesehatan) dapat dijelaskan oleh peubah-peubah penjelas dalam model sebesar 64,7% sedangkan sisanya dijelaskan oleh factor lain di luar model. Untuk mengetahui nilai odd ratio pada setiap kategori dapat dilakukam dengan memasukkan peubah penjelas (tingkat pendapatan) ke factors (optional) - OK



hasil output : Logistic Regression Table



Predictor Constant Tingkat pendapatan (juta) 8 10 13 15 20 25 30 35 40



Coef -1.38629



SE Coef 0.395282



Z -3.51



P 0.000



0.233615 0.538997 0.767255 1.18562 1.44345 1.79176 2.04959 2.48491 2.77259



0.515652 0.485400 0.459557 0.443454 0.461993 0.469415 0.495353 0.538127 0.637373



0.45 1.11 1.67 2.67 3.12 3.82 4.14 4.62 4.35



0.651 0.267 0.095 0.008 0.002 0.000 0.000 0.000 0.000



Predictor Constant



Upper



Odds Ratio



95% CI Lower



1.26 1.71 2.15 3.27 4.24 6.00 7.76 12.00 16.00



0.46 0.66 0.88 1.37 1.71 2.39 2.94 4.18 4.59



Tingkat pendapatan (juta) 8 10 13 15 20 25 30 35 40



3.47 4.44 5.30 7.81 10.47 15.06 20.50 34.45 55.80



Interpretasi : Hasil output menunjukkan bahwa peluang penduduk dengan tingkat pendapatan 8 juta/tahun memiliki status sehat lebih besar 1,26 kali dari penduduk dengan tingkat pendapatan 6 juta/tahun. dst.