4 0 236 KB
Regresi Logistik Dengan MINITAB 5 Model regresi logistic
Regresi Logistik dengan Minitab Seorang peneliti ingin mengetahui pengaruh 10 kelompok tingkat pendapatan pertahun terhadap status keluarga sehat. Data sebagai berikut :
Kelompo k 1 2 3 4 5 6 7 8 9 10
Tingkat pendapatan (juta) 6 8 10 13 15 20 25 30 35 40
jumlah keluarga 40 50 60 80 100 70 65 50 40 25
keluarga sehat 8 12 18 28 45 36 39 33 30 20
Langkah-langkah : Buat layout untuk dimasukkan kedalam worksheet minitab. Layoutnya menjadi :
Tingkat pendapatan (juta)
status 6 8 10 13 15 20 25 30 35 40 6 8 10
frekuensi 1 1 1 1 1 1 1 1 1 1 0 0 0
8 12 18 28 45 36 39 33 30 20 32 38 42
13 15 20 25 30 35 40
0 0 0 0 0 0 0
52 55 34 26 17 10 5
keterangan : status = 1 sehat status = 0 tidak sehat Langkah analisis dimulai dengan memilih menu Stat – Regression – Binary Logistic Regression
Masukkan data peubah respon yaitu status ke Response, lalu masukkan data dalam kolom frekuensi ke dalam kolom frequency, pada model masukkan peubah penjelas yaitu tingkat pendapatan.
Klik Option – Link Function Logit – OK
Hasil Output : Binary Logistic Regression: status versus Tingkat pendapatan (juta) Link Function: Logit
Response Information Variable status
Value 1 0 Total
Count 269 311 580
(Event)
Frequency: frekuensi
Logistic Regression Table
Predictor Constant Tingkat pendapatan (juta)
Coef -1.60234 0.0790658
Predictor Constant Tingkat pendapatan (juta)
Upper
SE Coef 0.204034 0.0101125
Z -7.85 7.82
P 0.000 0.000
Odds Ratio
95% CI Lower
1.08
1.06
1.10
Output di atas ini sesungguhnya merupakan output untuk uji Wald (uji parsial) yang digunakan untuk menguji manakah dari perubah penjelas yang berpengaruh terhadap peubah respon. Hipotesis yang diuji adalah: H0 : tingkat pendapatan tidak berpengaruh terhadap status H1 : tingkat pendapatan berpengaruh terhadap status Tolak H0 jika p-value < alpha (0,05)
Kesimpulan : p-value (0.00) < alpha (0.05) maka tolak H0 yang artinya cukup bukti untuk menyatakan bahwa jumlah pendapatan berpengaruh nyata terhadap status kesehatan pada taraf nyata 5%. Selain uji Wald output di atas menunjukkan koefisien regresi logistik. Sehingga persamaan regresi logistiknya adalah: Dengan model peluang logit adalah g(x) = -1.60234+0.0791tingkat pendapatan Log-Likelihood = -365.301 Test that all slopes are zero: G = 70.404, DF = 1, P-Value = 0.000
Uji G merupakan uji simultan yang digunakan untuk mengetahui peran seluruh peubah penjelas dalam model. Hipotesis yang diuji adalah: H0 : Semua peubah penjelas tidak berpengaruh terhadap status kesehatan H1 : minimal ada 1 peubah penjelas berpengaruh terhadap status kesehatan Tolak H0 jika p-value < alpha (0,05) Kesimpulan : Pada output di atas terlihat p-value (0.000) < alpha (0.05) berarti tolak H0. Hal ini berarti bahwa minimal ada 1 peubah penjelas yang berpengaruh nyata terhadap status kesehatan pada taraf nyata 5%. Goodness-of-Fit Tests Method Pearson Deviance Hosmer-Lemeshow
Chi-Square 2.34682 2.35415 2.31913
DF 8 8 6
P 0.968 0.968 0.888
Pengujian model logit dilakukan dengan melihat nilai statistic Goodness of fit. Metode yang sering digunakan untuk Goodness of fit data kategori adalah Pearson, Deviance dan Hosmer-Lemeshow. Hipotesis yang diuji adalah: H0 : model layak H1 : model tidak layak Tolak H0 jika p-value < alpha (0,05) Kesimpulan : Dari ketiga metode yang digunakan, terlihat bahwa semua p-value nya bernilai > 0,05 sehingga terima H0 jadi dapat disimpulkan bahwa model layak. Table of Observed and Expected Frequencies: (See Hosmer-Lemeshow Test for the Pearson Chi-Square Statistic) Value 1 Obs Exp 0 Obs Exp Total
Group 4 5
1
2
3
20 23.5
18 18.5
28 28.8
45 39.7
70 66.5 90
42 41.5 60
52 51.2 80
55 60.3 100
6
7
8
Total
36 34.6
39 38.5
63 64.7
20 20.7
269
34 35.4 70
26 26.5 65
27 25.3 90
5 4.3 25
311 580
Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs
Number
Percent
Summary Measures
Concordant Discordant Ties Total
54118 20943 8598 83659
64.7 25.0 10.3 100.0
Somers' D Goodman-Kruskal Gamma Kendall's Tau-a
0.40 0.44 0.20
Sedangkan output bagian terakhir menjelaskan tentang keragaman peubah Y yang dapat dijelaskan oleh peubah penjelas. Untuk melihat sejauh mana keragaman peubah Y yang dapat dijelaskan oleh peubah-peubah penjelas, digunakan persen keragaman concordant. Pada kasus ini terlihat nilai percent untuk concordant 64,7%. Hal ini berarti bahwa keragaman peubah respon (status kesehatan) dapat dijelaskan oleh peubah-peubah penjelas dalam model sebesar 64,7% sedangkan sisanya dijelaskan oleh factor lain di luar model. Untuk mengetahui nilai odd ratio pada setiap kategori dapat dilakukam dengan memasukkan peubah penjelas (tingkat pendapatan) ke factors (optional) - OK
hasil output : Logistic Regression Table
Predictor Constant Tingkat pendapatan (juta) 8 10 13 15 20 25 30 35 40
Coef -1.38629
SE Coef 0.395282
Z -3.51
P 0.000
0.233615 0.538997 0.767255 1.18562 1.44345 1.79176 2.04959 2.48491 2.77259
0.515652 0.485400 0.459557 0.443454 0.461993 0.469415 0.495353 0.538127 0.637373
0.45 1.11 1.67 2.67 3.12 3.82 4.14 4.62 4.35
0.651 0.267 0.095 0.008 0.002 0.000 0.000 0.000 0.000
Predictor Constant
Upper
Odds Ratio
95% CI Lower
1.26 1.71 2.15 3.27 4.24 6.00 7.76 12.00 16.00
0.46 0.66 0.88 1.37 1.71 2.39 2.94 4.18 4.59
Tingkat pendapatan (juta) 8 10 13 15 20 25 30 35 40
3.47 4.44 5.30 7.81 10.47 15.06 20.50 34.45 55.80
Interpretasi : Hasil output menunjukkan bahwa peluang penduduk dengan tingkat pendapatan 8 juta/tahun memiliki status sehat lebih besar 1,26 kali dari penduduk dengan tingkat pendapatan 6 juta/tahun. dst.