4 0 1 MB
Seri Buku Evidence Based Medicine (Seri 21) Edisi Pertama (Ebook)
Regresi Ordinal Disertai Praktik dengan Program SPSS
M. Sopiyudin Dahlan, dr. M.Epid. Epidemiologi Indonesia (PstatConsulting) Your Partner in Medical and Health Research Jakarta 2014
Lembar Persetujuan
Dengan membeli ebook ini, pembaca setuju untuk:
1. tidak mencetak / memprint sebagian atau seluruh isi buku, 2. tidak menyebarkan sebagian atau seluruh isi buku kepada pihak lain, baik secara gratis maupun diperjualbelikan, dan 3. menjaga kerahasiaan password ebook serta tidak membagikannya pada pihak lain.
1
Persembahan Kupersembahkan buku ini untuk Ayah dan ibuku, Di dalam tubuhku Mengalir darah bunda Dan keringat ayahanda Istriku, Widianingsih Q-SaveMe Everything is blue Finally blue Anakku, Siti Ayudia Kautsar ‘ilmi Sang pencinta ilmu Sang pencinta keindahan Sang pencinta petualangan Anakku, Aisha Lubna Andini Sang pejuang perdamaian Sang pejuang keadilan Sang pejuang keharmonisan
2
Kaulah Pahlawan Hati siapa yang tak bergetar Seseorang rela bersusah payah Berkorban waktu, tenaga, dan biaya Pergi ke toko buku Bertanya pada sahabat Menelpon teman lama Berkirim sms, wa, bbm, dan fb Browsing di internet Hanya untuk satu tujuan Membeli buku Seseorang berkata dengan ikhlasnya Bacalah bukunya Mudah memahaminya Sederhana tulisannya Mendalam pembahasannya Sistematis alurnya Berduyun orang karenanya Seseorang berkata Janganlah kau fotokopi bukunya Tak ada alasan nyata Dalam teknologi informasi jamannya Kau sulit mendapatkannya Karena website penulis punya Tenggang rasa tepa selira hendaknya Bagaimana jika kau penulisnya
3
Seseorang ikhlas Sisihkan sebagian penghasilan Untuk peroleh buku aseli Penulis menerima rezeki Untuk hidupi anak istri Bisa terus bermimpi Dan berbagi Hati siapa yang tak bergetar Mendengar kata ”Pembaca” Bagi penulis Kaulah pahlawan Jakarta, 29 Ramadhan 1435H, 27 Juli 2014
4
Kata Pengantar Buku ini terdiri dari tujuh bab. Bab pertama membahas kapan dan syarat penggunaan regresi ordinal. Bab kedua membahas persamaan serta interpretasi teoretis regresiordinal. Dua bab pertama ini merupakan bagian pengantar yang wajib dibaca terlebih dahulu karena mendasari bab-bab berikutnya. Bab ketiga dan keempat membahas dan mempraktikkan regresi ordinal sederhana, yaitu satu variabel bebas berskala kategorik (Bab 3) dan berskala numerik (Bab 4). Untuk lebih memantapkan pemahaman, pada bab kelima dan keenam, dibahas variasi hasil regresi ordinal dengan mengganti point of interest. Akhirnya, bab ketujuh membahas regresi ordinal yang lebih kompleks, yaitu regresi ordinal dengan dua variabel bebas. Membaca buku ini tidak akan lengkap apabila Anda tidak melakukan praktik sendiri. Bagi pembaca yang memerlukan datadata
latihan,
pembaca
dapat
mengunduhnya
di
www.sopiyudin.com. Sebagaimana peribahasa, tidak ada gading yang tak retak. Penulis mengharapkan umpan balik dari pembaca untuk menyempurnakan isi buku ini. Wassalam, Ciracas, 15 Oktober 2014 M. Sopiyudin Dahlan, dr. M.Epid. www.sopiyudin.com; www.bukusopiyudin.com; www.e-learningsopiyudin.com [email protected]; 0818938120
5
Tentang Penulis Muhamad Sopiyudin Dahlan (Yudin), lahir di Garut tanggal 31 Januari 1976. Penulis menyelesaikan pendidikan dasar di Sekolah Dasar Negeri Ciarog (1982-1988) dan Sekolah Menengah Pertama Kersamanah Garut (1988-1991). Pendidikan menengah atas diperoleh di Sekolah Menengah Atas Negeri Tiga Bandung (1991-1994). Kemudian Penulis
melanjutkan
pendidikan di
Fakultas Kedokteran Universitas Indonesia (1994-2000), dan Magister Epidemiologi Klinik Fakultas Kesehatan Masyarakat Universitas Indonesia (2004-2007). Setelah menyelesaikan pendidikan kedokteran (tahun 2000), penulis
bekerja
sebagai
staf
pengajar
di
Bagian
Biologi
Kedokteran di almamaternya (2001-2003). Sejak tahun 2003 sampai sekarang penulis menjabat sebagai senior consultant sekaligus direktur dari PstatConsulting: “your partner in medical and health research”, suatu lembaga yang bergerak di bidang penelitian
kedokteran
dan
kesehatan.
Pada
tahun
2011,
PstatConsulting berganti nama menjadi Epidemiologi Indonesia. Selain itu, penulis juga pernah bekerja sebagai clinical research manager untuk Family Health International (2006- 2008). Saat ini penulis sedang menyelesaikan pembuatan seri evidence based medicine. Daftar buku selengkapnya adalah sebagai berikut.
6
1.
Statistik untuk Kedokteran dan Kesehatan: Deskriptif, Bivariat, dan Multivariat, Edisi 6. Epidemiologi Indonesia, Jakarta, 2014 (dengan voucher e-learning).
2.
Besar Sampel dan Cara Pengambilan Sampel dalam Penelitian Kedokteran dan Kesehatan, Edisi 3 Cetakan 2, Penerbit Salemba Medika, Jakarta, 2012 (dengan CD Interaktif).
3.
Menyusun Proposal Penelitian dalam Bidang Kedokteran dan Kesehatan: Metode IKVE 1741,Edisi 2 Cetakan 2, Penerbit Sagung Seto, Jakarta, 2012.
4.
Analisis Survival: Dasar-dasar Teoritis dan Aplikasi Program Stata, Penerbit Sagung Seto, Jakarta, 2009 (dengan CD Interaktif).
5.
Penelitian Diagnostik: Teori dan Praktik dengan SPSS dan Stata, Penerbit Salemba Medika, Jakarta, 2010 (dengan CD Interaktif).
6.
Membaca dan Menelaah Jurnal Uji Klinis. Penerbit Salemba Medika, Jakarta, 2010 (dengan CD Interaktif).
7.
Mendiagnosis dan Menata Laksana 13 Penyakit Statistik: Disertai Aplikasi Stata, Penerbit Sagung Seto, Jakarta, 2010 (dengan CD Interaktif).
8.
Penelitian Prognostik dan Sistem Skoring: Disertai Praktik dengan Program SPSS dan Stata. Penerbit Alqa-Print, Jakarta, 2010.
9.
Analisis Multivariat Regresi ordinal: Disertai Praktik dengan Program SPSS dan Stata. Epidemiologi Indonesia, Jakarta, 2012 (dengan CD Interaktif).
7
10. Analisis Multivariat Regresi Linier: Disertai Praktik dengan Program SPSS.. Epidemiologi Indonesia, Jakarta, 2012 (dengan CD Interaktif). 11. Analisis Survival: Dasar-dasar Teoritis dan Aplikasi Program SPSS. Epidemiologi Indonesia, Jakarta, 2012 (dengan CD Interaktif). 12. Pengantar Meta-Analisis: Disertai Praktik dengan Program Excel. Epidemiologi Indonesia, Jakarta, 2012 (dengan CD Interaktif). 13. Gerbang
Memahami
Epidemiologi,
Biostatistik,
dan
Metodologi Penelitian: Metode MSD (Multiaksial Sopiyudin Dahlan). Penerbit Sagung Seto, Jakarta, 2014. (Juga tersedia dalam bentuk e-learning). 14. Epidemiologi: Seni Melacak Sebab-akibat. Penerbit Sagung Seto, Jakarta, 2014. 15. Penelitian Diagnostik: Topik Lanjut. Epidemiologi Indonesia, Jakarta, 2014 (ebook). 16. Bunga Rampai Statistic Quote. Epidemiologi Indonesia, Jakarta, 2014 (ebook). 17. Writing-Research-Preneurship.
Epidemiologi
Indonesia,
Jakarta, 2014. 18. Buku Saku Metode MSD. Epidemiologi Indonesia, 2014. 19. Menelaah Validitas Penelitian Observasional. Sagung Seto, Jakarta, 2014. 20. Bias. Epidemiologi Indonesia. Jakarta, 2014 (ebook). 21. Regresi Ordinal. Epidemiologi Indonesia, Jakarta, 2014 (ebook). 22. Regresi Multinomial. Epidemiologi Indonesia, Jakarta, 2014 (ebook).
8
23. e-learning (www.e-learningsopiyudin.com) Buku seri EBM dapat diperoleh dengan cara-cara berikut. 1. Pesan via SMS ke 02131713704 (Syaiful) atau 0818938120 2. Pesan dengan mengisis formulir pemesanan melalui www.bukusopiyudin.com 3. Pesan melalui email: [email protected] 4. Toko buku terdekat
9
Ucapan Terima Kasih Ucapan terima kasih saya sampaikan kepada semua pihak yang telah memberikan kontribusi terhadap terbit dan terdistribusinya buku ini. Secara khusus, saya ingin mengucapkan terima kasih: 1. kepada Anda yang sudah membeli buku asli. Kepedulian Anda untuk membeli buku asli secara langsung telah memberikan
kontribusi
nafkah
bagi
penulis,
penerbit,
karyawan di penerbitan, dan para distributor. Bagi kami, Anda adalah pahlawan. 2. kepada Anda yang telah merekomendasikan untuk membeli buku ini kepada rekan Anda yang memerlukan. 3. kepada klien dan pembaca buku seri EBM yang telah memotivasi saya untuk terus berkarya. Kecintaan pada ilmu serta semangat untuk berbagi adalah motivasi terbesar bagi saya untuk terus berkarya. 4.
kepada istri dan dua anak saya yang tiada henti menjadi sumber energi dan inspirasi.
10
Daftar Isi
Bab 1
Regresi Ordinal : Definisi, Syarat Proporsional Odds Rasio, dan Koding ...............................13-23
Bab 2
Keluaran Regresi Ordinal .............................25-45
Bab 3
Regresi ordinal Satu Variabel Bebas Kategorik Dikotom ...................................................... 47- 61
Bab 4
Regresi ordinal Satu Variabel Bebas Numerik ...................................................................... 63-76
Bab 5
Eksperimen Regresi Ordinal Variabel Bebas Kategorik ..................................................... 77-94
Bab 6
Eksperimen Regresi Ordinal Variabel Bebas Numerik ..................................................... 95-108
Bab 7
Regresi Ordinal dengan Beberapa Variabel Bebas .................................................................. 109-116
11
12
Bab 1 Regresi Ordinal : Definisi, Syarat Proporsional Odds Rasio, dan Koding Tujuan Setelah
membaca
Bab
1,
pembaca
diharapkan
mampu
menjelaskan: -
kapan menggunakan analisis regresi ordinal,
-
asumsi proporsional odds rasio,
-
prinsip penyederhanaan tabel,
-
koding variabel bebas kategorik, dan
-
koding variabel terikat.
Kapan menggunakan analisis regresi ordinal? Analisis regresi ordinal digunakan pada analisis multivariat dengan variabel terikat berupa variabel berskala kategorik ordinal (a) yang memenuhi asumsi proporsional odds rasio (b).2
Apa yang dimaksud multivariat? Multivariat
adalah
analisis
yang
bertujuan
untuk
mengetahui hubungan satu atau beberapa variabel bebas dengan satu variabel terikat. Variabel bebas dapat berupa variabel dengan skala pengukuran kategorik (nominal dan ordinal), maupun skala numerik.2
13
Apa yag dimaksud variabel kategorik ordinal? Kategorik ordinal adalah variabel yang mempunyai klasifikasi bertingkat. Misalnya, pendidikan dengan klasifikasi rendah, menengah, dan tinggi; tingkat ekonomi dengan klasifikasi rendah, menengah, dan tinggi; derajat penyakit dengan klasifikasi berat, sedang, dan ringan; stadium kanker dengan klasifikasi stadium empat, tiga, dua, dan satu.4
Apakah yang dimaksud proporsional odds rasio? Proporsional odds rasio (OR) adalah nilai OR kumulatif yang relatif konsisten pada setiap titik potong.2 Bagaimana membuktikan proporsional odds rasio? Proporsional odds dapat dibuktikan dengan dua cara, yaitu penyederhanaan tabel dan uji hipotesis.2 Uji hipotesis untuk proporsional odds pada SPSS adalah uji parallel test lines5 sedangkan pada Stata dan SAS adalah score tes2. Asumsi terpenuhi jika nilai OR dari beberapa penyederhanaan tabel relatif sama dan nilai p pada ujihipotesis lebih besar dari 0,05.2
Proporsional odds dapat dibuktikan dengan dua cara, yaitu penyederhanaan tabel dan uji hipotesis.
Contoh penyederhanaan tabel pertama Misalnya, kita hendak meneliti hubungan antara perilaku merokok dengan kadar HDL pada pasien penyakit jantung koroner (PJK). Hasil penelitian disajikan pada Tabel 1.1.
14
Tabel 1.1 Hubungan antara perilaku merokok dengan HDL (tabel aseli) HDL Rendah
Intermediet
Normal
Merokok
50
30
20
Tidak merokok
10
20
70
Asumsi proporsional OR diuji dengan menyederhanakan variabel HDL sehingga terbentuk tabel baru. Pertama, HDL diklasifikasikan menjadi rendah vs. intermediet + normal (Tabel 1.2).
Selanjutnya,
HDL
diklasifikasikan
menjadi
rendah
+
intermediet vs. normal (Tabel 1.3). Nilai OR untuk masing-masing tabel adalah 9 dan 11,2. Karena nilainya tidak jauh berbeda, kita dapat menyimpulkan bahwa asumsi proporsional OR terpenuhi.
Tabel 1.2 Hubungan antara perilaku merokok dengan HDL (penyederhanaan pertama). HDL Rendah
Intermediet + Normal
Merokok
50
50
Tidak merokok
10
90
15
OR = ad/bc (50x90)/(50x10)= 9
Tabel 1.3 Hubungan antara perilaku merokok dengan HDL (penyederhanaan kedua). Rendah + intermediet
Normal
OR = ad/bc
Merokok
80
20
(80x70)/(20x30)= 11,2
Tidak merokok
30
70
Contoh penyederhanaan tabel kedua Contoh lainnya, masih hubungan antara perilaku merokok dengan HDL. Namun, HDL diklasifikasikan menjadi empat, yaitu sangat rendah, rendah, intermediet, dan normal (Tabel 1.4). Proporsional OR diketahui dengan menyederhanakan variabel HDL menjadi sangat rendah vs. rendah + intermediet + normal (Tabel 1.5), sangat rendah + rendah vs. intermediet + normal (Tabel 1.6), serta sangat rendah + rendah + intermediet vs. normal (Tabel 1.7). Nilai OR masing-masing tabel adalah 6, 8, dan 6. Karena nilainya relatif sama, asumsi proporsional OR terpenuhi. Tabel 1.4 Hubungan antara perilaku merokok dengan HDL (tabel aseli) HDL Sangat rendah
Rendah
Intermediet
Normal
Merokok
40
30
20
10
Tidak merokok
10
20
30
40
16
Tabel 1.5 Hubungan antara perilaku merokok dengan HDL (penyederhanaan pertama) HDL Sangat rendah
Rendah + intermediet + normal
OR = ad/bc
Merokok
40
60
(40x90)/(60x10)=6
Tidak merokok
10
90
Tabel 1.6 Hubungan antara perilaku merokok dengan HDL (penyederhanaan kedua) HDL Sangat rendah + rendah
Intermediet + normal
OR = ad/bc
Merokok
70
30
(70x70)/(30x30)=8
Tidak merokok
30
70
Tabel 1.7 Hubungan antara perilaku merokok dengan HDL (penyederhanaan ketiga) HDL Sangat rendah + rendah + intermediet
Normal
Merokok
90
10
Tidak merokok
60
40
17
OR = ad/bc
(90x40)/(10x60) =6
Contoh uji proporsional odds dengan uji hipotesis Selain dengan penyederhanaan tabel (contoh pertama dan kedua), asumsi proporsional odds rasio juga dapat diketahui dengan uji statistik. Nama uji statistiknya adalah uji parallel lines (SPSS)5 atau score test (SAS)2. Hipotesis nol pada uji ini adalah tidak ada perbedaan nilai OR pada beberapa penyederhanaan tabel. Dengan kata lain, hipotesis nol-nya adalah asumsi proporsional odds rasio terpenuhi. Hipotesis nol diterima (asumsi terpenuhi) jika nilai p pada uji hipotesis lebih besar dari 0,05.2
Apakah ada aturan cara penyederhanaan variabel terikat? Aturan bergantung pada niat peneliti dan perangkat lunak yang digunakan.2 Pada SPSS, ketentuannya adalah ≤ g vs. >g, di mana g adalah titik potong pada urutan variabel ordinal.2 Jadi, kode kecil dibandingkan dengan kode yang lebih besar. Misalnya, kita
memiliki
variabel
mempunyai kode
0,
ordinal kode
1,
dengan dan
tiga
kode
kategori
yang
2 (Tabel 1.8).
Penyederhanaan tabel dilakukan dengan menyederhanakan variabel terikat menjadi ≤ g vs. >g. Saat titik potong (g) adalah nol, penyederhanaan tabel menjadi kode ≤0 vs. >0 (Tabel 1.9). Saat titik potong (g) adalah satu, penyederhanaan tabel menjadi kode ≤1 vs. >1 (Tabel 1.10).
Pada SPSS, ketentuan klasifikasi variabel terikat adalah ≤ g vs. >g, di mana g adalah titik potong pada urutan variabel ordinal.
18
Tabel 1.8 Tabel yang masih belum disederhanakan Kode 0
Kode 1
Kode 2
Merokok
a
b
c
Tidak merokok
d
e
f
Tabel 1.9 Penyederhanaan tabel pertama Kode 0
Kode 1+2
Merokok
a
b+c
Tidak merokok
d
e+f
Tabel 1.10 Penyederhanaan tabel kedua Kode 0+1
Kode 2
Merokok
a+b
c
Tidak merokok
d+e
f
Apakah ada ketentuan kode untuk variabel bebas? Untuk variabel bebas kategorik regresi ordinal SPSS, kategori pembanding adalah kategori yang memiliki kode terbesar. a Jika koding nol untuk bukan perokok dan satu untuk perokok maka yang menjadi pembanding adalah kategori perokok. Sebaliknya, jika koding nol untuk perokok dan satu untuk bukan perokok maka yang menjadi pembanding adalah kategori bukan perokok (Tabel 1.11).
a
http://www-01.ibm.com/support/docview.wss?uid=swg21480146
19
Pada SPSS, kategori pembanding variabel bebas adalah kategori yang memiliki kode terbesar (last).
Tabel 1.11 Koding untuk variabel kategorik bergantung pada keputusan kategori mana yang dijadikan sebagai pembanding No.
Keputusan kategori pembanding
Koding
1.
Perokok sebagai pembanding
0. Bukan perokok 1. Perokok
2.
Bukan perokok sebagai pembanding
0. Perokok 1. Bukan perokok
Kategori pembanding adalah kategori yang memiliki kode terbesar (last) Bagaimana koding yang direkomendasikan untuk penelitian hubungan perilaku merokok dengan HDL? Kita hendak melakukan penelitian hubungan antara perilaku
merokok
dengan
kadar
HDL.
Perilaku
merokok
diklasifikasikan menjadi perokok dan bukan perokok. Kadar HDL diklasifikasikan
menjadi
rendah,
intermediet,
dan
normal.
Pengkodean kedua variabel tersebut harus disesuaikan dengan niat (point of interest). Berikut ini merupakan empat alternatif yang dapat terjadi. 1) Perokok dibanding bukan perokok untuk mengalami HDL yang lebih buruk.
20
2) Perokok dibanding bukan perokok untuk mengalami HDL yang lebih baik. 3) Bukan perokok dibanding perokok untuk mengalami HDL yang lebih buruk. 4) Bukan perokok dibanding perokok untuk mengalami HDL yang lebih baik. Untuk variabel bebas kategorik, kategori pembanding memiliki kode yang lebih besar. b Dengan demikian, untuk alternatif pertama dan kedua, kategori pembanding adalah bukan perokok sehingga kita berikan kode satu untuk bukan perokok dan nol untuk perokok. Sementara, untuk alternatif ketiga dan keempat, kategori pembanding adalah perokok sehingga kita berikan kode satu untuk perokok dan kode nol untuk bukan perokok. Pelajari Tabel 1.12 s.d. Tabel 1.15.
Pada SPSS, kategori pembanding adalah kategori yang memiliki kode lebih besar
Untuk variabel terikat, kategori pembanding adalah kategori yang memiliki kode lebih besar.2 Dengan demikian, untuk alternatif pertama dan ketiga, kita berikan kode nol untuk rendah, satu untuk intermediet, dan dua untuk normal. Sementara, untuk alternatif kedua dan keempat, kita berikan kode nol untuk normal, satu untuk intermediet, dan dua untuk rendah. Pelajari Tabel 1.12 s.d. Tabel 1.15.
b
http://www-01.ibm.com/support/docview.wss?uid=swg21480146
21
Tabel 1.12 Koding hubungan antara perilaku merokok dengan HDL bila peneliti ingin membandingkan perokok dibanding bukan perokok untuk memiliki kadar HDL yang lebih buruk. Rendah
Intermediet
Normal
(Kode 0)
(Kode 1)
(Kode 2)
Perokok (kode 0)
a
b
c
Bukan perokok (kode 1)
d
e
f
Tabel 1.13 Koding hubungan antara perilaku merokok dengan HDL bila peneliti ingin membandingkan perokok dibanding bukan perokok untuk memiliki kadar HDL yang lebih baik. Normal
Intermediet
Rendah
(Kode 0)
(Kode 1)
(Kode 2)
Perokok (kode 0)
a
b
c
Bukan perokok (kode 1)
d
e
f
Tabel 1.14 Koding hubungan antara perilaku merokok dengan HDL bila peneliti ingin membandingkan bukan perokok dibanding perokok untuk memiliki kadar HDL yang lebih buruk. Rendah
Intermediet
Normal
(Kode 0)
(Kode 1)
(Kode 2)
Bukan perokok (kode 0)
a
b
c
Perokok (kode 1)
d
e
f
22
Tabel 1.15 Koding hubungan antara perilaku merokok dengan HDL bila peneliti ingin membandingkan bukan perokok dibanding perokok untuk memiliki kadar HDL yang lebih baik. Normal (Kode 0)
Intermediet (Kode 1)
Rendah (Kode 2)
Bukan perokok (kode 0)
a
b
c
Perokok (kode 1)
d
e
f
Latihan Bab 1 1.
Kapan kita menggunakan regresi ordinal?
2.
Apa yang dimaksud dengan proporsional odds rasio?
3.
Bagaimana panduan penyederhanaan sel pada variabel ordinal?
4.
Bagaimana panduan koding pada variabel ordinal?
5.
Bagaimana panduan koding pada variabel bebas?
23
24
Bab 2 Keluaran Regresi Ordinal Tujuan Setelah membaca Bab ini, pembaca diharapkan mampu menjelaskan: -
menjelaskan keluaran regresi ordinal,
-
menjelaskan kaitan keluaran regresi ordinal dengan desain penelitian,
-
membuat persamaan regresi ordinal,
-
menghitung probabilitas,
-
menghitung risiko relatif,
-
menjelaskan
prinsip
menghitung
odds
rasio
dan
interpretasinya, -
menjelaskan interpretasi nilai p pada uji Wald,
-
menjelaskan interpretasi interval kepercayaan dari odds rasio, dan
-
menjelaskan pola probabilitas pada regresi ordinal.
Apa keluaran dari regresi ordinal? Dengan melakukan regresi ordinal, kita memperoleh halhal berikut.2,5 1. Mendapatkan persamaan regresi. 2. Memperoleh kekuatan hubungan antara variabel bebas dan variabel terikat dengan parameter kekuatan hubungan berupa koefisien dan odds rasio (OR).
25
3. Memperoleh kemaknaan hubungan antara variabel bebas dengan variabel terikat melalui uji hipotesis dan dengan melihat interval kepercayaan dari koefisien atau OR. 4. Pada penelitian kohort, memperoleh probabilitas individu untuk mengalami suatu kejadian. 5. Pada penelitian kohort, memperoleh risiko relatif (RR) antara individu dengan karakteristik tertentu.
Bagaimana kaitan regresi ordinal dengan desain penelitian? Regresi ordinal dapat digunakan pada desain kohort, kasus kontrol, maupun potong lintang sepanjang variabel terikatnya adalah variabel kategorik ordinal. Yang membedakan ketiga desain tersebut adalah pada keluaran analisis.2 Pada kasus kontrol dan potong lintang, kita tidak dapat memperoleh RR dan probabilitas (Tabel 2.1).
Tabel 2.1 Keluaran regresi ordinal berdasarkan desain penelitian3 Keluaran
Kohort
Kasus Kontrol
Potong Lintang
Persamaan regresi
√
√
√
Nilai p
√
√
√
Odds Rasio (OR)
√
√
√
Interval kepercayaan dari OR
√
√
√
Probabilitas
√
x
x
Risiko relatif
√
x
x
√=ya; X=tidak.
26
Bagaimana persamaan regresi ordinal? Jumlah persamaan regresi ordinal bergantung pada jumlah kategori dari variabel ordinal. Jika jumlah kategori sebanyak n maka jumlah persamaan adalah n-1.2 Jika jumlah kategori tiga maka jumlah persamaan dua. Jika jumlah kategori empat maka jumlah persamaan tiga.
Jumlah persamaan regresi ordinal adalah n-1 di mana n adalah jumlah kategori.
Berikut persamaan yang akan diperoleh bila jumah kategori ada tiga.
y1 a1 ( 1 X 1 ........ i X i ) y 2 a 2 ( 1 X 1 ........ i X i ) y1= persamaan logit pertama y2= persamaan logit kedua a1=konstanta persamaan pertama a2=konstanta persamaan kedua x1=variabel bebas ke-1 β1=koefisien dari variabel bebas ke-1 xi=variabel bebas ke-i β i=koefisien dari variabel bebas ke-i Nilai a1 tidak sama dengan a2 Nilai koefisien (β) sama untuk semua persamaan.
27
Perbandingan regresi ordinal dengan regresi logistik Bagi Anda yang terbiasa dengan analisis regresi logistik, Anda harus siap-siap mengernyitkan dahi karena ada beberapa hal berbeda pada analisis ordinal. Persamaan regresi ordinal mempunyai beberapa anomali Bila dibandingkan analisis regresi logistik, anomali yang dimaksud adalah sebagai berikut. 1) Pada regresi logistik, pembanding pada variabel terikat adalah kode nol.1 Pada regresi ordinal, pembandingnya adalah kode yang lebih besar.2 2) Pada regresi logistik, pembanding pada variabel bebas kategorik dapat kita atur antara kode terkecil (first) dan kode terbesar (last).3 Pada regresi ordinal, kategori pembanding selalu kode yang paling besar. Walaupun demikian, memori SPSS mengingat kode terbesar ini sebagai nol. 3) Pada regresi logistik, diperoleh satu persamaan, yaitu y = a + (b1x1 + ..... + bixi).1 Pada regresi ordinal, persamaan yang diperoleh sebanyak n-1 di mana n adalah jumlah kategori variabel terikat. Persamaannya adalah y1 = a1 - (b1x1 + ..... + bixi) sampai dengan y(n-1) = a(n-1) - (b1x1 + ..... + bixi).2 Perhatikan perbedaannya, yaitu pada tanda setelah konstanta. Pada regresi logistik ‘+’ sementara pada regresi ordinal ‘-‘. 4) Pada regresi logistik, koefisien suatu variabel adalah sebagaimana tercantum pada keluaran (B).1 Pada regresi
ordinal,
koefisien suatu
variabel adalah minus koefisien yang tercantum pada keluaran (-B).2
28
Tabel 2.2 Perbandingan regresi logistik dengan regresi ordinal No.
Parameter
Regresi logistik
Regresi ordinal
1.
Pembanding
Kode nol
Kode yang lebih
pada variabel
besar
terikat 2.
Pembanding
Bisa diatur sesuai
Selalu kode yang
pada variabel
dengan keinginan
lebih besar
y = a + b1x1
y1 = a1 - (b1x1)
bebas kategorik 3.
Persamaan
sampai dengan y(n-1) = a(n-1) - (b1x1) 4.
Koefisien
B
-B
Bagaimana contoh persamaan regresi ordinal? Gambar 2.1 merupakan tabel silang antara variabel rokok dengan klasifikasi HDL. Koding kategori perokok dan bukan perokok masing-masing adalah nol dan satu. Koding untuk kategori rendah, intermediet, dan normal masing-masing adalah nol, satu, dan dua. Dari cara koding dan dari Gambar 2.1, kita mendapat pesan bahwa keinginan (point of interest) peneliti adalah membandingkan perokok terhadap bukan perokok untuk memiliki HDL yang lebih buruk. Secara kumulatif, persentase pada kelompok perokok adalah 28,4% (rendah) dan 68,9% (rendah + intermediet). Sementara itu, pada kelompok bukan perokok,
29
persentase secara kumulatif adalah 16,1% (rendah) dan 50,6% (rendah + intermediet). Rokok * Klasifikasi HDL Crosstabulation
Rokok
Perokok Bukan perokok
Total
Count % within Rokok Count % within Rokok Count % within Rokok
Rendah 21 28,4% 27 16,1% 48 19,8%
Klasifikasi HDL Intermediet 30 40,5% 58 34,5% 88 36,4%
Normal 23 31,1% 83 49,4% 106 43,8%
Total 74 100,0% 168 100,0% 242 100,0%
Gambar 2.1 Gambar 2.2 merupakan hasil analisis regresi ordinal mencari hubungan antara perilaku merokok dengan HDL. Peneliti ingin membandingkan perokok dengan bukan perokok untuk menderita HDL yang lebih buruk. Kode yang dibuat adalah 0 (rendah), 1 (intermediet), dan 2 (normal). Untuk perilaku merokok, kodenya adalah 0 (perokok) dan 1 (bukan perokok). Parameter Estimates
Threshold Location
[hdl = 0] [hdl = 1] [rokok=0] [rokok=1]
Estimate Std. Error -1,665 ,191 ,028 ,152 -,755 ,262 0a .
Wald 76,342 ,033 8,275 .
df 1 1 1 0
Sig. ,000 ,855 ,004 .
95% Confidence Interval Lower Bound Upper Bound -2,039 -1,292 -,269 ,325 -1,269 -,240 . .
Link function: Logit. a. This parameter is set to zero because it is redundant.
Gambar 2.2 Persamaan regresi dapat dibuat dengan melihat kolom estimate. Pada baris Threshold, estimates merupakan nilai konstanta. Terdapat dua nilai konstanta, yaitu -1,665 untuk persamaan pertama (hdl = 0) dan 0,028 untuk persamaan kedua (hdl=1). Simbol hdl=0 artikan sebagai logit hdl≤0 dibandingkan
30
hdl>0. Simbol hdl=1 artikan sebagai logit hdl≤1 dibandingkan hdl>1. Pada baris location, estimates merupakan nilai koefisien dari variabel bebas. Nilai koefisien pada keluaran adalah -0,755 (rokok = 0). Simbol rokok = 0 artikan sebagai koefisien punya kategori nol, yaitu perokok. Sebagaimana telah dijelaskan sebelumnya, koefisien sesungguhnya dari variabel rokok adalah – (B) atau –(-0,755) = 0,755. Kita dapat membuat dua persamaan regresi ordinal, yaitu:
y1 a1 ( 1 X 1 ) 1,665 (0,755rokok ) y1 a1 ( 1 X 1 ) 0,028 (0,755rokok ) Di mana, y1 = logit persamaan pertama = logit HDL rendah (kode ≤ 0) dibandingkan HDL intermediet+normal (kode >0) y2 = logit persamaan kedua = logit HDL rendah + intermediet (kode ≤ 1) dibandingkan normal (kode >1). Rokok = 1 jika perokok Rokok = 0 jika bukan perokok Praktik membuat persamaan regresi ordinal yang lebih detil akan dibahas pada setiap bab berikutnya. Apa parameter hubungan yang secara langsung dapat diperoleh dari regresi ordinal? Parameter
hubungan
yang
dapat diperoleh
secara
langsung dari regresi ordinal adalah koefisien. Nilai koefisien selanjutnya digunakan untuk menghitung odds rasio (OR).2
31
Bagaimana menghitung OR pada regresi ordinal? Pada Gambar 2.2, kita tidak menemukan nilai OR. Walaupun
demikian,
kita
dapat
menghitungnya
dengan
2
menggunakan rumus OR = exp(koefisien). Koefisien dari variabel rokok adalah 0,755. Dengan demikian, nilai OR-nya adalah exp(0,755) yaitu sebesar 2,13. Bagaimana hubungan antara nilai beta (koefisien) dengan nilai OR? Bila nilai beta minus, nilai OR di bawah 1. Bila nilai beta positif, nilai OR lebih besar dari 1. Bila nilai beta nol, nilai OR adalah 1. Tabel di bawah ini menunjukkan nilai beta serta eksponensial dari beta (OR). Tabel 2.3 Nilai Koefisien dan Nilai Eksponensial (Odds Rasio)3 Beta
Exp(Beta)=OR
Beta
Exp(Beta)=OR
-1,00
0,37
0,00
1,00
-0,90
0,41
0,10
1,11
-0,80
0,45
0,20
1,22
-0,70
0,50
0,30
1,35
-0,60
0,55
0,40
1,49
-0,50
0,61
0,50
1,65
-0,40
0,67
0,60
1,82
-0,30
0,74
0,70
2,01
-0,20
0,82
0,80
2,23
-0,10
0,90
0,90
2,46
0,00
1,00
1,00
2,72
32
Apa artinya odds rasio (OR) 2,13? Nilai
OR
perilaku
merokok
adalah
2,13.
Artinya,
kemungkinan (odds) perokok menderita HDL rendah adalah 2,13 kalinya bukan perokok. Selanjutnya, kemungkinan perokok untuk menderita HDL rendah + intermediet adalah 2,13 kalinya bukan perokok. Dengan kata lain, kemungkinan perokok untuk menderita HDL yang lebih buruk adalah 2,13 kalinya bukan perokok. Catatan: Pada buku ini, odds diterjemahkan menjadi kemungkinan sementara risk diterjemahkan menjadi probabilitas. Nilai OR adalah perbandingan odds bukan perbandingan risk. Bagaimana menghitung interval kepercayaan dari OR? Pada Gambar 2.2, tidak ada informasi nilai interval kepercayaan
dari
OR.
Walaupun
demikian,
kita
bisa
menghitungnya karena ada informasi IK dari koefisien. Untuk menghitung IK dari OR, kita gunakan rumus yang sama dengan cara menghitung OR dari koefisien. Nilai minimum koefisien adalah 0,240 sehingga nilai minimum dari OR adalah exp(0,240) yaitu 1,27. Nilai maksimum koefisien adalah 1,269 sehingga nilai maksimum dari OR adalah exp(1,269) yaitu 3,56. Tabel 2.4 Konversi koefisien ke dalam nilai odds rasio Koefisien
Odss Rasio (OR) = exp(koefisien)
Nilai pada sampel
0,755
2,13
Minimal
0,240
1,27
Maksimal
1,269
3,56
33
Mengapa pada regresi ordinal kekuatan hubungan risiko relatif (RR) tidak dapat langsung diketahui sementara nilai OR dapat langsung diketahui? Kekuatan hubungan pada regresi ordinal yang secara langsung bisa diketahui adalah OR. Nilai OR dapat secara langsung dihitung karena nilai OR adalah eksponensial dari β di mana nilai ini langsung kita peroleh pada persamaan regresi ordinal. Nilai risiko relatif (RR) tidak dapat dihitung secara langsung karena untuk menghitung RR diperlukan dua syarat. Pertama, desain penelitian kohort; Kedua, karakteristik subjek disebutkan dengan spesifik.1 Bila salah satu dari dua syarat tersebut tidak terpenuhi, kita tidak akan dapat menghitung nilai RR. Bagaimana mengetahui kemaknaan hubungan antar variabel pada regresi ordinal? Interpretasi apakah hubungan antar variabel bermakna atau tidak dilakukan secara statistik dan secara klinis. Bagaimana mengetahui kemaknaan hubungan antar variabel pada regresi ordinal secara statistik? Hubungan antara variabel bebas dengan variabel terikat diuji
dengan
menguji
nilai
beta
(koefisien)
dan
interval
kepercayaan dari OR masing-masing variabel. Nilai beta diuji dengan uji Wald sementara interval kepercayaan dihitung dengan rumus
interval
kepercayaan.2
Rumus
Wald
dan
interval
kepercayaan tidak akan dibahas. Yang akan dibahas adalah bagaimana interpretasi terhadap hasil uji Wald dan interpretasi terhadap interval kepercayaan.
34
Bagaimana interpretasi terhadap uji Wald? Hipotesis nol dari uji Wald adalah nilai β (koefisien) sama dengan nol.2 Artinya, tidak ada hubungan antara variabel bebas dengan variabel terikat. Hipotesis alternatifya, koefisien tidak sama dengan nol, koefisien lebih besar dari nol, atau koefisien lebih kecil dari nol. Hipotesis nol: β = 0 Hipotesis alternatif: β ≠ 0 atau β > 0 atau β < 0 Logikanya, bila nilai koefisien adalah nol, hasil perkalian variabel bebas dengan koefisien selalu nol, sehingga berapapun nilai variabel bebas tidak akan berpengaruh terhadap variabel terikat. Hipotesis nol diterima apabila nilai Wald lebih kecil dari 3,84 untuk setiap satu derajat kebebasan (degree of freedom) atau bila nilai p lebih besar daripada 0,05. Bila hipotesis nol diterima, beta sama dengan nol atau secara populer, disimpulkan ”tidak ada hubungan antara variabel bebas dengan variabel terikat”.
35
Uji Wald Hipotesis nol: β=0 Hipotesis alternatif: β≠0
Nilai Wald >3,84/df p0. Simbol hdl = 1 artikan sebagai logit hdl ≤ 1 dibandingkan 5
hdl > 1.
Pada baris location, estimates merupakan nilai koefisien dari variabel bebas. Nilai koefisiennya adalah -0,755 (rokok = 0). Simbol rokok = 0 artikan sebagai koefisien punya kategori nol, yaitu
perokok.
Sebagaimana
telah
dijelaskan
sebelumnya,
koefisien sesungguhnya dari variabel rokok adalah –(B) atau –(0,755) = 0,755.2, 5 Kita dapat membuat dua persamaan regresi ordinal, 2,5
yaitu:
y1 a1 ( 1 X 1 ) 1,665 (0,755rokok ) y1 a1 ( 1 X 1 ) 0,028 (0,755rokok )
55
Di mana, y1 = logit persamaan pertama = logit HDL rendah (kode ≤ 0) dibandingkan HDL intermediet+normal (kode >0) y2 = logit persamaan kedua = logit HDL rendah + intermediet (kode ≤ 1) dibandingkan normal (kode >1). Rokok = 1 jika perokok Rokok = 0 jika bukan perokok
c. Menilai kemaknaan secara statistik dengan melihat nilai p Pada analisis ini, analisis bertujuan untuk menguji apakah nilai β sama dengan nol atau tidak. Uji yang digunakan adalah uji Wald. Hipotesis nol dari uji Wald adalah nilai β milik perilaku merokok sama dengan nol. Hipotesis nol diterima apabila nilai p lebih besar dari 0,05.2,5 Nilai p untuk Wald sebesar 8,275 dan degree of freedom 1 adalah 0,004 (lihat kolom sig). Oleh karena nilai p lebih kecil daripada 0,05, hipotesis nol ditolak. Dengan demikian, nilai β perilaku merokok tidak sama dengan nol. Kita dapat menarik kesimpulan bahwa variabel perilaku merokok berhubungan secara bermakna dengan kadar HDL.
d. Menilai kemaknaan secara statistik dengan melihat nilai interval kepercayaan Koefisien dari perilaku merokok adalah 0,775 (IK95% 0,24 – 1,269). Karena pada rentang interval kepercayaan tidak ada angka nol, maka koefisien dikatakan bermakna.
2,5
Kita dapat
menarik kesimpulan bahwa perilaku merokok berhubungan secara bermakna dengan HDL sebagai faktor risiko.
56
Interpretasi juga dapat dilakukan dengan melihat interval kepercayaan dari odds rasio (OR). Pada Gambar 3.6, kita tidak menemukan
nilai
menghitungnya
dengan
2,5
exp(koefisien).
OR.
Walaupun
demikian,
menggunakan
kita
rumus
dapat OR
=
Koefisien dari perilaku merokok adalah 0,755.
Dengan demikian, nilai OR-nya adalah exp(0,755) yaitu sebesar 2,13. Pada Gambar 3.6, juga tidak ada informasi nilai interval kepercayaan
dari
OR.
Walaupun
demikian,
kita
bisa
2,5
Untuk
menghitungnya karena ada informasi IK dari koefisien.
menghitung IK dari OR, kita gunakan rumus yang sama dengan cara menghitung OR dari koefisien. Nilai minimum koefisien adalah 0,240 sehingga nilai minimum dari OR adalah exp(0,240) yaitu 1,27. Nilai maksimum koefisien adalah 1,269 sehingga nilai maksimum dari OR adalah exp(1,269) yaitu 3,56. Dengan demikian nilai OR perilaku merokok adalah 2,13 (IK95% 1,27 – 3,56). Karena pada rentang interval kepercayaan tidak ada angka satu, maka OR dikatakan bermakna. Kita dapat menarik
kesimpulan
bahwa
variabel
perilaku
merokok
berhubungan secara bermakna dengan derajat HDL sebagai faktor risiko. e. Menilai kemaknaan secara klinis dengan membandingkan OR yang diperoleh dengan yang diharapkan Peneliti
menetapkan
OR
minimal
yang
dianggap
bermakna sebesar dua. Pada penelitian ini, OR yang diperoleh adalah 2,13. Angka ini lebih besar daripada OR minimal yang diinginkan. Dengan demikian, secara klinis, hubungan antara perilaku merokok dengan HDL juga bermakna.
57
f. Interpretasi terhadap OR Nilai OR adalah membandingkan odds antara kategori perokok dengan bukan perokok. Mengapa bukan membandingkan bukan perokok dengan perokok? Karena, kita sudah membuat kode satu untuk bukan perokok dan kode nol untuk perokok. Nilai
OR
perilaku
merokok
adalah
2,13.
Artinya,
kemungkinan (odds) perokok menderita HDL rendah adalah 2,13 kalinya bukan perokok. Selanjutnya, kemungkinan perokok untuk menderita HDL rendah + intermediet adalah 2,13 kalinya bukan perokok. Dengan kata lain, kemungkinan perokok untuk menderita HDL yang lebih berat adalah 2,13 kalinya bukan perokok. Catatan: Nilai OR adalah perbandingan odds bukan perbandingan risk. Pada buku ini, odds diterjemahkan menjadi kemungkinan sementara risk diterjemahkan menjadi probabilitas. g. Menghitung probabilitas individu Karena probabilitas
penelitian
setiap
subjek
kohort, untuk
kita
dapat
terjadinya
menghitung HDL
rendah
(persamaan pertama) dan terjadinya HDL rendah + intermediet (persamaan kedua). Probabilitas dihitung dengan rumus sebagai berikut. Probabilitas subjek untuk HDL rendah:
p
1 1 1 exp ( y ) 1 exp (1,665 (0,755rokok )) Probabilitas subjek untuk HDL rendah + intermediet:
p
1 1 1 exp ( y ) 1 exp (0,028 (0,755rokok ))
58
Rokok = 0 jika perokok; 1 jika bukan perokok Berikut adalah perhitungan probabilitas pada empat kondisi subjek (Tabel 3.2). 1) Berapakah probabilitas perokok untuk mengalami HDL rendah? Karena
probabilitas
yang
hendak
dihitung
adalah
probabilitas HDL rendah, persamaan yang digunakan adalah persamaan pertama. 1 1 exp (1,665 (0,755rokok )) 1 p 0,287 1 exp ( 1,665 (0,755 x1)) p
2) Berapakah probabilitas bukan perokok untuk mengalami HDL rendah? Karena
probabilitas
yang
hendak
dihitung
adalah
probabilitas HDL rendah, persamaan yang digunakan adalah persamaan pertama.
p
1 1 exp (1,665 (0,755rokok ))
p
1 0,159 1 exp (1,665 (0,755x0))
3) Berapakah probabilitas perokok untuk mengalami HDL rendah + intermediet? Karena
probabilitas
yang
hendak
dihitung
adalah
probabilitas HDL rendah + intermediet, persamaan yang digunakan adalah persamaan kedua.
59
p
1 1 exp (0,028 (0,755rokok ))
p
1 0,686 1 exp (0,028 (0,755x1))
4) Berapakah probabilitas bukan perokok untuk mengalami HDL rendah + intermediet? Karena
probabilitas
yang
hendak
dihitung
adalah
probabilitas rendah + intermediet, persamaan yang digunakan adalah persamaan kedua.
p
1 1 exp (0,028 (0,755rokok ))
p
1 0,507 1 exp (0,028 (0,755x0))
Tabel 3.2 Probabilitas subjek untuk HDL rendah dan rendah + intermediet berdasar perhitungan secara deskriptif dan regresi ordinal Perokok
Bukanperokok
Deskriptif
Regresi ordinal
Deskriptif
Regresi ordinal
Probabilitas HDL rendah
0,284
0,287
0,161
0,159
Probabilitas HDL rendah + intermediet
0,689
0,686
0,506
0,507
Tabel
3.2
menyajikan
probabilitas
subjek
untuk
mengalami HDL rendah dan rendah+intermediet. Pada tabel tersebut, juga disajikan persentase kumulatif sebagaimana kita
60
lihat secara deskriptif pada Gambar 3.2 dan 3.3. Kita dapat menyimpulkan bahwa perhitungan dengan menggunakan regresi ordinal tidak berbeda dengan perhitungan secara deskriptif. h. Menghitung RR Pada penelitian kohort, kita dapat menghitung nilai RR dengan cara membandingkan probabilitas.2 Jika kita hendak menghitung nilai RR dari perilaku merokok untuk terjadinya HDL rendah,
kita
perlu
menghitung
probabilitas
perokok
dan
probabilitas bukan perokok untuk terjadinya HDL rendah. Jika kita hendak menghitung nilai RR dari perilaku merokok untuk terjadinya HDL rendah + intermediet maka kita perlu menghitung probabilitas perokok dan probabilitas bukan perokok untuk terjadinya HDL rendah + intermediet. Kita telah menghitung probabilitas perokok dan bukan perokok untuk terjadinya HDL rendah dan HDL rendah+ intermediet (Tabel 3.2). Dengan demikian, kita dapat menghitung nilai RR dari perilaku merokok (Tabel 3.3). Tabel 3.3 Nilai risiko relatif yang diperoleh dari perbandingan probabilitas Perokok (A)
Bukan perokok (B)
RR = A : B
Probabilitas HDL rendah
0,287
0,159
1,80
Probabilitas HDL rendah + intermediet.
0,686
0,507
1,35
61
62
Bab 4 Regresi Ordinal dengan Satu Variabel Bebas Numerik Tujuan Setelah membaca bab ini, diharapkan pembaca mampu:
-
mengetahui perbedaan variabel bebas numerik dan kategorik dalam regresi ordinal,
-
melakukan langkah-langkah analisis regresi ordinal dengan variabel bebas numerik,
-
membuat persamaan regresi ordinal,
-
melakukan interpretasi secara statistik dengan menggunakan nilai p dan interval kepercayaan,
-
melakukan interpretasi odds rasio dari variabel bebas numerik,
-
melakukan penghitungan probabilitas, dan
-
melakukan penghitungan risiko relatif,
Pengantar Pada bab ini, akan dibahas analisis regresi ordinal dengan satu variabel bebas berskala numerik. Pada regresi ordinal dengan perangkat lunak SPSS, variabel numerik dimasukkan ke dalam covariats. Kasus Seorang peneliti ingin mengetahui hubungan antara perilaku merokok dengan kadar HDL pada penyakit jantung koroner (PJK). Peneliti melakukannya dengan desain kohort. Perilaku merokok diukur dalam indeks Brinkman (IB) sementara HDL diklasifikasikan menjadi rendah, intermediet, dan normal.
63
Peneliti
berkeinginan
untuk
mengetahui
pengaruh
setiap
perubahan satu unit IB terhadap terjadinya HDL yang lebih rendah. Peneliti menetapkan nilai OR minimal yang secara klinis bermakna sebesar 1,2 untuk setiap perubahan sepuluh unit. Data telah terkumpul dan disimpan dalam file rokok_numerik_hdl.sav dengan keterangan disajikan pada Tabel 4.1. Tabel 4.1. Keterangan variabel data rokok_numerik_hdl.sav No.
Variabel
Label
Kategori
1.
HDL
Klasifikasi HDL
0. Rendah 1. Intermediet 2. Normal
2.
rokok_ib
Perilaku merokok dengan Indeks Brinkman
Langkah-langkah analisis dengan SPSS Peneliti melakukan analisis dengan analisis bivariat (uji t tidak berpasangan atau uji Mann-Whitney) yang bertujuan untuk mengetahui hubungan antara perilaku merokok dan HDL. Selanjutnya, analisis diteruskan dengan analisis multivariat regresi ordinal. 1) Analisis bivariat (uji t tidak berpasangan atau MannWhitney) Pada buku ini, analisis bivariat tidak ditampilkan. Silakan Anda melakukannya sesuai dengan langkah-langkah analisis yang dapat Anda baca ada Buku Seri Satu Edisi Enam.
64
6
2) Analisis regresi ordinal Analisis regresi ordinal dilakukan dengan langkah-langkah 5
berikut.
Buka file rokok_numerik_hdl.sav.
Klik analyze, pilih regression, pilih ordinal.
Masukkan variabel hdl ke dalam dependent.
Masukkan variabel rokok_numerik ke dalam covariats. Variabel rokok (indeks Brinkman) dimasukkan ke dalam covariats karena berskala numerik.
Klik kotak output. Aktifkan test of parallel line.
Klik continue. Klik ok.
Jika Anda melakukan secara benar, Anda akan mendapat hasil sebagai berikut.
Model Fitting Information Model Intercept Only Final
-2 Log Likelihood 350,077 164,113
Chi-Square 185,963
Link function: Logit.
Gambar 4.1 Pseudo R-Square Cox and Snell Nagelkerke McFadden Link function: Logit.
Gambar 4.2
65
,536 ,611 ,366
df
Sig. 1
,000
Test of Parallel Linesa Model Null Hypothesis General
-2 Log Likelihood 19,326 19,308
Chi-Square
df
Sig.
,018
1
,893
The null hypothesis states that the location parameters (slope coefficients) are the same across response categories. a. Link function: Logit.
Gambar 4.3 Parameter Estimates
Threshold Location
[hdl = 0] [hdl = 1] rokok_ib
Estimate -5,904 -2,656 -,018
Std. Error ,533 ,323 ,002
Wald 122,622 67,554 105,554
df 1 1 1
Sig. ,000 ,000 ,000
95% Confidence Interval Lower Bound Upper Bound -6,949 -4,859 -3,290 -2,023 -,021 -,014
Link function: Logit.
Gambar 4.4 Interpretasi a. Melihat kualitas dan menguji asumsi proporsional odds Nilai p pada model fitting informatin 0,000 (Gambar 4.1). Artinya, Model yang diperoleh lebih baik daripada model tanpa variabel bebas. Peran dari variabel bebas untuk menjelaskan variabel
terikat
adalah sebesar
61,1%
bila
menggunakan
Nagelkerke (Gambar 4.2). Nilai p pada test of parallel lines 0,893. Karena nilai p lebih besar dari 0,05, asumsi proporsional terpenuhi (Gambar 4.3).5 b. Membuat persamaan Gambar 4.4 merupakan hasil analisis regresi ordinal mencari hubungan antara perilaku merokok dengan HDL. Peneliti ingin mengetahui pengaruh setiap peningkatan satu unit indeks
66
brinkman terhadap kadar HDL yan lebih rendah.2,5 Kode yang dibuat untuk variabel terikat adalah 0 (rendah), 1 (intermediet), dan 2 (normal).
Untuk variabel bebas numerik, kita ingin mengetahui pengaruh setiap peningkatan satu unit variabel bebas terhadap variabel terikat ≤g
Persamaan regresi dapat dibuat dengan melihat kolom estimate. Pada baris Threshold, estimates merupakan nilai konstanta. Terdapat dua nilai konstanta, yaitu -5,904 untuk persamaan pertama dan -2,656 untuk persamaan kedua. 2,5 Pada baris location, estimates merupakan nilai koefisien dari variabel bebas. Nilai koefisiennya adalah –(-0,018) atau 0,018. Harap selalu ingat bahwa koefisien dari variabel adalah minus koefisien yang tercantum pada keluaran SPSS. 2,5 Dengan demikian, kita dapat membuat dua persamaan regresi ordinal, yaitu:
y1 a1 ( 1 X 1 ) 5,904 (0,018rokok ) y 2 a 2 ( 1 X 1 ) 2,656 (0,018rokok ) Di mana, y1=logit persamaan pertama=logit HDL rendah dibandingkan intermediet + normal y2= logit persamaan kedua=logit HDL rendah + intermediet dibandingkan normal c. Menilai kemaknaan secara statistik dengan melihat nilai p
67
Pada analisis ini, analisis bertujuan untuk menguji apakah nilai β sama dengan nol atau tidak. Uji yang digunakan adalah uji Wald. Hipotesis nol dari uji Wald adalah nilai β milik perilaku merokok sama dengan nol. Hipotesis nol diterima apabila nilai p lebih besar dari 0,05.2,5 Nilai p untuk Wald sebesar 10,554 dan degree of freedom 1 adalah 0,000 (lihat kolom sig). Oleh karena nilai p lebih kecil daripada 0,05, hipotesis nol ditolak. Dengan demikian, nilai β merokok tidak sama dengan nol. Kita dapat menarik
kesimpulan
bahwa
variabel
perilaku
merokok
berhubungan secara bermakna dengan HDL. d. Menilai kemaknaan secara statistik dengan melihat nilai interval kepercayaan Koefisien dari perilaku merokok adalah 0,018 (IK95% 0,014 – 0,021). Karena pada rentang interval kepercayaan tidak ada angka nol, maka koefisien dikatakan bermakna.2,5 Kita dapat menarik kesimpulan bahwa perilaku merokok berhubungan secara bermakna dengan HDL sebagai faktor risiko. Interpretasi juga dapat dilakukan dengan melihat interval kepercayaan dari odds rasio (OR). menemukan
nilai
menghitungnya
OR.
dengan
2,5
Pada Gambar 4.4, kita tidak
Walaupun
demikian,
menggunakan
rumus
kita
dapat OR
=
exp(koefisien). Koefisien dari perilaku merokok adalah 0,018. Dengan demikian, nilai OR-nya adalah exp(0,018) yaitu sebesar 1,017. Pada Gambar 4.4, juga tidak ada informasi nilai interval kepercayaan
dari
OR.
Walaupun
demikian,
kita
bisa
menghitungnya karena ada informasi IK dari koefisien. Untuk menghitung IK dari OR, kita gunakan rumus yang sama dengan
68
cara menghitung OR dari koefisien. Nilai minimum koefisien adalah 0,014 sehingga nilai minimum dari OR adalah exp(0,014) yaitu 1,014. Nilai maksimum koefisien adalah 0,021 sehingga nilai maksimum dari OR adalah exp(0,021) yaitu 1,021. Dengan demikian nilai OR merokok adalah 1,017 (IK95% 1,014 – 1,021). Karena pada rentang interval kepercayaan tidak ada angka satu, maka OR dikatakan bermakna. Kita dapat menarik
kesimpulan
bahwa
variabel
perilaku
merokok
berhubungan secara bermakna dengan derajat HDL sebagai faktor risiko. e. Interpretasi terhadap OR Variabel rokok adalah variabel numerik. Interpretasi variabel numerik adalah pengaruh setiap perubahan satu unit variabel bebas terhadap variabel terikat.2,5 Efek yang dilihat adalah terhadap variabel terikat dengan kode yang lebih kecil (default SPSS).5 Nilai OR perilaku merokok adalah 1,017. Artinya, dibandingkan terhadap subjek dengan indeks Brinkman x, subjek dengan indeks Brinkman sebesar x+1 mempunyai kemungkinan (odds) menderita HDL lebih bruk sebesar 1,017 kali. Jadi, dibandingkan terhadap subjek dengan indeks Brinkman 99, subjek dengan indeks Brinkman sebesar 100 mempunyai kemungkinan (odds)
menderita
HDL
lebih
buruk
sebesar
1,017
kali.
Dibandingkan terhadap subjek dengan indeks Brinkman 149, subjek dengan indeks Brinkman sebesar 150 mempunyai kemungkinan (odds) menderita HDL lebih buruk sebesar 1,017 kali.
69
Nilai OR rokok kelihatannya kecil, yaitu 1,017. Hal ini diakibatkan efek yang dilihat adalah untuk setiap perubahan satu unit indeks Brinkman. Pengaruh rokok akan terlihat lebih besar jika efek yang dilihat untuk setiap perubahan 10 unit, 20 unit, 50 unit, atau 100 unit. Jika kita ingin melihat pengaruh setiap perubahan x unit, maka kita harus mengalikan koefisien rokok dengan jumlah unit yang kita kehendaki.3 Jika kita ingin melihat efek dari setiap perubahan 10 unit maka kita harus mengalikan koefisien rokok (0,018) dengan 10. Koefisien rokok untuk setiap perubahan sepuluh unit menjadi 0,18. Dengan demikian, nilai ORnya adalah exp(0,18) = 1,20. Artinya, dibandingkan terhadap subjek dengan indeks Brinkman x, subjek dengan indeks Brinkman sebesar x+10 mempunyai kemungkinan (odds) menderita HDL lebih buruk sebesar 1,20 kali. Jadi, dibandingkan terhadap subjek dengan indeks Brinkman 0, subjek dengan indeks Brinkman sebesar 10 mempunyai kemungkinan (odds) menderita HDL lebih buruk sebesar 1,20 kali. Dibandingkan terhadap subjek dengan indeks Brinkman 100, subjek dengan indeks Brinkman sebesar 110 mempunyai kemungkinan (odds) menderita HDL lebih buruk sebesar 1,20 kali. Jika kita ingin melihat pengaruh setiap perubahan 100 unit, maka kita harus mengalikan koefisien rokok (0,018) dengan 100. Koefisien rokok untuk setiap perubahan seratus unit adalah 1,8. Dengan demikian, nilai OR adalah exp(1,8) = 6,05. Artinya, dibandingkan terhadap subjek dengan indeks Brinkman x, subjek dengan
indeks
Brinkman
sebesar
x+100
mempunyai
kemungkinan (odds) menderita HDL lebih buruk sebesar 6,05 kali.
70
Jadi, dibandingkan terhadap subjek dengan indeks Brinkman 0, subjek dengan indeks Brinkman sebesar 100 mempunyai kemungkinan (odds) menderita HDL lebih buruk sebesar 6,05 kali. Dibandingkan terhadap subjek dengan indeks Brinkman 100, subjek dengan indeks Brinkman sebesar 200 mempunyai kemungkinan (odds) menderita HDL lebih buruk sebesar 6,05 kali.
f. Menghitung probabilitas individu Karena probabilitas
penelitian
setiap
subjek
kohort, untuk
kita
dapat
terjadinya
menghitung HDL
rendah
(persamaan pertama) dan terjadinya HDL rendah + intermediet (persamaan kedua).2 Probabilitas dihitung dengan rumus sebagai berikut.
Probabilitas subjek untuk HDL rendah:
p
1 1 exp y
p
1 1 exp (5,904 (0,018rokok ))
Probabilitas subjek untuk HDL rendah + intermediet :
p
1 1 exp y
p
1 1 exp (2,656 (0,018rokok ))
71
Berikut adalah perhitungan probabilitas pada empat kondisi subjek, yaitu IB 0, 50, 100, dan 200 (Tabel 4.2). Subjek pertama: Berapakah probabilitas subjek dengan IB 0 untuk mengalami HDL rendah? Karena
probabilitas
yang
hendak
dihitung
adalah
probabilitas HDL rendah, persamaan yang digunakan adalah persamaan pertama.
p
1 1 exp (5,904 (0,018rokok ))
p
1 0,0027 1 exp ( 5,904 ( 0,018 x 0))
Subjek kedua: Berapakah probabilitas subjek dengan IB 50 untuk mengalami HDL rendah? Karena
probabilitas
yang
hendak
dihitung
adalah
probabilitas HDL rendah, persamaan yang digunakan adalah persamaan pertama.
p
1 1 exp (5,904 (0,018rokok ))
p
1 0,0066 1 exp (5,904 ( 0,018 x50))
Subjek ketiga: Berapakah probabilitas subjek dengan IB 100 untuk mengalami HDL rendah? Karena
probabilitas
yang
hendak
dihitung
adalah
probabilitas HDL rendah, persamaan yang digunakan adalah persamaan pertama.
72
1 1 exp (5,904 (0,018rokok ))
p
1 0,0159 1 exp (5,904 (0,018x100))
p
Subjek keempat: Berapakah probabilitas subjek dengan IB 200 untuk mengalami HDL rendah? Karena
probabilitas
yang
hendak
dihitung
adalah
probabilitas HDL rendah, persamaan yang digunakan adalah persamaan pertama.
p
1 1 exp (5,904 (0,018rokok ))
p
1 0,0871 1 exp (5,904 (0,018 x 200))
Subjek kelima: Berapakah probabilitas subjek dengan IB 0 untuk mengalami HDL rendah+intermediet? Karena probabilitas
probabilitas
HDL
rendah
yang +
hendak
intermediet,
digunakan adalah persamaan kedua.
p
1 1 exp (2,656 (0,018rokok ))
p
1 0,6560 1 exp ( 2,656 ( 0,018 x0))
73
dihitung persamaan
adalah yang
Subjek keenam: Berapakah probabilitas subjek dengan IB 50 untuk mengalami HDL rendah+intermediet? Karena probabilitas
probabilitas
HDL
rendah
yang +
hendak
intermediet,
dihitung persamaan
adalah yang
digunakan adalah persamaan kedua.
p
1 1 exp (2,656 (0,018rokok ))
p
1 0,1458 1 exp (2,656 (0,018 x50))
Subjek ketujuh: Berapakah probabilitas subjek dengan IB 100 untuk mengalami HDL rendah+intermediet? Karena probabilitas
probabilitas
HDL
rendah
yang +
hendak
intermediet,
dihitung persamaan
adalah yang
digunakan adalah persamaan kedua.
p
1 1 exp (2,656 (0,018rokok ))
p
1 0,2934 1 exp (2,656 (0,018x100))
Subjek kedelapan: Berapakah probabilitas subjek dengan IB 200 untuk mengalami HDL rendah+intermediet? Karena probabilitas
probabilitas
HDL
rendah
yang +
hendak
intermediet,
digunakan adalah persamaan kedua.
74
dihitung persamaan
adalah yang
p
1 1 exp (2,656 (0,018rokok ))
p
1 0,7105 1 exp ( 2,656 ( 0,018 x 200 ))
Tabel 4.2 Probabilitas subjek untuk HDL rendah dan HDL rendah + intermediet Indeks Brinkman (IB) 0 Probabilitas HDL rendah
0,27%
Probabilitas HDL rendah + intermediet
6,56%
50
100
0,66%
1,59%
14,58%
29,34%
200 8,71%
71,05%
g. Menghitung RR Pada penelitian kohort, kita dapat menghitung nilai RR dengan cara membandingkan probabilitas.2 Kita telah menghitung probabilitas untuk beberapa nilai IB (Tabel 4.2). Dengan demikian, kita dapat menghitung nilai RR untuk subjek yang telah kita hitung probabilitasnya. Misalnya, kita mau mengetahui RR terjadinya HDL rendah antara subjek dengan IB 200 dan 100. Probabilitas HDL rendah untuk subjek pertama dan kedua masing-masing 8,71% dan 1,59%. Dengan demikian, RR-nya adalah 8,71:1,59 ≈5,5.
75
Selanjutnya, kita mau mengetahui RR terjadinya HDL rendah + intermediet antara subjek dengan IB 200 dan 100. Probabilitas untuk subjek pertama dan kedua masing-masing 71,05% dan 29,34%. Dengan demikian, RR-nya adalah 71,05 : 29,34 ≈ 2,42. Tabel 4.2 Nilai risiko relatif yang diperoleh dari perbandingan probabilitas
Probabilitas rendah
HDL
Probabilitas HDL rendah + intermediet.
IB 200
IB 100
(A)
(B)
8,71%
1,59%.
5,5
71,05%
29,34%
2,42
76
RR = A : B
Bab 5 Eksperimen Variabel Bebas Kategorik Tujuan Setelah membaca bab ini, pembaca diharapkan lebih memahami pengaruh point of interest peneliti terhadap
-
koding variabel terikat,
-
koding variabel bebas,
-
persamaan regresi ordinal,
-
koefisien,
-
odd rasio, dan
-
probabilitas subjek.
Pengantar Pada bagian-bagian sebelumnya, kita telah membahas koding variabel terikat, koding variabel bebas kategorik, koefisien, serta persamaan regresi ordinal berdasarkan skenario yang dibuat oleh penulis. Pada bagian ini, kita akan melakukan analisis dengan berbagai macam skenario. Saya anjurkan agar Anda terlebih dahulu menjawab pertanyaan yang diajukan pada kasus pertama dan kedua. Selanjutnya, Anda dapat membandingkannya dengan kunci jawaban. Kasus Pada data rokok_hdl_4_skenario.sav terdapat empat variabel, yaitu rokok1, rokok2, hdl1, dan hdl2. Keterangan setiap variabel dapat dilihat pada Tabel 5.1.
77
Tabel
5.1
Keterangan
variabel
pada
data
rokok_hdl_4_skenario.sav No.
Variabel
Skala
Koding
1.
Rokok1
Kategorik
0 Perokok 1 Bukan perokok
2.
Rokok2
Kategorik
0 Bukan perokok 1 Perokok
3.
HDL1
Kategorik
0 Rendah 1 Intermediet 2 Normal
4.
HDL2
Kategorik
0 Normal 1 Intermediet 2 Rendah
Buatlah analisis untuk empat skenario berikut. 1) Perbandingan perokok terhadap bukan perokok untuk memiliki HDL yang lebih buruk. 2) Perbandingan perokok terhadap bukan perokok untuk memiliki HDL yang lebih baik. 3) Perbandingan bukan perokok terhadap perokok untuk memiliki HDL yang lebih buruk. 4) Perbandingan bukan perokok terhadap perokok untuk memiliki HDL yang lebih baik. Untuk
masing-masing
skenario,
jawablah
pertanyaan berikut. Jawaban diisi pada Tabel 5.2. 1) Variabel bebas dan variabel terikat
78
beberapa
2) Asumsi proporsional odds rasio. 3) Persamaan regresi ordinal. 4) Koefisien variabel rokok. 5) OR variabel rokok. 6) Probabilitas perokok untuk mengalami HDL rendah 7) Probabilitas bukan perokok untuk mengalami HDL rendah + intermediet.
Tabel 5.2 Jawaban 1. Variabel bebas dan variabel terikat Skenario pertama Skenario kedua Skenario ketiga Skenario keempat 2. Asumsi proporsional odds rasio Skenario pertama Skenario kedua Skenario ketiga Skenario keempat 3. Persamaan regresi ordinal Skenario pertama
79
Skenario kedua
Skenario ketiga
Skenario keempat
4. Koefisien (IK95%) variabel rokok Skenario pertama Skenario kedua Skenario ketiga Skenario keempat 5. OR (IK95%) variabel rokok Skenario pertama Skenario kedua Skenario ketiga Skenario keempat
80
6. Probabilitas perokok mengalami HDL rendah Skenario pertama Skenario kedua Skenario ketiga Skenario keempat 7. Probabilitas bukan perokok untuk mengalami HDL rendah + intermediet Skenario pertama Skenario kedua Skenario ketiga Skenario keempat
81
Kunci jawaban 1) Variabel bebas dan variabel terikat Ketentuan yang harus kita ingat adalah sebagai berikut. Untuk variabel bebas, kategori pembanding adalah kode terbesar (terakhir). Untuk variabel terikat, kategori pembanding adalah kode yang lebih besar.2 Pada
skenario
pertama
dan
kedua,
peneliti
hendak
membandingkan perokok terhadap bukan perokok. Bukan perokok adalah kategori pembanding sehingga kodenya satu. Dengan demikian, perokok kodenya nol. Variabel yang sesuai dengan pengkodean ini adalah variabel rokok1. Pada
skenario
ketiga
dan
keempat,
peneliti
hendak
membandingkan bukan perokok terhadap perokok. Perokok adalah kategori pembanding sehingga kodenya satu. Dengan demikian, bukan perokok kodenya nol. Variabel yang sesuai dengan pengkodean ini adalah variabel rokok2. Pada
skenario
pertama
dan
ketiga,
peneliti
hendak
menghitung probabilitas memiliki HDL lebih buruk. Dengan demikian, HDL yang lebih baik menjadi pembanding untuk setiap analisis. Konsekuensinya, kategori normal diberikan kode dua, intermediet satu, dan rendah nol. Variabel yang sesuai dengan pengkodean ini adalah variabel hdl1. Pada
skenario
kedua
dan
keempat,
peneliti
hendak
menghitung probabilitas memiliki HDL lebih baik. Dengan demikian, HDL yang lebih buruk menjadi pembanding untuk setiap analisis. Konsekuensinya, kategori rendah diberikan kode dua, intermediet satu, dan normal nol. Variabel yang sesuai dengan pengkodean ini adalah variabel hdl2.
82
Tabel 5.3 Pemilihan variabel rokok dan HDL untuk setiap skenario Skenario
Variabel bebas
Variabel terikat
Pertama
Rokok 1
HDL1
Perokok = 0
Rendah =0
Bukan perokok = 1
Intermediet = 1 Normal =2
Kedua
HDL2
Rokok1 Perokok = 0
Normal = 0
Bukan perokok = 1
Intermediet = 1 Rendah = 2
Ketiga
HDL1
Rokok2 Bukan perokok = 0
Rendah =0
Perokok = 1
Intermediet = 1 Normal =2
Keempat
HDL2
Rokok2 Bukan perokok = 0
Normal = 0
Perokok = 1
Intermediet = 1 Rendah = 2
83
Bila Anda melakukan pemilihan variabel secara benar maka hasil analisis adalah sebagai berikut. Skenario pertama Test of Parallel Linesa Model Null Hypothesis General
-2 Log Likelihood 19,326 19,308
Chi-Square
df
,018
Sig. 1
,893
The null hypothesis states that the location parameters (slope coefficients) are the same across response categories. a. Link function: Logit.
Gambar 5.1 Parameter Estimates
Threshold Location
[hdl1 = 0] [hdl1 = 1] [rokok1=0] [rokok1=1]
Estimate Std. Error -1,665 ,191 ,028 ,152 -,755 ,262 0a .
Wald 76,342 ,033 8,275 .
df 1 1 1 0
Sig. ,000 ,855 ,004 .
95% Confidence Interval Lower Bound Upper Bound -2,039 -1,292 -,269 ,325 -1,269 -,240 . .
Link function: Logit. a. This parameter is set to zero because it is redundant.
Gambar 5.2
Skenario kedua Test of Parallel Linesa Model Null Hypothesis General
-2 Log Likelihood 19,326 19,308
Chi-Square ,018
df
Sig. 1
The null hypothesis states that the location parameters (slope coefficients) are the same across response categories. a. Link function: Logit.
Gambar 5.3
84
,893
Parameter Estimates
Threshold Location
[hdl2 = ,00] [hdl2 = 1,00] [rokok1=0] [rokok1=1]
Estimate Std. Error -,028 ,152 1,665 ,191 ,755 ,262 0a .
Wald ,033 76,342 8,275 .
df 1 1 1 0
Sig. ,855 ,000 ,004 .
95% Confidence Interval Lower Bound Upper Bound -,325 ,269 1,292 2,039 ,240 1,269 . .
Link function: Logit. a. This parameter is set to zero because it is redundant.
Gambar 5.4 Skenario ketiga Test of Parallel Linesa -2 Log Likelihood 19,326 19,308
Model Null Hypothesis General
Chi-Square
df
Sig.
,018
1
,893
The null hypothesis states that the location parameters (slope coefficients) are the same across response categories. a. Link function: Logit.
Gambar 5.5 Parameter Estimates
Threshold Location
[hdl1 = 0] [hdl1 = 1] [rokok2=,00] [rokok2=1,00]
Estimate Std. Error -,910 ,230 ,782 ,228 ,755 ,262 0a .
Wald 15,613 11,788 8,275 .
df 1 1 1 0
Sig. ,000 ,001 ,004 .
95% Confidence Interval Lower Bound Upper Bound -1,362 -,459 ,336 1,229 ,240 1,269 . .
Link function: Logit. a. This parameter is set to zero because it is redundant.
Gambar 5.6 Skenario keempat Test of Parallel Linesa Model Null Hypothesis General
-2 Log Likelihood 19,326 19,308
Chi-Square ,018
df
Sig. 1
The null hypothesis states that the location parameters (slope coefficients) are the same across response categories. a. Link function: Logit.
Gambar 5.7
85
,893
Parameter Estimates
Threshold Location
[hdl2 = ,00] [hdl2 = 1,00] [rokok2=,00] [rokok2=1,00]
Estimate Std. Error -,782 ,228 ,910 ,230 -,755 ,262 0a .
Wald 11,788 15,613 8,275 .
df 1 1 1 0
Sig. ,001 ,000 ,004 .
95% Confidence Interval Lower Bound Upper Bound -1,229 -,336 ,459 1,362 -1,269 -,240 . .
Link function: Logit. a. This parameter is set to zero because it is redundant.
Gambar 5.8 2) Asumsi proporsional odds rasio Asumsi proporsional odds rasio untuk setiap skenario semestinya memberikan kesimpulan yang sama. Hal ini memang terbukti dengan analisis parallel lines untuk setiap skenario yang memberikan hasil yang sama, yaitu p=0,893 (Gambar 5.1, 5.3, 5.5. dan 5.7). Karena nilai p lebih besar dari 0,05, asumsi terpenuhi.5 3) Persamaan regresi ordinal Persamaan regresi ordinal untuk variabel terikat tiga kategori adalah:
y1 a1 ( 1 X 1 ........ i X i ) y 2 a 2 ( 1 X 1 ........ i X i ) y1= persamaan logit pertama y2= persamaan logit kedua a1=konstanta persamaan pertama a2=konstanta persamaan kedua x1=variabel bebas ke-1 β1=koefisien dari variabel bebas ke-1 xi=variabel bebas ke-i β i=koefisien dari variabel bebas ke-i Nilai koefisien (β) sama untuk semua persamaan.
86
Berdasarkan Gambar 5.2, 5.4, 5.6, dan 5.8, kita dapat membuat persamaan untuk setiap skenario (Tabel 5.4).
Tabel 5.4 Persamaan regresi ordinal pada empat skenario Skenario
Persamaan
Pengisian variabel bebas
Pertama
y1 1,665 (0,755rokok ) y2 0,028 (0,755rokok )
Bukan perokok = 0 Perokok = 1
y1= logit HDL rendah y2= logit HDL rendah + intermediet Kedua
y1 0,028 (0,755rokok )
Bukan perokok = 0 Perokok = 1
y2 1,665 (0,755rokok ) y1 = logit HDL normal y2 = logit HDL normal + intermediet Ketiga
y1 0,910 (0,755rokok ) y2 0,782 (0,755rokok )
Perokok=0 Bukan perokok=1
y1= logit HDL rendah y2= logit HDL rendah + intermediet Keempat
y1 a 0,782 (0,755rokok ) y2 0,910 (0,755rokok ) y1 = logit HDL normal y2 = logit HDL normal + intermediet
87
Perokok = 0 Bukan perokok=1
4) Koefisien variabel rokok Koefisien untuk masing-masing variabel adalah negatif kali koefisien yang tercantum pada keluaran.2 Bila pada keluaran tercantum B maka koefisien variabel tersebut adalah –B. demikian juga sebaliknya (Tabel 5.5). Tabel 5.5 Koefisien yang tercantum pada keluaran serta koefisien sebenarya untuk masing-masing skenario Skenario
Pertama
Koefisien yang persamaan
tercantum
pada
y1 1,665 (0,755rokok )
Koefisien
0,755
y2 0,028 (0,755rokok ) Koefisien pada persamaan = -0,755 Kedua
y1 0,028 (0,755rokok )
-0,755
y2 1,665 (0,755rokok ) Koefisien pada persamaan = 0,755 Ketiga
y1 0,910 (0,755rokok )
-0,755
y2 0,782 (0,755rokok ) Koefisien pada persamaan = 0,755 Keempat
y1 a 0,782 (0,755rokok ) y2 0,910 (0,755rokok ) Koefisien pada persamaan = -0,755
88
0,755
5) OR variabel rokok Nilai OR adalah eksponensial dari koefisien (B). Secara matematis, OR = exp(B).2 Kita telah mengetahui koefisien rokok untuk masing-masing skenario (Tabel 5.5). Dengan demikian, kita dapat menghitung niali OR untuk masing-masing skenario (Tabel 5.6).
Tabel 5.6 Nilai odds rasio serta maknanya untuk setiap skenario Skenario
Koefisien
OR
Makna
Pertama
0,755
Exp(0,755)
Odds (kemungkinan) perokok untuk mempunyai HDL yang lebih rendah adalah 2,13 kali bukan perokok.
= 2,13
Kedua
-0,755
Exp (-0,755) = 0,47
Ketiga
-0,755
Exp (-0,755) = 0,47
Keempat
0,755
Exp (0,755) = 2,13
89
Odds (kemungkinan) perokok untuk mempunyai HDL yang lebih baik adalah 0,47 kali bukan perokok. Odds (kemungkinan) bukan perokok untuk mempunyai HDL yang lebih rendah adalah 0,47 kali perokok. Odds (kemungkinan) bukan perokok untuk mempunyai HDL yang baik rendah adalah 2,13 kali perokok.
6) Probabilitas perokok untuk mengalami HDL rendah Logikanya, dengan menggunakan skenario manapun, probabilitas perokok untuk mengalami HDL rendah seharusnya sama. Tabel 5.7 membuktikan hal ini. Nilai probabilitas pada semua skenario sama, yaitu 28,7%. Untuk skenario pertama dan ketiga, kita dapat langsung menghitung probabilitas perokok mengalami HDL rendah karena pada kedua skenario tersebut terdapat salah satu persamaan yang menghitung logit HDL rendah. Nilai logit dapat langsung dihitung sehingga nilai probabilitas juga dapat langsung diketahui dengan persamaan 1/(1+exp(-y)). Untuk skenario kedua dan keempat, kita tidak dapat langsung menghitung probabilitas perokok mengalami HDL rendah karena tidak ada persamaan yang secara langsung menghitung logit HDL rendah. Pada kedua skenario ini, persamaan yang ada adalah logit normal dan logit normal + intermediet. Solusinya, kita dapat menghitung probabilitas HDL rendah rumus 1 – probabilitas normal + intermediet. Tabel 5.7 menyajikan bagaimana proses menghitung probabilitas perokok mengalami HDL rendah untuk setiap skenario. Perhatikan bagaimana perbedaan cara menghitung antara skenario satu dan tiga dengan skenario dua dan empat.
90
Tabel 5.7 Probabilitas perokok untuk mengalami HDL rendah berdasarkan empat skenario Skenario
Logit perokok untuk
Probabilitas
mengalami HDL rendah Pertama
y1 1,665 (0,755rokok )
p
Perokok = 1
1 1 exp(0,910)
P = 0,287
y1 1,665 (0,755 x1) y1 0,910 Kedua
y 2 1,665 (0,755rokok )
1 – (probabilitas normal + intermediet)
Perokok = 1
y2 = logit normal + intermediet
y2 1,665 (0,755 x1) y2 0,910 Ketiga
Probabilitas rendah =
y1 0,910 (0,755rokok ) Perokok=0
y1 0,910 (0,755 x0)
p 1
1 1 exp(0,910)
p = 1-0,713 = 0,287
p
1 1 exp(0,028) p = 0,287
y1 0,028 Keempat
y 2 0,910 (0,755rokok )
Probabilitas rendah = 1 – (probabilitas normal + intermediet)
Perokok = 0
y2 = logit normal + intermediet
y2 0,910 (0,755 x0) y2 0,910
91
p 1
1 1 exp(0,910)
p = 1-0,713 = 0,287
7) Probabilitas bukan perokok untuk mengalami HDL rendah + intermediet Logikanya, dengan menggunakan skenario manapun, probabilitas bukan perokok untuk mengalami HDL rendah + intermediet harusnya sama. Tabel 5.8 membuktikan hal ini. Nilai probabilitas pada semua skenario sama, yaitu 50,7%. Untuk skenario pertama dan ketiga, kita dapat langsung menghitung probabilitas perokok mengalami HDL rendah + intermediet karena pada kedua skenario tersebut terdapat salah satu persamaan yang menghitung logit HDL rendah + intermediet. Nilai logit dapat langsung dihitung sehingga nilai probabilitas juga dapat langsung diketahui dengan persamaan 1/(1+exp(-y)). Untuk skenario kedua dan keempat, kita tidak dapat langsung menghitung probabilitas bukan perokok mengalami HDL rendah + intermediet karena tidak ada persamaan yang secara langsung
menghitung
logitnya.
Pada
kedua
skenario
ini,
persamaan yang ada adalah logit normal dan logit normal + intermediet. Solusinya, kita dapat menghitung probabilitas HDL rendah + intermediet dengan rumus 1 – probabilitas normal. Tabel 5.8 menyajikan bagaimana proses menghitung probabilitas perokok mengalami HDL rendah untuk setiap skenario. Perhatikan bagaimana perbedaan cara menghitung antara skenario satu dan tiga dengan skenario dua dan empat.
92
Tabel 5.8 Probabilitas bukan perokok untuk mengalami HDL rendah + intermediet berdasarkan empat skenario Skenario
Pertama
Logit bukan perokok untuk mengalami HDL rendah + intermediet
y 2 0,028 (0,755rokok ) y2= logit rendah + intermediet
Probabilitas
p
1 1 exp(0,028) P = 0,507
Bukan perokok = 0
y2 0,028 (0,755 x0) y2 0,028 Kedua
y1 0,028 (0,755rokok )
Probabilitas (rendah + intermediet) =
y1 = logit normal Bukan perokok = 0
y1 0,028 (0,755 x0)
1 – (probabilitas normal) p 1
y1 0,028
1 1 exp(0,028)
p = 1- 0,493 = 0,507 Ketiga
y 2 0,782 (0,755rokok ) y2= logit rendah + intermediet Bukan perokok=1
y2 0,782 (0,755 x1) y2 0,027
93
p
1 1 exp(0,027)
P = 0,507
Skenario
Logit bukan perokok untuk mengalami HDL rendah + intermediet
Probabilitas
Keempat
y1 0,782 (0,755rokok )
Probabilitas (rendah + intermediet) =
y1 = logit normal Bukan perokok=1
y1 0,782 (0,755 x1)
1 – (probabilitas normal)
p 1
y1 0,027
1 1 exp(0,027)
p = 1- 0,493 = 0,507
94
Bab 6 Eksperimen Variabel Bebas Numerik Tujuan Setelah membaca bab ini, pembaca diharapkan lebih memahami pengaruh point of interest peneliti terhadp
-
koding variabel terikat,
-
persamaan regresi ordinal,
-
koefisien,
-
odd rasio, dan
-
probabilitas subjek.
Pengantar Pada bagian sebelumnya (Bab 4), kita telah membahas variabel bebas numerik, koefisien, serta persamaan regresi ordinal berdasarkan skenario yang dibuat oleh penulis. Pada bagian ini, kita akan melakukan analisis dengan dua macam skenario. Saya anjurkan agar Anda terlebih dahulu menjawab pertanyaan yang diajukan pada kasus pertama dan kedua. Selanjutnya, Anda dapat membandingkannya dengan kunci jawaban. Kasus Pada data rokok_numerik_2_skenario.sav terdapat tiga variabel, yaitu rokok, HDL1 dan HDL2. Kode HDL1 adalah kode 0 untuk rendah, 1 untuk intermediet, dan 2 untuk normal. Untuk HDL2, kodenya 0 untuk normal, 1 untuk intermediet, dan 2 untuk rendah. Keterangan setiap variabel dapat dilihat pada Tabel 6.1.
95
Tabel
6.1
Keterangan
variabel
pada
data
rokok_numerik_hdl_2_skenario.sav No.
Variabel
Skala
Koding
1.
Rokok
Numerik
-
2.
HDL1
Kategorik
0 Rendah 1 Intermediet 2 Normal
3.
HDL2
Kategorik
0 Normal 1 Intermediet 2 Rendah
Buatlah analisis untuk dua skenario berikut. 1) Efek peningkatan indeks brinkman terhadap probabilitas HDL yang lebih buruk. 2) Efek peningkatan indeks brinkman terhadap probabilitas HDL yang lebih baik. Untuk
masing-masing
skenario,
jawablah
beberapa
pertanyaan berikut. Jawaban diisi pada Tabel 6.2. 1) Variabel bebas dan variabel terikat 2) Asumsi proporsional odds rasio 3) Persamaan regresi ordinal 4) Koefisien variabel rokok 5) OR variabel rokok 6) Probabilitas perokok dengan IB 100 untuk mengalami HDL rendah 7) Probabilitas perokok dengan IB 400 untuk mengalami HDL normal.
96
Tabel 6.2 Jawaban
1. Variabel bebas dan variabel terikat Skenario pertama Skenario kedua 2. Asumsi proporsional odds rasio Skenario pertama Skenario kedua 3. Persamaan regresi ordinal Skenario pertama Skenario kedua
4. Koefisien (IK95%) Skenario pertama Skenario kedua 5. OR (IK95%) variabel rokok Skenario pertama Skenario kedua 6. Probabilitas perokok dengan IB 100 mengalami HDL rendah Skenario pertama Skenario kedua
97
7. Probabilitas perokok dengan IB 400 mengalami HDL normal Skenario pertama Skenario kedua
Kunci jawaban
1) Variabel terikat Ketentuan yang harus kita ingat adalah sebagai berikut. Untuk variabel terikat, kategori pembanding adalah kode yang lebih besar. Ingat, default SPSS adalah ≤g vs. >g.2 Jika ada tiga kategori maka penyederhanaannya adalah ≤ kode 0 vs. kode >0 (penyederhanaan pertama) dan ≤ kode 1 vs. kode >1. Pada skenario pertama, peneliti hendak melihat efek peningkatan IB (indeks Brinkman) terhadap kadar HDL yang buruk.
Dengan
demikian,
HDL
yang
lebih
baik
menjadi
pembanding untuk setiap analisis. Konsekuensinya, kategori rendah diberikan kode nol, intermediet kode satu, dan nomal dua. Variabel yang sesuai dengan pengkodean ini adalah variabel hdl1. Pada skenario kedua, peneliti hendak menghitung probabilitas memiliki HDL lebih baik untuk setiap peningkatan IB. HDL yang lebih
buruk
menjadi
pembanding
untuk
setiap
analisis.
Konsekuensinya, kategori normal diberikan kode nol, intermediet satu, dan rendah dua. Variabel yang sesuai dengan pengkodean ini adalah variabel hdl2.
98
Tabel 6.3 Pemilihan variabel rokok dan HDL untuk setiap skenario
Skenario pertama
Variabel bebas
Variabel terikat
Rokok 1
HDL1 Rendah =0 Intermediet = 1 Normal =2
Skenario keempat
Rokok2
HDL2 Normal = 0 Intermediet = 1 Rendah = 2
Bila Anda melakukan pemilihan variabel secara benar maka hasil analisis adalah sebagai berikut. Skenario pertama Test of Parallel Linesa Model Null Hypothesis General
-2 Log Likelihood 164,113 161,571
Chi-Square 2,542
df
Sig. 1
The null hypothesis states that the location parameters (slope coefficients) are the same across response categories. a. Link function: Logit.
Gambar 6.1
99
,111
Parameter Estimates
Threshold Location
[hdl1 = 0] [hdl1 = 1] rokok_ib
Estimate -5,904 -2,656 -,018
Std. Error ,533 ,323 ,002
Wald 122,622 67,554 105,554
df
Sig. ,000 ,000 ,000
1 1 1
95% Confidence Interval Lower Bound Upper Bound -6,949 -4,859 -3,290 -2,023 -,021 -,014
Link function: Logit.
Gambar 6.2 Skenario kedua Test of Parallel Linesa Model Null Hypothesis General
-2 Log Likelihood 164,113 161,571
Chi-Square
df
2,542
Sig. 1
,111
The null hypothesis states that the location parameters (slope coefficients) are the same across response categories. a. Link function: Logit.
Gambar 6.3 Parameter Estimates
Threshold Location
[hdl2 = ,00] [hdl2 = 1,00] rokok_ib
Estimate 2,656 5,904 ,018
Std. Error ,323 ,533 ,002
Wald 67,554 122,622 105,554
df 1 1 1
Sig. ,000 ,000 ,000
95% Confidence Interval Lower Bound Upper Bound 2,023 3,290 4,859 6,949 ,014 ,021
Link function: Logit.
Gambar 6.4 2) Asumsi proporsional odds rasio Asumsi proporsional odds rasio untuk setiap skenario semestinya memberikan kesimpulan yang sama. Hal ini memang terbukti dengan analisis parallel lines untuk setiap skenario yang memberikan hasil yang sama, yaitu p=0,111 (Gambar 6.1, dan 6.3). Karena nilai p lebih besar dari 0,05, asumsi terpenuhi.2,5
100
3) Persamaan regresi ordinal Persamaan regresi ordinal untuk variabel terikat tiga kategori adalah: 2,5
y1 a1 ( 1 X 1 ) y 2 a 2 (1 X 1 ) Berdasarkan Gambar 6.2, dan 6.4, kita dapat membuat persamaan untuk setiap skenario (Tabel 6.4). Tabel 6.4 Persamaan untuk skenario pertama dan kedua Skenario
Persamaan
Pertama
y1 a1 ( 1 X 1 ) 5,904 (0,018rokok ) y 2 a 2 ( 1 X 1 ) 2,656 (0,018rokok ) y1= logit HDL rendah y2= logit HDL rendah + intermediet
Kedua
y1 a1 ( 1 X 1 ) 2,656 (0,018rokok ) y 2 a 2 ( 1 X 1 ) 5,904 (0,018rokok ) y1 = logit HDL normal y2 = logit HDL normal + intermediet
4) Koefisien variabel rokok Koefisien untuk masing-masing variabel adalah negatif kali koefisien yang tercantum pada keluaran.
2
Bila pada keluaran
tercantum B maka koefisien variabel tersebut adalah –B. Demikian juga sebaliknya (Tabel 6.5).
101
Tabel 5.5 Koefisien yang tercantum pada keluaran serta koefisien sebenarya untuk masing-masing skenario Skenario
Koefisien yang tercantum pada persamaan
Koefisien
Pertama
y1 5,904 (0,018rokok )
0,018
y2 2,656 (0,018rokok ) Koefisien pada persamaan = -0,018
y1 2,656 (0,018rokok )
Kedua
-0,018
y2 5,904 (0,018rokok ) Koefisien pada persamaan = 0,018 5) OR variabel rokok Nilai OR adalah eksponensial dari koefisien (B). Secara matematis, OR = exp(B).2,5 Kita telah mengetahui koefisien rokok untuk masing-masing skenario (Tabel 6.5). Dengan demikian, kita dapat menghitung niali OR untuk masing-masing skenario (Tabel 6.6). Tabel 6.6 Nilai odds rasio serta maknanya untuk setiap skenario Skenario
Koefisien
OR
Makna
Pertama
0,018
Exp (0,018) = 1,018
Odds (kemungkinan) setiap peningkatan satu unit IB untuk mempunyai HDL yang lebih rendah meningkat 1,018 kali.
Kedua
-0,018
Exp (-0,018) =0,982
Odds (kemungkinan) setiap peningkatan satu unit IB untuk mempunyai HDL yang lebih baik menurun 0,982 kali.
102
Dibandingkan subjek dengan IB sebesar x, subjek dengan IB x+1 mempunyai kemungkinan mengalami HDL yang lebih buruk sebanyak 1,018 kali. Artinya, dibandingkan subjek dengan IB 100, subjek dengan IB 101 mempunyai kemungkinan mengalami
HDL
yang
lebih
buruk
sebanyak
1,018
kali.
Dibandingkan subjek dengan IB 200, subjek dengan IB 101 mempunyai kemungkinan mengalami HDL yang lebih buruk sebanyak 1,018 kali. Dibandingkan subjek dengan IB 150, subjek dengan IB 151 mempunyai kemungkinan mengalami HDL yang lebih buruk sebanyak 1,018 kali. Dibandingkan subjek dengan IB sebesar x, subjek dengan IB x+1 mempunyai kemungkinan mengalami HDL yang lebih baik sebanyak 0,982 kali. Artinya, dibandingkan subjek dengan IB sebesar 400, subjek dengan 401 mempunyai kemungkinan mengalami
HDL
yang
lebih
baik
sebanyak
0,982
kali.
Dibandingkan subjek dengan IB sebesar 300, subjek dengan IB 301 mempunyai kemungkinan mengalami HDL yang lebih baik sebanyak 0,982 kali. Dibandingkan subjek dengan IB sebesar 50, subjek dengan 51 mempunyai kemungkinan mengalami HDL yang lebih baik sebanyak 0,982 kali. Kita dapat mengganti perubahan unit sesuai dengan keinginan. Jika kita hendak melihat perubahan odds untuk setiap perubahan 50 unit maka kita harus mengalikan koefisien terlebih dahulu dengan angka 50. Selanjutnya, hasil perkalian dikonversi ke dalam OR (Tabel 6,7).
103
Tabel 6.7 Nilai odds rasio untuk setiap peningkatan 50 unit Indeks Brinkman dan maknanya untuk setiap skenario
Skenario
Koefisien
Koefisien untuk setiap peningkatan 50 unit
OR
Pertama
0,018
0,018 x 50 = 0,8885
Exp (0,8885) = 2,431
Kedua
-0,018
-0,018 x 50 = 0,8885
Exp (-0,885) =0,411
Dibandingkan subjek dengan IB sebesar x, subjek dengan IB x+50 mempunyai kemungkinan mengalami HDL yang lebih buruk sebanyak 2,431 kali. Artinya, dibandingkan subjek dengan IB 100, subjek dengan IB 150 mempunyai kemungkinan mengalami
HDL
yang
lebih
buruk
sebanyak
2,431
kali.
Dibandingkan subjek dengan IB 200, subjek dengan IB 250 mempunyai kemungkinan mengalami HDL yang lebih buruk sebanyak 2,431 kali. Dibandingkan subjek dengan IB 150, subjek dengan IB 200 mempunyai kemungkinan mengalami HDL yang lebih buruk sebanyak 2,431 kali. Dibandingkan subjek dengan IB sebesar x, subjek dengan IB x+1 mempunyai kemungkinan mengalami HDL yang lebih baik sebanyak 0,411 kali. Artinya, dibandingkan subjek dengan IB sebesar 400, subjek dengan 450 mempunyai kemungkinan mengalami
HDL
yang
lebih
baik
sebanyak
0,411
kali.
Dibandingkan subjek dengan IB sebesar 300, subjek dengan IB 350 mempunyai kemungkinan mengalami HDL yang lebih baik
104
sebanyak 0,411 kali. Dibandingkan subjek dengan IB sebesar 50, subjek dengan 100 mempunyai kemungkinan mengalami HDL yang lebih baik sebanyak 0,411 kali. 6) Probabilitas perokok dengan IB 100 untuk mengalami HDL rendah Logikanya, dengan menggunakan skenario manapun, probabilitas perokok dengan IB 100 untuk mengalami HDL rendah seharusnya
sama.
Tabel
6.8
membuktikan
hal
ini.
Nilai
probabilitas pada kedua skenario sama, yaitu 1,6%. Untuk skenario pertama, kita dapat langsung menghitung probabilitas mengalami HDL rendah karena terdapat salah satu persamaan yang menghitung logit HDL rendah (y1). Nilai logit dapat langsung dihitung sehingga nilai probabilitas juga dapat langsung diketahui dengan persamaan 1/(1+exp(-y)). Untuk
skenario
kedua,
kita
tidak
dapat
langsung
menghitung probabilitas mengalami HDL rendah karena tidak ada persamaan yang secara langsung menghitung logit HDL rendah. Pada kedua skenario ini, persamaan yang ada adalah logit normal dan logit normal + intermediet. Solusinya, kita dapat menghitung probabilitas HDL rendah dengan rumus 1 – probabilitas (normal + intermediet). Tabel 6.8 menyajikan bagaimana proses menghitung probabilitas perokok dengan IB 100 mengalami HDL rendah untuk setiap
skenario.
Perhatikan
bagaimana
menghitung antara skenario satu dan dua.
105
perbedaan
cara
Tabel 6.8 Probabilitas perokok untuk mengalami HDL rendah berdasarkan empat skenario Skenario
Logit perokok dengan
Probabilitas
IB 100 untuk mengalami HDL rendah Pertama
y1 5,904 (0,018rokok ) y1=logit HDL rendah
p
1 1 exp(4,127) p = 0,016
Rokok = 100
y1 5,904 (0,018 x100) y1 4,127 Kedua
y 2 5,904 (0,018rokok ) Rokok = 100 y2 = logit HDL normal + intermediet
y2 5,904 (0,018 x100) y2 4,127
Probabilitas rendah = 1 – (probabilitas normal + intermediet) p 1
1 1 exp(4,127)
p = 1-0,984 = 0,016
7) Probabilitas perokok dengan IB 400 untuk mengalami HDL normal Logikanya, dengan menggunakan skenario manapun, probabilitas mengalami HDL normal harusnya sama. Tabel 6.9 membuktikan hal ini. Nilai probabilitas pada semua skenario sama, yaitu 1,2%. Untuk skenario kedua, kita dapat langsung menghitung probabilitas karena pada skenario tersebut terdapat salah satu persamaan yang menghitung logit HDL normal (persamaan y1). Nilai logit dapat langsung dihitung sehingga nilai probabilitas juga dapat langsung diketahui dengan persamaan 1/(1+exp(-y)).
106
Untuk skenario pertama, kita tidak dapat langsung menghitung probabilitas karena tidak ada persamaan yang secara langsung
menghitung
logitnya.
Pada
kedua
skenario
ini,
persamaan yang ada adalah logit rendah dan logit rendah + intermediet. Solusinya, kita dapat menghitung probabilitas HDL normal dengan rumus 1 – probabilitas rendah + intermediet. Tabel 6.9 menyajikan bagaimana proses menghitung probabilitas perokok mengalami HDL normal untuk setiap skenario. Perhatikan bagaimana perbedaan cara menghitung antara skenario satu dan dua. Tabel 6.9 Probabilitas bukan perokok untuk mengalami HDL rendah + intermediet berdasarkan empat skenario Skenario
Logit bukan perokok dengan IB 400 untuk mengalami HDL normal
Pertama
y 2 2,656 (0,018rokok ) Probabilitas normal y2= logit HDL rendah + intermediet rokok = 400
y2 2,656 (0,018 x 400) y2 4,452 Kedua
y1 2,656 (0,018rokok ) y1 = logit HDL normal rokok = 400 y1 2,656 (0,018x400)
y 1 4 , 452
107
Probabilitas
= 1 – (probabilitas rendah + intermediet)
p 1
1 1 exp(4,452)
p = 1- 0,988 = 0,012 p
1 1 exp(4,452)
P = 0,012
108
Bab 7 Regresi Ordinal dengan Beberapa Variabel Bebas Tujuan Setelah membaca bab ini, pembaca diharapkan mampu:
-
menjelaskan koding variabel bebas kategorik,
-
menjelaskan variabel numerik dalam regresi ordinal,
-
membuat persamaan regresi ordinal,
-
menjelaskan asumsi proporsional odds rasio,
-
menjelaskan
prinsip
menghitung
odds
rasio
dan
interpretasinya,
-
menjelaskan interpretasi nilai p pada uji Wald,
-
menghitung probabilitas,
-
menghitung risiko relatif,
-
menjelaskan model fit,
-
menjelaskan koefisien determinan,
Kasus Suatu penelitian bertujuan untuk mengetahui hubungan antara usia dan perilaku merokok dengan HDL. Usia berskala numerik (tahun), rokok berskala kategorik (perokok dan bukan perokok), dan HDL berskala kategorik (rendah, intermediet, dan normal).
Peneliti
berkeinginan
untuk
membuktikan
bahwa
dibandingkan bukan perokok, perokok mempunyai risiko yang lebih besar untuk memiliki HDL yang lebih buruk. Selain itu, semakin usia bertambah, semakin berisiko untuk memiliki kadar HDL yang lebih buruk.
109
Pertanyaan 1) Bagaimanakah koding variabel rokok? 2) Bagaimanakah koding variabel HDL? 3) Lakukan analisis regresi ordinal dengan variabel bebas rokok dan usia. 4) Apakah asumsi proporsional odds rasio terpenuhi? 5) Apakah model fit? 6) Berapakah koefisien determinasi? 7) Tuliskanlah persamaan regresi ordinal. 8) Berapakah koefisien masing-masing variabel? 9) Berapakah OR masing-masing variabel? 10) Berapakah probabilitas HDL rendah pada subjek berusia 60 tahun dan perokok? 11) Berapakah probabilitas HDL rendah pada subjek berusia 90 tahun dan perokok? 12) Berapakah probabilitas HDL rendah + intermediet pada subjek berusia 60 tahun dan perokok? Jawaban 1) Bagaimanakah koding variabel rokok? Peneliti hendak membandingkan perokok terhadap bukan perokok. Pada default SPSS regresi ordinal, kode terbesar (last) c adalah pembanding. Dengan demikian, kodingnya adalah satu
untuk bukan perokok dan nol untuk perokok. Namun, SPSS akan mengingat perokok sebagai kode satu dan bukan perokok sebagai kode nol.
c
http://www-01.ibm.com/support/docview.wss?uid=swg21480146
110
2) Bagaimanakah koding variabel HDL? Pada default SPSS regresi ordinal, pengelompokkan variabel terikat mengikuti aturan ≤g vs. g, artinya kode lebih besar menjadi pembanding.2 Jika ada tiga kategori, penyederhanaan menjadi ≤0 vs. 0 dan ≤1 vs. 1. Karena peneliti hendak meneliti ke arah lebih buruk, koding untuk variabel HDL adalah nol untuk rendah, satu untuk intermediet, dan dua untuk normal. 3) Lakukan analisis regresi ordinal dengan variabel bebas rokok dan usia. Lakukan analisis sebagaimana telah dipelajari pada babbab sebelumnya pada file rokok_usia_hdl.sav. Jangan lupa, masukkan rokok ke dalam factors karena berskala kategorik. Masukkan usia ke dalam covariats karena berskala numerik. Pada kotak output, tambahkan pilihan test of parallel lines.5 Jika Anda melakukan prosedur secara benar, Anda akan mendapatkan hasil sebagai berikut. Model Fitting Information Model Intercept Only Final
-2 Log Likelihood 513,548 248,480
Chi-Square 265,068
Link function: Logit.
Gambar 7.1 Pseudo R-Square Cox and Snell Nagelkerke McFadden Link function: Logit.
Gambar 7.2
111
,609 ,687 ,431
df
Sig. 2
,000
Parameter Estimates
Threshold Location
[hdl = 0] [hdl = 1] usia [rokok=0] [rokok=1]
Estimate -12,287 -8,633 -,191 -,648 0a
Std. Error 1,068 ,809 ,018 ,299 .
Wald 132,452 113,933 116,596 4,698 .
df 1 1 1 1 0
Sig. ,000 ,000 ,000 ,030 .
95% Confidence Interval Lower Bound Upper Bound -14,380 -10,195 -10,218 -7,048 -,225 -,156 -1,234 -,062 . .
Link function: Logit. a. This parameter is set to zero because it is redundant.
Gambar 7.3 Test of Parallel Linesa Model Null Hypothesis General
-2 Log Likelihood 248,480 244,049
Chi-Square 4,432
df
Sig. 2
,109
The null hypothesis states that the location parameters (slope coefficients) are the same across response categories. a. Link function: Logit.
Gambar 7.4
4) Apakah asumsi proporsional odds rasio terpenuhi? Asumsi proporsional odds rasio diuji secara statistik dengan test of parallel line (Gambar 7.4). Nilai p pada uji tersebut adalah 0,109. Karena leih besar dari 0,05, asumsi proporsional terpenuhi. 2,5 5) Apakah model fit? Model dikatakan fit apabila model tersebut lebih baik daripada tanpa variabel bebas. Hal ini diketahui lewat informasi model fitting information (Gambar 7.1). Nilai p adalah