Skripsi September [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

MODEL REGRESI HURDLE NEGATIVE BINOMIAL PADA KASUS COVID-19 DI KABUPATEN GORONTALO



SKRIPSI Diajukan Sebagai Persyaratan Memperoleh Gelar Sarjana Statistika Pada Program Studi Statistika, Jurusan Matematika, Universitas Negeri Gorontalo



APRILYA MONARIES DATAU NIM. 413417020



PROGRAM STUDI STATISTIKA JURUSAN MATEMATIKA FAKULTAS ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI GORONTALO 2021



BAB I PENDAHULUAN 1.1 Latar Belakang Analisis



regresi



merupakan



analisis



statistika



yang



bertujuan



untuk



memodelkan hubungan antara variabel respon Y dengan variabel prediktor X. Apabila variabel respon Y berdistribusi Poisson, maka model regresi yang digunakan adalah regresi Poisson. Regresi Poisson didapatkan dari distribusi Poisson, yaitu suatu distribusi untuk peristiwa yang probabilitas kejadiannya kecil, dimana kejadiannya tergantung pada interval waktu tertentu atau di suatu daerah tertentu dengan hasil pengamatan berupa variabel diskrit dan antar variabel saling independen. Tingkat penyebaran kasus COVID-19 sangat cepat, sehingga dalam lima bulan sejak munculnya kasus positif COVID-19 di Indonesia sudah ada 100.000 kasus. Per 11 September 2020, jumlah kasus baru meningkat 3.737 kasus, dengan jumlah kumulatif sejak 2 Maret 2020 telah mencapai 210.940 kasus yang tersebar di 34 Provinsi di Indonesia. Hingga 18 Februari 2021, sebanyak 4.690 kasus COVID-19 telah terjadi di Gorontalo, di mana Kota Gorontalo memiliki 1.989 kasus yang menempati tempat pertama jumlah kasus positif tertinggi di wilayah Gorontalo. Jumlah kasus positif kedua tertinggi terdapat di Kabupaten Gorontalo sebanyak 1.290 kasus, Kabupaten Bone Bolango 551 kasus, Kabupaten Boalemo 326 kasus, Kabupaten Gorontalo Utara 289 kasus, Kabupaten Pohuwato 245 kasus (Sekretariat Gugus Tugas Percepatan Penanganan Covid-19, 2020). Khususnya di beberapa Kecamatan di Kabupaten Gorontalo terdapat 95.5% yang belum terkena kasus COVID-19. Dari karakteristik data tersebut, menunjukkan adanya peristiwa excess zeroes. Excess zeroes adalah kondisi ketika proporsi nilai nol pada data lebih besar dari nilai lainnya. Dalam Hal tersebut yaitu dari 393.107 penduduk di Kabupaten Gorontalo



1



hanya 1290 yang terkena kasus COVID-19. Adanya excess zeroes pada suatu kumpulan data dapat mengakibatkan terjadinya overdispersi, sehingga melanggar salah satu asumsi dari regresi Poisson. Adanya overdispersi dapat menyebabkan taksiran parameter yang diperoleh tidak efisien, walaupun cenderung tetap konsisten. Terdapat beberapa model regresi untuk memodelkan data dengan banyak observasi yang bernilai nol (excess zeroes) dan terjadi overdispersion salah satunya adalah model regresi Hurdle Negative Binomial. Model yang dikaji dalam penelitian ini difokuskan pada model regresi Hurdle Negative Binomial (HNB). Menurut Saffari, Adnan dan Greene (2012), kelebihan dari model regresi Hurdle Negative Binomial (HNB) yaitu dapat mengakomodasi semua observasi, baik yang bernilai nol maupun bulat nonnegatif dan bersifat fleksibel karena dapat digunakan pada kondisi overdispersion dan underdispersion. Model regresi Hurdle Negative Binomial (HNB) melibatkan variabel dependen berupa data count yang tersensor (Saffari, Adnan dan Greene, 2012). Pada beberapa kasus dengan tujuan tertentu perlu pembatasan atau penyensoran pada variabel dependen. Data tersensor terdiri dari beberapa jenis yaitu sensor kanan dan sensor kiri. Variabel dependen dikatakan tersensor kiri jika data tidak teramati ketika berada di bawah titik kritis tertentu dan tersensor kanan jika data tidak teramati ketika berada di atas titik kritis tertentu (Hilbe, 2011). Pemilihan titik sensor dapat ditentukan oleh peneliti berdasar pada tujuan penelitian dan dapat terjadi secara alamiah seperti beberapa nilai yang lebih dekat terhadap suatu nilai tertentu (Frone, 1997). Beberapa penelitian yang relevan terkait pemodelan regresi Hurdle yaitu Riza Yuli Rusdiana (2017) tentang pemodelan Hurdle Negative Binomial Dengan Variabel Dependen Tersensor Kanan Pada Kasus Tetanus. Pada Penelitian tersebut peneliti menggunakan Model Hurdle Negative Binomial jenis sensor kanan. Selanjutnya, Faidah dan Pontoh (2015) menerapkan regresi Hurdle Negative Binomial (HNB) pada kasus penyakit difteri di Provinsi Jawa Barat. Dan pada penelitian Rici Luciani Rahayu, dkk (2018) tentang Perbandingan Regresi Zero Inflated Negative Binomial



2



dan HNB dengan tujuan ingin memperoleh model regresi terbaik antara ZINB dan HNB. Berdasarkan uraian diatas, peneliti tertarik menggunakan Metode Regresi Hurdle Negative Binomial. Model ini dipilih karena model ini sering digunakan terhadap data cacah seperti jumlah kasus COVID-19. Penggunaan metode tersebut dimaksudkan untuk menentukan model yang dapat menggambarkan jumlah kasus COVID-19 di Kabupaten Gorontalo dengan baik.



1.2 Rumusan Masalah Berdasarkan uraian latar belakang, maka rumusan masalah yang akan dibahas dalam penelitian ini yaitu: 1. Bagaimana model Regresi Hurdle Negative Binomial terhadap jumlah kasus COVID-19 di Kabupaten Gorontalo? 2. Apa variabel yang berpengaruh signifikan terhadap jumlah kasus COVID-19 di Kabupaten Gorontalo menggunakan metode Regresi Hurdle Negative Binomial? 1.3 Tujuan Penelitian Adapun tujuan dari penelitian ini adalah sebagai berikut: 1. Membuat model Regresi Hurdle Negative Binomial terhadap jumlah kasus COVID-19 di Kabupaten Gorontalo. 2. Mengetahui variabel yang berpengaruh signifikan terhadap jumlah kasus COVID-19 di Kabupaten Gorontalo menggunakan metode Regresi Hurdle Negative Binomial.



3



1.4 Manfaat Penelitian Penelitian ini diharapkan dapat memberikan manfaat sebagai berikut : 1. Manfaat Teoritis Dengan adanya penelitian ini, peneliti berharap hasil dari penelitian dapat memperdalam pengetahuan pembaca mengenai pemodelan regresi Hurdle



Negative Binomial yang kemudian dapat dikembangkan oleh pembaca dalam berbagai bidang terutama bidang kesehatan. 2. Manfaat Praktis Manfaaat praktis yang diharapkan dalam penelitian ini adalah dapat dijadikan acuan bagi pemerintah dan pihak-pihak terkait dalam penentuan prioritas terhadap faktor-faktor signifikan COVID-19. Dan sebagai sarana informasi pendukung bagi masyarakat agar lebih mengetahui faktor-faktor signifikan terjadinya COVID-19.



4



BAB II LANDASAN TEORI 2.1 Kajian Teori 2.1.1



Distribusi Poisson Distribusi



Poisson



merupakan



distribusi



probabilitas



diskrit



yang



menyatakan peluang jumlah peristiwa yang terjadi pada periode waktu tertentu apabila rata-rata kerjadian tersebut diketahui dan dalam waktu yang saling bebas sejak kejadian terakhir. Distribusi Poisson merupakan model patokan (benchmark) bagi data cacahan. Distribusi peluang peubah acak Poisson Y, yang menyatakan banyaknya sukses yang terjadi dalam suatu selang waktu atau daerah tertentu, (Walpole, 1986). Fungsi peluang untuk data yang berdistribusi Poison bergantung pada parameter tunggal, yaitu rataan μ. Fungsi peluangnya adalah: f ( y ; μ )=



e− μ μ y untuk y=0,1,2, …dan μ>0 y!



(2.1)



Dalam distribusi Poisson, varians dan rataan bernilai sama dan dapat dituliskan sebagai berikut: E ( Y )=Var ( Y )=μ (2.2) Distribusi Poisson memiliki ciri - ciri sebagai berikut: 



Banyaknya percobaan yang terjadi dalam suatu selang waktu atau suatu daerah tertentu, tidak tergantung pada banyaknya hasil percobaan yang terjadi pada selang waktu atau daerah lain yang terpisah.







Peluang terjadinya satu hasil percobaan selama suatu selang wakt yang singkat sekali atau dalam suatu selang yang kecil. Sebanding dengan panjang



5



selang waktu tersebut atau besarnya daerah tersebut dan tidak tergantung pada banyak hasil percobaan yang terjadi diluar selang waktu dan daerah tertentu. 



Peluang bahwa lebih dari satu hasil percobaan akan terjadi dalam selang waktu yang singkat tersebut atau dalam daerah yang kecil tersebut diabaikan.



2.1.2



Regresi Poisson Regresi Poisson adalah model regresi yang dapat digunakan pada data yang



variabel responnya berdistribusi tidak normal dan berjenis diskrit, yaitu berdistribusi Poisson sebagai syarat utamanya. Distribusi Poisson memberikan suatu model yang realistis untuk berbagai macam fenomena acak selama nilai dari variabel acak Poisson berupa bilangan bulat non-negatif. Fungsi masa peluang dari distribusi Poisson diberikan pada persamaan di bawah ini: μ iy e−μ P ( y i ; μi ) = ,Y i =0,1,2 ,… , ∞ yi ! i



i



(2.3)



Pada model regresi Poisson, biasanya fungsi penghubung yang digunakan adalah fungsi penghubung log, karena rata–rata dari variabel responnya akan berbentuk fungsi eksponensial dan menjamin bahwa nilai variable yang ditaksir dari variabel responnya akan bernilai non-negatif. Fungsi Penghubung log berbentuk: g ( μi )=ln μ i=x Ti β (2.4)



2.1.3



Overdispersi Regresi Poisson dikatakan mengandung overdispersi apabila nilai



variansnya lebih besar dari nilai meannya. Overdispersi memiliki dampak yang



6



sama dengan pelanggaran asumsi homoskedastisitas dalam model regresi linear. Jika pada data diskrit terjadi pelanggaran asumsi homoskedastisitas dalam model regresi Poisson maka estimasi parameter koefisien regresinya tetap tidak efisien karena berdampak pada nilai standar error. Untuk mendeteksi ada atau tidaknya overdispersi pada variabel respon yang akan diteliti, salah satu cara yang dapat dilakukan adalah dengan melihat nilai dari The Variance Test yaitu sebagai berikut: n



VT =∑ i=1



n ( y i− ´y )2 ( y i− ´y )2 S2 S2 =(n−1) VT =∑ =(n−1) ´y y ´y y i=1



(2.5) Nilai ini sama dengan rasio varians terhadapa rata-rata (variance-to-mean ratio), dimana seringkali disebut sebagai disebut indeks disperse, dikalikan dengan n−1 , dimana n adalah ukuran sampel. Bila nilai indeks dispersi lebih dari 1 maka dapat dikatakan terjadi overdispersi. (Agresti, 2002). 2.1.4



Multikolinearitas Multikolinieritas menunjukkan terdapat hubungan linier (korelasi) antara



beberapa atau semua variabel independen dalam model regresi. Pada analisis regresi diharapkan tidak terdapat multikolinieritas, adanya korelasi dalam model regresi menyebabkan taksiran parameter regresi yang dihasilkan akan memiliki error yang sangat besar. Pendeteksian multikolinieritas dapat dilakukan menggunakan nilai Variance Inflation Factor (VIF) dapat dinyatakan sebagaimana persamaan (2.20) (Hocking, 1996). VIF j =



1 dengan j = 1,2, … , p 1−R 2j



(2.6) di mana R2j adalah koefisien determinasi dari X j sebagai variabel dependen dan X ⱼ∗¿¿ sebagai variabel independen. Nilai R2j berkisar antara 0 sampai dengan 1 sehingga nilai VIF akan naik seiring dengan kenaikan koefisien determinasi.



7



Nilai VIF yang lebih dari 10 merupakan bukti adanya multikolinieritas (Hocking, 1996). 2.1.5



Regresi Hurdle Negative Binomial Regresi Hurdle Negative Binomial (HNB) digunakan untuk variabel



dependen berupa data count, memiliki nilai nol dengan proporsi lebih besar dari nilai lainnya (excess zero) dan mengalami overdispersion (Desjardins, 2013). Kelebihan Hurdle bersifat fleksibel, dapat digunakan dalam kondisi overdispersion dan underdispersion. Model Hurdle menggunakan pendekatan dua bagian (two part model), yaitu bagian pertama untuk mengestimasi variabel dependen bernilai nol yang disebut hurdle model sedangkan bagian kedua mengestimasi variabel dependen yang bernilai bulat non-negatif disebut truncated model (Saffari, Adnan dan Greene, 2012). Misalkan Y i ( i=1,2, … , n ) merupakan variabel dependen berupa data count



( Y i=0 ,1 , 2 , … ), fungsi peluang dari model regresi HNB sebagai berikut (Saffari, Adnan dan Greene, 2012):



P ( Y i= y i ) =



{



π i ,∧untuk y i =0



(



1 κ



) μ κ (1+ μ κ ) ( 1−π ) 1 ( 1+ μ κ ) 1−( 1+ μ κ ) Γ ( y +1 ) Γ ( ) k Γ y i+



yi



i



−κ −1



i



i



i



i



−κ



−1



,∧untuk y i >0



i



(2.7) Nilai variabel dependen pada pengamatan muncul dalam dua keadaan yang terpisah. Keadaan pertama disebut zero state terjadi dengan peluang π i, sementara keadaan kedua disebut negative binomial state terjadi dengan peluang 1−π i , dengan 0< π i 0 dan κ adalah parameter dispersion yang tidak bergantung pada variabel independen dengan κ >0.



8



Diketahui bahwa π i dan μi bergantung pada vektor dari variabel independen yang dapat didefinisikan sebagai berikut: logit ( π i ) =log T i



π i ( 1+ e x δ )=e x



T i



πi π T =x i δ i =e x δ π i=( 1−π i) e x δ π i=e x δ −π i e x 1−π i 1−π i



( )



T i



T i



T i



T i



δ



δ



dengan demikian diperoleh: T i



ex δ π i= ( 2.8) 1+e x δ T i



dan untuk nilai μi didapatkan dari model log linier berikut: log ( μi ) =xTi β μi=e x



T i



β



(2.9) Model untuk zero hurdle dengan fungsi penghubung logit dinyatakan sebagi berikut: p



logit ( π i ) =δ^ 0 + ∑ x ij δ^ j( 2.10) j=1



dengan i=1 , 2, … , n dan j=1,2 ,… , p apabila disajikan dalam bentuk matriks, persamaan (2.10) dapat ditulis logit π 1 1 logit π 2 = 1 ⋮ logit π n 1



[ ][



x 11 x21 ⋮ ⋮ xn 1



… … ⋱ …



x1 p x2 p ⋮ x np



δ0 δ1 ⋮ δp



][ ]



Model untuk truncated negative binomial dengan fungsi penghubung log dinyatakan dinyatakan sebagai berikut:



9



p



log ( μi ) = ^β 0+ ∑ xij ^β j ,dengan i=1,2 ,… , n dan j=1,2 , … , p (2.11) j=1



Apabila disajikan dalam bentuk matriks, persamaan (2.11) dapat ditulis log μ1 1 log μ2 = 1 ⋮ log μ n 1



[ ][



x 11 x 21 ⋮ ⋮ xn 1



… … ⋱ …



x 1 p β0 x 2 p β1 ⋮ ⋮ x np β p



][ ]



Berdasarkan fungsi peluang y i dari persamaan (2.7) kemudian nilai π i dan μi disubtitusikan dari persamaan (2.8) dan (2.9), maka didapatkan fungsi peluang model regresi HNB sebagaimana persamaan (2.12)



P ( Y i= y i ) =



{



T i



ex δ ,∧untuk y i=0 1+ e x δ (2.12) g ,∧untuk y i> 0 −κ 1−( 1+ e x β κ ) T i



1 1+e x



T i



δ



T i



−1



dengan



(



g=g ( yi ; κ , β ) =



1 κ



) ( 1+ e 1 Γ ( y +1 ) Γ ( ) κ Γ yi +



T



xi β



−1



−κ − y i



κ)



T i



( ex β κ )



yi



, i=1 , 2, … , n



i



dimana variabel x Ti adalah vektor variabel independen dengan ukuran ( p+1 ) ×1 dan p adalah jumlah variabel independen, yang dinotasikan. Parameter β dan δ adalah vektor parameter koefisien dengan ukuran ( p+1 ) ×1, disajikan dalam bentuk matriks sebagai berikut: x i=[ 1 x 1 i x 2 i … x pi ] β=[ β 0 β 1 β 2 … β p ]



T



T



10



δ =[ δ 0 δ 1 δ 2 … δ p ] 2.1.6



T



Estimasi Parameter Regresi Hurdle Negative Binomial



Parameter model regresi HNB dapat diestimasi dengan metode Maximum Likelihood Estimation (MLE), yaitu metode estimasi yang memaksimumkan fungsi likelihood. Berdasarkan fungsi peluang untuk y i yang telah diketahui pada persamaan (2.12), maka fungsi likelihood untuk model regresi HNB dapat dibedakan menjadi dua yaitu untuk y i=0 dan y i >0. Fungsi likelihood model regresi HNB dapat dinyatakan sebagaimana persamaan (2.13) dan (2.14): untuk y i=0 n



L ( κ , δ , β )= ∏



i=1 y i =0



T i



ex δ 1+ e x



T i



δ



(2.13)



untuk y i >0



n



L ( κ , δ , β )= ∏ i=1 y i >0



1 1+ e x



T i



(



δ



1 κ



) κ e (1+ κ e ) ) 1 ( Γ ( y +1 ) Γ ( ) e +1 1−( 1+κ e ) κ Γ yi +



T



xi β



y



T



xi β



T x i β −κ



−1



T x i β −κ



−1



(2.14)



i



Selanjutnya membuat fungsi ln likelihood dari persamaan dinyatakan sebagaimana persamaan (2.15) dan (2.16): Untuk y i=0 l ( κ , δ , β )=ln L ( κ , δ , β )¿ ∑ [ ln e



xTi δ



−ln ( 1+e



x Ti δ



) ] (2.15)



y i =0



Untuk y i >0



11



l ( κ , δ , β )=ln L ( κ , δ , β )



[



(



T i



¿ ∑ −ln ( 1+ e x δ ) + ln Γ y i + y i =0



1 1 −ln Γ ( y i +1 ) −ln + y i ln ( e x κ κ



)



()



T i



β



(



) + y i ln ( κ ) −



1 + y i ln ( 1+ κ e x β )−ln κ



)



T i



Fungsi ln likelihood model regresi HNB diperoleh dari turunan pertama persamaan (2.17) yang merupakan gabungan dua fungsi l ( κ , δ , β )=ln L ( κ , δ , β ) n



¿ ∑ [ lne



T



xi δ



−ln ( 1+e



n



T



) ]+ ¿ ∑



xi δ



i=1 y i =0



i=1 y i >0



[



− ln ( 1+ e x



T i



δ



) +ln Γ



(



yi +



1 1 −ln Γ ( yi +1 ) −ln + y i ln ( e x κ κ



)



()



Estimator parameter model regresi HNB diperoleh dari turunan pertama persamaan (2.17) terhadap κ , δ dan β yang disama dengankan nol. Apabila hasil persamaan diperoleh dari turunan fungsi ln likelihood terhadap masingmasing parameter tidak closed form, maka dilakukan metode iterative Newton Raphson. Rumus umum untuk metode Newton Raphson sebagaimana persamaan (2.18) −1



θ( m+1 )=θ(m )−[ H ( θ( m) ) ] q ( θ (m )) (2.18) Dengan θ( m)= [ κ



δ



T



β]



q ( θ (m )) adalah syarat perlu dengan vektor yang elemen-elemennya berisi turunan pertama fungsi ln likelihood terhadap masing-masing parameter dan H ( θ(m ) ) adalah syarat cukup dengan matriks yang elemen-elemennya berisi turunan kedua fungsi ln likelihood terhadap parameter. Dalam notasi matriks dapat ditulis sebagai berikut:



12



T i



β



) + y i ln ( κ



q ( θ (m )) =



[



∂ l(κ , δ , β ) ∂κ



∂2l (κ , δ , β ) ∂ κ2 H ( θ(m ) )= 2 ∂ l (κ , δ , β ) ∂δ ∂ δ T



[



∂ l (κ , δ , β ) ∂ δT



∂ l (κ , δ , β ) ∂ βT



∂2l (κ , δ , β ) ∂δ∂κ ¿



]



∂2l (κ , δ , β ) ∂ β∂κ ∂2 l ( κ , δ , β ) ¿ ¿ ∂ β ∂ βT ¿



]



Iterasi akan berhenti jika terpenuhi kondisi konvergen, yaitu ‖θ (m+1 )−θ( m)‖≤ ε dimana ε adalah bilangan yang sangat kecil.



2.1.7



Pengujian Hipotesis Setelah mendapatkan model, untuk memeriksa peranan variabel-variabel



independen dalam model, perlu dilakukan pengujian terhadap parameter model ¿ dan β j , dengan j=1 ,2 , … , p). Pengujian terhadap parameter model dilakukan baik secara simultan maupun secara parsial. Pengujian parameter secara simultan dengan menggunakan uji Likelihood Ratio dan pengujian parameter secara parsial dilakukan menggunakan statistik uji t. 2.1.7.1 Pengujian Simultan Statistik uji G adalah uji Likelihood Ratio yang digunakan untuk mengetahui apakah variabel independen secara bersama-sama mempengaruhi variabel dependen secara signifikan. Hipotesis uji simultan sebagai berikut (Agresti, 2002): H 0 :δ 1 =…=δ p= β1=…=β p =0 H 1 : paling sedikit ada satu δ ≠ 0 atau β j ≠ 0 dimana j=1 ,2 , … , p Statistik uji G dinyatakan seperti persamaan (2.19): 13



G=−2 ln



[



L (κ , δ 0 , β0) L (κ , δ , β )



]



=−2 ( l ( κ , δ 0 , β 0 )−l ( κ , δ , β ) ) (2.19)



dimana l ( κ , δ 0 , β 0 ) adalah fungsi likelihood H 0 dan l ( κ , δ , β ) adalah fungsi ln likelihood dibawah populasi. Statistik uji G mengikuti sebaran chi square dengan derajat bebas v yaitu banyaknya parameter model di bawah populasi dikurangi banyaknya parameter di bawah H 0 . Daerah penolakan H 0 adalah jika G> χ 2( a ,v ) dan p-value < α yang berarti dapat disimpulkan bahwa minimal terdapat satu variabel independen yang mempengaruhi variabel dependen.



2.1.7.2 Pengujian Parsial Pengujian parameter regresi secara parsial dilakukan menggunakan statistik uji t, statistik uji ini sering digunakan untuk menguji signifikansi parameter regresi secara parsial pada masing-masing variabel independen. Pengujian parameter secara parsial untuk masing-masing bagian zero hurdle dan truncated negative binomial sebagai berikut (Hosmer dan Lemeshow, 2000): H 0 :δ j=0 H 1 : δ j ≠ 0 dengan j=1 ,2 , … , p Statistik uji t model zero hurdle sebagai berikut: t=



δ^ j (2.20) SE ( δ^ j )



dimana δ^ j adalah estimator dari δ j dan SE ( δ^ j ) yaitu standard error dari estimasi parameter δ^ j yang disebut sebagai matriks varian kovarian dari δ^ j yang diperoleh dari minus invers matriks Hessian. Hipotesis model truncated negative binomial



14



H 0 : β j=0 H 1 : β j ≠ 0 dengan j=1 ,2 , … , p Statistik uji t model truncated negative binomial sebagai berikut: t=



β^ j SE ( ^β j )



dimana ^β j adalah estimator dari β j dan SE ( ^β j ) yaitu standard error dari estimasi parameter ^β j yang disebut sebagai matriks varian kovarian dari ^β j yang diperoleh dari minus invers dari matriks Hessian. Kriteria pengujian H 0 ditolak jika



|t|>t



( a2 , n−1)



dengan t a dengan a adalah tingkat taraf nyata yang 2



digunakan dan n−1 adalah derajat bebas. 2.1.8



Coronavirus Disease 2019 (COVID-19) Coronavirus Disease 2019 ( COVID- 19) ialah penyakit menular yang



diakibatkan oleh Coronavirus tipe baru. Penyakit ini dimulai dengan munculnya permasalahan pneumonia yang tidak dikenal etiologinya di Wuhan, Cina pada akhir Desember 2019 (Li et al, 2020). Bersumber pada hasil penyelidikan epidemiologi, permasalahan tersebut diprediksi berhubungan dengan Pasar Seafood di Wuhan. Pada 7 Januari 2020, Pemerintah Cina setelah itu



mengumumkan



bahwa



pemicu



permasalahan



tersebut



merupakan



Coronavirus tipe baru yang setelah itu diberi nama SARS- CoV- 2( Severe Acute Respiratory Syndrome Coronavirus 2). Virus ini berasal dari famili yang sama dengan virus pemicu SARS serta MERS. Walaupun berasal dari famili yang sama, tetapi SARS- CoV- 2 lebih menular dibanding dengan SARS- CoV serta MERS- CoV( CDC Cina, 2020). Proses penularan yang amat cepat membuat WHO menetapkan COVID- 19 sebagai KKMMD/PHEIC pada 30 Januari 2020. Tingkat kematian kasar Bervariasi berdasarkan negara atau



15



wilayah, tergantung pada populasi yang terkena dampak, perkembangan wabah suatu negara dan ketersediaan pemeriksaan laboratorium. Indonesia mengumumkan kasus awal COVID-19 pada 2 Maret 2020 Hingga saat ini jumlahnya terus bertambah. Sampai pada tanggal 30 Juni 2020 Kementerian Kesehatan melaporkan 56.385 kasus konfirmasi COVID- 19 dengan 2.875 kasus meninggal (CFR 5, 1%) yang tersebar di 34 provinsi. Sebanyak 51,5% kasus terjadi pada pria. Kasus sangat banyak terjadi pada rentang umur 45-54 tahun serta paling sedikit terjadi pada umur 0- 5 tahun. Angka kematian paling tinggi ditemui pada penderita dengan umur 55-64 tahun. Orang dengan umur lanjut ataupun yang mempunyai penyakit bawaan dikenal lebih berisiko untuk menghadapi penyakit yang lebih parah. Umur lanjut pula diprediksi berhubungan dengan tingkat kematian. 2.1.8.1 Cara Penularan COVID-19 Coronavirus merupakan zoonosis (ditularkan antara hewan dan manusia). Resiko penularan paling tinggi diperoleh di hari- hari awal penyakit diakibatkan oleh konsentrasi virus pada sekret yang besar. Orang yang terinfeksi bisa langsung bisa menularkan hingga dengan 48 jam sebelum onset indikasi( presimptomatik) serta hingga dengan 14 hari setelah onset indikasi. Sebuah studi Du Z et. al, (2020) melaporkan bahwa 12,6% menunjukkan penularan presimptomatik. Penting untuk mengetahui periode presimptomatik karena memungkinkan virus menyebar melalui droplet atau kontak dengan benda yang terkontaminasi. Sebagai tambahan, bahwa terdapat kasus konfirmasi yang tidak bergejala (asimptomatik), meskipun risiko penularan sangat rendah akan tetapi masih ada kemungkinan kecil untuk terjadi penularan. Beberapa penularan virus lain seperti: a. Penyebaran virus melalui droplet Penularan virus Corona bisa terjadi melalui droplet saat seseorang batuk, bersin, bernyanyi, berbicara, hingga bernapas. Saat melakukan 16



hal-hal tersebut, udara yang keluar dari hidung dan mulut mengeluarkan partikel kecil atau aerosol dalam jarak dekat. b. Penyebaran virus melalui udara Setelah mendapat kritikan dari ratusan ilmuwan terkait penyebaran virus Corona melalui udara, akhirnya WHO pun mengakuinya. Organisasi tersebut mengakui adanya bukti bahwa virus Corona itu bisa menyebar melalui partikel-partikel kecil yang melayang di udara. c. Penyebaran virus melalui permukaan yang terkontaminasi Cara penularan virus Corona ini terjadi saat seseorang menyentuh permukaan yang mungkin telah terkontaminasi virus dari orang yang batuk atau bersin. Lalu virus itu berpindah ke hidung, mulut, atau mata



yang



disentuh



setelah



menyentuh



permukaan



yang



terkontaminasi tersebut. 2.1.8.2 Faktor-faktor yang Mempengaruhi COVID-19 1. Umur Menurut Escalera (2020) menyatakan bahwa faktor umur berisiko COVID 19 dikarenakan orang dengan usia lanjut ditambah dengan menderita penyakit-penyakit komorbid COVID 19 seperti hipertensi. Faktor umur erat kaitannya dengan COVID 19 karena orang yang lanjut usia adanya proses degeneratif anatomi dan fisiologi tubuh sehingga rentan terhadap penyakit, imunitas yang menurun, ditambah seseorang yang mengidap penyakit penyerta akan menyebabkan kondisi tubuhnya lemah sehingga mudah terinfeksi COVID 19. Selain itu faktor usia yang lanjut menyebabkan kelalaian dalam menjaga protokol COVID 19 sehingga meningkatkan risiko COVID 19. Juru bicara pemerintah untuk penanganan virus corona Achmad Yurianto mengatakan korban virus corona meninggal terbanyak berada di



17



rentang usia 45-65 tahun. Saat ini korban meninggal dunia di Indonesia sudah mencapai 49 dari 579 kasus positif. Berdasarkan pendapat para ahli di atas maka penulis menyimpulkan bahwa kemungkinan terbesar penularan akan terjadi di usia yang non produktif, yaitu usia lanjut yang di barengi dengan adanya komplikasi penyakit yang diderita. Penyakit yang sudah sejak awal di derita akan menurunkan imunitas tubuh sehingga dapat mempercepat penularan Covid 19. 2. Penduduk Lansia Sejauh ini, virus Corona terlihat lebih sering menyebabkan infeksi berat dan kematian pada orang lanjut usia (lansia) dibandingkan orang dewasa atau anak-anak. Kelompok lanjut usia sering dikaitkan dengan kelompok yang rentan terhadap berbagai penyakit oleh karena fungsi fisiologisnya berangsur-angsur akan berkurang termasuk sistem imum tubuh. WHO dan CDC melaporkan bahwa pada usia pra-lansia (50-59 tahun) angka kematian hampir 2 %, usia 60-69 tahun 4% terus naik menjadi 8 sampai 15 % pada usia diatas 70 tahun. Kematian paling banyak terjadi pada penderita COVID-19 yang berusia 80 tahun ke atas, dengan persentase mencapai 21,9%. Wakil Kepala Bidang Penelitian Fundamental Lembaga Biologi Molekular



Eijkman,



Herawati



Sudoyo



mengatakan



banyak



studi



membuktikan bahwa sistem imun sebagai perisai tubuh dari segala macam penyakit tidak sekuat ketika usia muda. Oleh karena itu, usia 45 sampai 65 tahun mudah terserang penyakit. Berdasarkan pendapat ahli tersebut maka penulis mendapat garis besar yang menyatakan bahwa lansia akan mudah terserang penyakit, untuk itulah penyebaran Virus Covid 19 akan mudah menyerang lansia. 3. Jenis Kelamin



18



Menurut Chen (2020) menyatakan bahwa laki-laki lebih berisiko COVID-19 dikarenakan faktor kromosom dan faktor hormon. Pada perempuan lebih terproteksi dari COVID-19 dibandingkan laki-laki karena memiliki kromosom x dan hormon seks seperti progesteron yang memainkan peranan penting dalam imunitas bawaan dan adaptif. Laki-laki biasanya karena tuntutan pekerjaan lebih sering keluar rumah dibandingkan perempuan sehingga rentan penyakit ini. Selain itu perempuan biasanya lebih memiliki tingkat pengetahuan lebih tinggi dibandingkan laki-laki terutama epidemiologi dan faktor risiko COVID 19. Direktur kantor Penelitian Kesehatan Wanita di National Institutes, Janine Clayton menyatakan bahwa faktor biologis, laki-laki dilahirkan dengan tingkat imunitas yang lebih rendah ketimbang perempuan. Berdasarkan pendapat para ahli tersebut maka penulis menyimpulkan bahwa terjangkitnya virus Covid 19 akan lebih rentan menyerang laki-laki lanjut usia karena ada perbedaan hormon tubuh antara laki-laki dan perempuan. Selain itu usia lanjut yang sudah tidak produktif dan terindikasi memiliki penyakit bawaan juga akan mudah terjangkit virus ini. Pencegahan yang dapat dilakukan oleh lansia dalam menghindari terpaparnya Covid 19 yaitu dengan cara mengikuti protocol kesehatan yang sudah ada. 4. Infeksi Nosokomial dari penderita dan staf Rumah Sakit Menurut Wang (2020) menyatakan bahwa infeksi nosokomial sangat berbahaya bagi penderita atau pasien lain yang dirawat dan juga orang sehat. WHO (2020) memberikan tata laksana pada pasien suspek COVID 19 baik yang ringan maupun penderita COVID 19 dengan tingkatan penyakit yang berat di RS diantaranya harus menerapkan protokol kesehatan yaitu pasien menggunakan masker, pasien yang COVID 19 dipisahkan dari pasien lain, serta pengaturan jarak 1 m, serta petugas RS diwajibkan menggunakan APD lengkap. Keluarga pasien sebaiknya disarankan tidak diperkenankan



19



menjenguk ke rumah sakit demi memutus infeksi nosokomial dan memutus rantai penularan COVID 19. Menurut Chairuddin, 2001 Infeksi Nosokomial disebut juga infeksi Rumah Sakit (hospital infection atau associated infection) adalah infeksi yang terjadi pada seseorang penderita yang sedang dirawat atau berobat jalan dirumah sakit dan waktu tidak sedang dalam masa tunas suatu penyakit menular. Dengan berdasar pada pendapat para ahli maka penulis menarik kesimpulan bahwa penyebaran Virus Covid 19 juga dapat terjadi lingkungan rumah sakit. Ada resiko pasien yang tidak mengidap Covid 19 dan para staff ikut terjangkit karena berada dalam satu lingkungan pengobatan yang sama meskipun tidak saling bersentuhan. Hal ini juga tidak terjadi hanya pada virus Covid 19 tetapi pada virus lainnya. 5. Penyakit Komorbid Hipertensi Menurut Zhang, et al (2020) menyatakan bahwa dari 140 pasien dengan COVID-19 dengan 37,9 % pasien COVID-19 dengan penyakit hipertensi. Selain itu dilaporkan pasien hipertensi sebanyak 30% diduga dengan berbagai riwayat penyakit infeksi.. Menurut Li (2020) menyatakan sebanyak 17,1% pasien dengan dengan riwayat penyakit infeksi salah satunya adalah hipertensi, sehingga hipertensi merupakan komorbid penyakit infeksi salah satunya COVID-19 diantara 1.527 pasien yang tersebar dirawat pada ICU dan non ICU. Hipertensi telah menjadi penyebab kematian yang utama dari 57,356 penduduk Amerika, atau lebih dari 300,000 dari 2.4 milyar total penduduk dunia pada tahun 2005. Selebihnya, kematian yang disebabkan oleh hipertensi meningkat sebanyak 25.2% dari tahun 1995 ke tahun 2005 (Aronow et al., 2011). Menurut penulis penyakit penyerta (komorbid) sangat berpengaruh pada percepatan penularan virus Covid 19. Hal ini karena imunitas pasien sudah 20



menurun ketika pasien tersebut mempunyai penyakit bawaan, sehinggahnya akan mudah di serang virus Covid 19. 6. Kepadatan Penduduk Meningkatnya jumlah penduduk akibat aktivitas ekonomi yang terus berkembang



mendorong



bertambahnya



daerah



permukiman



dan



menyebabkan naiknya tingkat kepadatan penduduk (Yusrina et al., 2018). Kepadatan penduduk memiliki andil dalam penyebaran COVID-19 di Indonesia, hal ini merujuk pada kenyataan bahwa kawasan perkotaan yang memiliki tingkat kepadatan penduduk tinggi dibandingkan daerah pinggiran akan menyebabkan transmisi penyakit lebih cepat dengan rantai penyebaran yang lebih kompak dan kompleks (Hardianto, 2020). Temuan lain berdasarkan penelitian mengenai hubungan kepadatan penduduk dengan epidemi yang dilakukan tahun 2018 adalah ada korelasi yang lemah antara kepadatan penduduk dengan kematian akibat wabah (Li et al, 2018) Lokasi pemukiman juga dapat menyebabkan terpaparnya COVID-19 makin meluas. Hal ini karena di setiap kegiatan sosial pasti tidak akan bisa dihindari akan ada kontak fisik baik di sengaja maupun tidak disengaja. Untuk itu berdasarkan pengamatan penulis dan didukung oleh gagasan para ahli di atas maka kemungkinan presentase penyebaran virus Covid 19 akan lebih besar terjadi di kota dibandingkan dengan di desa. Karena perkotaan adalah pusat transaksi terbesar sehingganya penduduknya jauh lebih besar dari pada di pedesaan. 7. Kontak Erat/Riwayat Perjalanan Orang yang tinggal atau bepergian di daerah di mana virus COVID-19 bersirkulasi sangat mungkin berisiko terinfeksi. Mereka yang terinfeksi adalah orang-orang yang dalam 14 hari sebelum muncul gejala melakukan perjalanan dari negara terjangkit, atau yang kontak erat, seperti anggota



21



keluarga, rekan kerja atau tenaga medis yang merawat pasien sebelum mereka tahu pasien tersebut terinfeksi COVID-19. Pusat Pengendalian dan Pencegahan Penyakit Amerika Serikat (CDC) memperbarui pedoman terkait kontak dekat dengan orang yang positif terinfeksi COVID-19. Menurut CDC durasi kontak dekat didefinisikan selama waktu kumulatif 15 menit atau lebih selama periode 24 jam. Makin lama durasi kontak, makin mungkin terjadi paparan. Selain itu masyarakat yang kemungkinan besar berpeluang terpapar virus COVID-19 ini adalah masyarakat yang melakukan kontak dengan pasien yang terjangkit COVID-19. Tidak tabu lagi banyak berita beredar bahwa perawat yang merawat pasien sering terjangkit virus COVID-19 meskipun sudah mematuhi protocol kesehatan yang telah di tetapkan.



22



2.1.9 No



Penelitian yang Relevan Judul Penelitian



Nama Peneliti



Tujuan



Variabel



Kesimpulan 



Variabel Dependen Tersensor Kanan Pada Kasus Tetanus Neonatorum Di Indonesia



model regresi CHNB



kasus tetanus



menggunakan metode



neonatorum di



maksimum likelihood Variabel Y (jumlah



tereleminasi



kasus tetanus



persamaan yang tidak



(tidak ada kasus



neonatorum di



closed form,sehingga



Riza Yuli



tetanus



setiap provinsi di



untuk menyelesaikan



Rusdiana



neonatorum) di



Indonesia, dan



estimasi parameter



Indonesia



variabel X (enam



digunakan metode



dengan



variabel dengan



iterasi Newton Rapshon.



menggunakan



skala rasio).



Hurdle Negative 1.



Diharapkan



suatu provinsi



Pemodelan Regresi Binomial Dengan



Estimasi parameter



menghasilkan







Setiap variabel



model HNB



independen memberikan



jenis sensor



pengaruh yang berbeda



kanan.



terhadap setiap masingmasing state.



kepadatan penduduk (X1),



Pemodelan Jumlah Kasus 2.



Untuk



persentase



menentukan



penduduk lansia



model yang



(X2), persentase



COVID-19 Di Indonesia



Nadhifan Humam



dapat



rumah tangga



Dengan Pendekatan



Fitrial , Akhmad



menggambarkan



dengan akses



Regresi Poisson Dan



Fatikhurrizqi



jumlah kasus



sanitasi tidak layak



COVID-19 di



(X3), dan



Indonesia



persentase angka



dengan baik..



buta huruf



Regresi Binomial Negatif



penduduk usia 15 tahun keatas (X4)



Berdasarkan nilai AIC, regresi Binomial Negatif lebih baik digunakan untuk memodelkan jumlah kasus COVID-19 di Indonesia dibandingkan regresi Poisson.Pada model regresi Binomial Negatif, variabel kepadatan penduduk dan persentase penduduk lansia berpengaruh positif dan signifikan terhadap jumlah kasus COVID-19 di Indonesia.



Model HNB sudah mampu



Perbandingan Regresi



mengendalikan nilai nol dan



Zero Inflated Negative Binomial dan Regresi 3.



Memperoleh



Hurdle Negative



Rini Luciani



model regresi



Binomial pada Data



Rahayu, dkk



terbaik antara



Overdispersi (Studi Kasus: Kejadian Difteri di Indonesia)



ZINB dan HNB.



overdispersi, demikian juga Variabel Y, X₁,



dengan model ZINB. Namun



X₂, X₃, X₄, X₅ dan



pada data kejadian difteri di



X₆



Indonesia model ZINB lebih tepat digunakan untuk mengendalikan nilai dan overdispersi pada data tersebut.



Penelitian ini memiliki relevansi dengan penelitian ke-1 tentang “Pemodelan Regresi Hurdle Negative Binomial Dengan Variabel Dependen Tersensor Kanan Pada Kasus Tetanus Neonatorum Di Indonesia” karena menggunakan metode regresi Hurdle sebagai metode yang dipakai dan pada penelitian ke-2 tentang “Pemodelan Jumlah Kasus COVID-19 Di Indonesia Dengan Pendekatan Regresi Poisson Dan Regresi Binomial Negatif’ karena menggunakan



studi



kasus



COVID-19



dan



penelitian



ke-3



tentang



“Perbandingan Regresi Zero Inflated Negative Binomial dan Regresi Hurdle Negative Binomial pada Data Overdispersi (Studi Kasus: Kejadian Difteri di Indonesia)” karena menggunakan metode Regresi Hurdle Negative Binomial.



BAB III METODE PENELITIAN 3.1 Waktu dan Tempat Penelitian 3.1.1



Waktu Penelitian Penelitian ini akan dilaksanakan dari bulan Maret 2021 sampai bulan Juni



2021. Tabel 3.1.1: Waktu Penelitian Waktu No



Kegiatan



Pengajuan 1.



Masalah dan Bimbingan Proposal



2.



Pengambilan Data



3.



Seminar Proposal



4.



Pengolahan Data



a.



Standarisasi Data



b. c. d. e.



Uji Multikolinearitas Overdispersi Pemodelan Regresi Poisson Penaksiran Parameter Model



Maret



April



Mei



Juni



Juli



2021



2021



2021



2021



2021



Regresi Poisson 5.



Interpretasi Hasil



6.



Seminar Hasil



7.



Skripsi



3.1.2



Tempat Penelitian



Penelitian ini dilakukan di Laboratorium Matematika dan Laboratorium Komputasi Statistika. 3.2 Populasi dan Sampel Populasi dalam penelitian ini adalah jumlah kasus COVID-19 di Kabupaten Gorontalo dan sampel yang diambil adalah populasi itu sendiri. 3.3 Teknik Pengambilan Sampel Pengambilan sampel dalam penelitian ini menggunakan metode sampling jenuh, yaitu metode yang menggunakan semua anggota populasi sebagai sampel. 3.4 Variabel Penelitian Dalam penelitian ini, peneliti menggunakan 2 variabel yaitu variabel bebas (X) dan variabel terikat (Y). Variabel dalam penelitian ini antara lain:



Tabel 3.2 Tabel Variabel Penelitian Variabel Y



Ket Jumlah Kasus COVID-19



X



X1 X2 X3 X4 X5



Jenis Kelamin Persentase Penduduk Lansia Kepadatan Penduduk Komorbid Kontak Erat/Riwayat Perjalanan



3.4.1



Definisi Konseptual Variabel



1) Jumlah Kasus COVID-19 : Penyakit menular yang disebabkan oleh virus corona. 2) Jenis Kelamin : Terjangkitnya virus Covid 19 akan lebih rentan menyerang laki-laki lanjut usia karena ada perbedaan hormon tubuh antara laki-laki dan perempuan. 3) Penduduk Lansia : orang yang telah berusia 60 tahun ke atas atau sering disebut sebagai penduduk dengan usia non-produktif 4) Kepadatan Penduduk : Penyebaran virus COVID-19 akan lebih besar terjadi di kota dibandingkan desa. Karena perkotaan adalah pusat transaksi terbesar sehingganya penduduknya jauh lebih besar dari pada di pedesaan 5) Komorbid : Penyakit penyerta (komorbid) sangat berpengaruh pada percepatan penularan virus COVID-19 karena imunitas pasien sudah menurun ketika pasien tersebut mempunyai penyakit bawaan 6) Kontak Erat : Masyarakat yang kemungkinan besar berpeluang terpapar COVID-19 adalah masyarakat yang memiliki riwayat kontak dengan kasus probable atau konfirmasi COVID-19. 3.4.2



Definisi Operasional Variabel



1) Jumlah Kasus COVID-19 adalah semua kasus COVID-19 yang ada di Kabupaten Gorontalo. 2) Jenis Kelamin adalah jumlah penduduk laki-laki dan perempuan yang termuat dalam Badan Pusat Statistik. 3) Persentase Penduduk Lansia adalah Perbandingan jumlah penduduk usia 60 tahun ke atas dengan jumlah seluruh penduduk yang termuat dalam Badan Pusat Statistik. 4) Kepadatan Penduduk adalah banyaknya jumlah penduduk untuk setiap kilometer persegi luas wilayah yang termuat dalam Badan Pusat Statistik.



5) Komorbid adalah Penyakit penyerta yang telah diderita dari sebelum menjadi PDP COVID-19 yang tercatat pada rekam medis. 6) Kontak Erat adalah data orang yang memiliki riwayat kontak dengan kasus probable atau konfirmasi COVID-19 yang termuat dalam Kemenkes. 3.5 Sumber Data Data yang digunakan dalam penelitian ini adalah data sekunder. Data tersebut diambil dari Dinas Kesehatan Kabupaten Gorontalo dan Badan Pusat Statistik (BPS).



3.6 Tahapan Penelitian Da ta



Analisis Deskriptif



Uji Multikolinearitas Ya Pemodelan Regresi Poisson Tidak Overdispersi



Ya Interpretasi Model Regresi Hurdle Negative Binomial



Kesimpulan



BAB IV HASIL DAN PEMBAHASAN 4.1 Deskripsi Penelitian Proses analisis data spasial pada jumlah kasus COVID-19 akan lebih mudah jika dilakukan penyajian dan pendeskripsian data terlebih dahulu. 4.1.1 Deskripsi Data Variabel Respon (Y) Jumlah kasus COVID-19 di Kabupaten Gorontalo dapat dideskripsikan sebagai berikut: Tabel 4.1 Deskripsi Variabel Respon (Y) No Pengukuran 1. Mean 2. Median 3. Min 4. Max 5. Standar Deviasi Sumber: Data diolah, 2021 (Output R)



Nilai 70.21 43.00 4.00 395.00 93.04394



Rata-rata dari jumlah kasus COVID-19 kabupaten Gorontalo adalah 70 kasus. Nilai varians dari variabel respon yaitu 93.04394. Hal ini menunjukkan varians jumlah kasus Covid-19 di Kabupaten Gorontalo sangat besar. Adapun jumlah angka tertinggi yaitu 395 dan angka terendah jumlah kasus COVID-19 kabupaten Gorontalo adalah 4 kasus. 4.1.2 Deskripsi Data Variabel Prediktor Berikut ini dideskripsikan variabel prediktor yang mempengaruhi jumlah kasus Covid-19 seperti yang telah dijelaskan pada pada BAB II dan III. Tabel 4.2 Deskripsi Variabel Respon (Y) No Variabel Mean Median Min Max Std 1. Jenis Kelamin (X1) 1.0237 1.0263 0.9899 1.0756 0.02574988 2. Persentase Penduduk Lansia 0.09084 0.09296 0.07492 0.10572 0.00842204 (X2)



3. 4. 5.



Kepadatan Penduduk (X3) 487.1 Komorbid (X4) 696.6 Kontak Erat/Riwayat 48.79 Perjalanan (X5) Sumber: Data diolah, 2021 (Output R)



278.0 598.0 29.00



30.0 213.0 4.00



2823.0 1890.0 235.00



712.2873 425.0072 58.57434



Nilai varians tertinggi dari beberapa variabel prediktor yang diduga mempengaruhi jumlah kasus Covid-19 di Kabupaten Gorontalo terdapat pada variabel X3 (Kepadatan Penduduk) yaitu sebesar 712.2873 dengan nilai minimum sebesar 30 dan nilai maksimum sebesar 2823. Artinya bahwa setiap jumlah kasus covid-19 memiliki kondisi tempat tinggal yang berbeda-beda. Semakin besar range data, maka semakin besar nilai varians. 4.2 Uji Asumsi Regresi 4.2.1 Pengujian Normalitas Dalam melakukan uji normalitas residual digunakan bantuan software r.studio menggunakan plot normal Q-Q . Hasil uji normalitas residual ditampilkan pada Gambar 4.1



Berdasarkan gambar tersebut dapat dilihat bahwa data (titik) menyebar disekitar garis diagonal dan tidak lebiH dari angka 2 serta mengikuti arah garis diagonal. Berdasarkan ketentuan yang ada bahwa data normal ketika titik-titik



tersebut mengikuti garis diagonal, sehingga dengan terpenuhinya kriteria tersebut maka dapat dikatakan bahwa model regresi memiliki data yang berdistribusi normal 4.2.2 Pengujian Asumsi Multikolinearitas Sebelum dilakukan pemodelan, dilakukan pemeriksaan multikolinearitas dengan menggunakan nilai Variance Inflation Factor (VIF). Apabila menunjukkan tidak terdapat variable yang memiliki nilai VIF lebih dari 10. Hal tersebut menunjukkan bahwa tidak terdapat korelasi antara variabel prediktor sehingga asumsi non-multikolinearitas terpenuhi dan kelima variabel prediktor dapat digunakan dalam pembentukan model. Tabel 4.3 Nilai VIF No Variabel Penelitian X1 1. X2 2. X3 3. X4 4. X5 5. Sumber: Data diolah, 2021 (Output R)



Nilai VIF 2.946 1.163 -0.670 -1.406 2.257



Pada tabel dapat dilihat semua Variabel memili nilai VIF yang kurang dari 10, hal ini artinya tidak terdapat multikolinearitas antar variabel prediktor.Berdasarkan hasil uji asumsi regresi diperoleh bahwa residual terdistribusi normal, identik, dan independen. Hal ini berarti semua asumsi untuk model terpenuhi. 4.3 Pemodelan Kasus COVID-19 di Kabupaten Gorontalo dengan Regresi Poisson Pemodelan dengan regresi Poisson digunakan untuk memodelkan jumlah kasus kumulatif COVID-19 dengan variabel adalah Jenis Kelamin (X1), Persentase Penduduk Lansia (X2), Kepadatan Penduduk (X3), Komorbid (X4) dan Kontak Erat/Riwayat Perjalanan (X5). Dengan bantuan perangkat R hasil estimasi parameter yang didapat adalah sebagai berikut.



Tabel 4.4. Hasil Estimasi Parameter Regresi Poisson Variabel Intercept



Estimasi β Standar Error β 7.18027 33.92827 X1 0.2838 78.74 X2 -0.01336 93.66 X3 -0.03681 94.74 X4 0.3353 75.86 X5 0.9742 14.94 Sumber: Data diolah, 2021 (Output R)



p-value 0.03746 0.01103 0.3947 0.5559 0.00554 0.03698



Berdasarkan tabel diatas, persamaan regresi Poisson yang terbentuk adalah: 𝜇 = exp (78.74+ 0.2838𝑋1 + 94.74−0.01336𝑋2 − 94.74−0.03681𝑋3 + 75.86+0.3353𝑋4+14.94+0.9742𝑋5) Hasil uji parsial menunjukkan dari lima variabel prediktor, terdapat tiga variabel yang berpengaruh signifikan terhadap jumlah kasus Covid-19 di Kabupaten Gorontalo yaitu jenis kelamin, komorbid dan kontak erat/riwayat perjalanan. Berdasarkan nilai koefisiennya, variabel jenis kelamin, komorbid dan kontak erat/riwayat perjalanan berpengaruh positif terhadap jumlah kasus Covid-19 di Kabupaten Gorontalo adapun variabel persentase penduduk lansia dan kepadatan penduduk berpengaruh negatif terhadap jumlah kasus Covid-19 di Kabupaten Gorontalo. Pengujian selanjutnya adalah pengujian overdispersi. Tabel 4.5 Pengujian Overdispersi No Deviance df 1. 11.873 17 Sumber: Data diolah, 2021 (Output R)



Deviance/df 5.094



Hasil dari pengujian overdispersi menunjukkan menunjukkan bahwa terjadi overdispersi pada model regresi Poisson yang terbentuk yang ditunjukkan dari nilai rasio antara deviance dengan derajat bebasnya yang lebih dari 1. 4.4 Pemodelan Kasus Covid-19 di Kabupaten Gorontalo dengan Regresi Binomial Negatif



Metode alternatif yang dapat digunakan untuk memodelkan data cacah yang mengalami overdispersi adalah regresi Binomial Negatif. Hasil estimasi parameter model regresi Binomial Negatif dengan bantuan perangkat R diperoleh persamaan sebagai berikut: Tabel 4.6. Hasil Estimasi Parameter Regresi Binomial Negatif Variabel Intercept



Estimasi β Standar Error β 7.18027 2.545 X1 2.628 2.195 X2 8.059 5.576 X3 2.795 6.673 X4 9.549 1.200 X5 1.595 9.252 Sumber: Data diolah, 2021 (Output R)



p-value -1.147 1.197 0.145 0.419 0.796 0.017



Berdasarkan tabel diatas, persamaan regresi Binomial Negatif yang terbentuk adalah: 𝜇 = exp (2.545x 2.628𝑋1 + 5.576𝑥 8.059𝑋2 + 6.673𝑥 2.795𝑋3 + 3,68 𝑥 1.200+9.549𝑋4+ 9.252 𝑥 1.595 𝑋5) Hasil uji parsial menunjukkan dari empat variabel prediktor, terdapat satu variabel yang berpengaruh signifikan terhadap jumlah kasus COVID-19 di Kabupaten Gorontalo yaitu kontak erat/riwayat perjalanan. Berdasarkan nilai koefisiennya, variabel kontak erat/riwayat perjalanan berpengaruh positif terhadap jumlah kasus Covid-19 di Kabupaten Gorontalo.



4.5 Pemilihan Model Terbaik Pemilihan model terbaik diantara regresi Poisson dengan regresi Binomial Negatif didasarkan pada nilai AIC. Model terbaik yang dipilih adalah model yang memiliki kriteria nilai AIC terkecil. Hasil nilai AIC kedua model regresi terlampir dalam tabel berikut:



Tabel 4.7. Nilai AIC Model AIC Regresi Poisson Regresi Binomial Negatif Sumber: Data diolah, 2021 (Output R)



Nilai AIC 282.5311 166.2342



Berdasarkan tabel diatas, model regresi Binomial Negatif lebih baik dalam memodelkan jumlah kasus Covid-19 di Kabupaten Gorontalo dibanding model regresi Poisson. Hal ini didasarkan pada nilai AIC pada model regresi Binomial Negatif lebih kecil dibandingkan model regresi Poisson



BAB V PENUTUP 5.1 Kesimpulan Dari hasil analisis dan pembahasan yang telah dilakukan dapat disimpulkan: Hasil



pemodelan



jumlah



kasus



Covid-19



di Kabupaten



Gorontalo



menggunakan regresi poisson ternyata memberikan hasil adanya pengaruh



overdispersi. Dalam menangani kasus tersebut dilakukan pemodelan menggunakan Generalized Poisson Regression (GPR) dan regresi binomial negatif. Model menggunakan GPR menghasilkan 3 variabel prediktor yang signifikan mempengaruhi jumlah kasus Covid-19 di Kabupaten Gorontalo yaitu jenis kelamin, komorbid dan kontak erat/riwayat perjalanan. Sedangkan model menggunakan regresi binomial negatif menghasilkan 1 variabel prediktor yang signifikan yaitu kontak erat/riwayat perjalanan (X5). Perbandingan model Regresi Poisson dan regresi binomial negatif untuk mengetahui model yang lebih baik dalam penanganan kasus overdispersi pada regresi poisson. Model Regresi Poisson menghasilkan nilai AIC sebesar 282.5311. Sedangkan model regresi binomial negatif mengha-silkan nilai AIC sebesar 166.2342. Maka model terbaik diperoleh dari model regresi binomial negatif karena menghasilkan nilai AIC terkecil. 5.2 Saran Adapun saran yang dapat diberikan oleh peneliti adalah: 1. Bagi pemerintah maupun masyarakat dapat melakukan upaya pencegahan dan penanggulanan agar pandemi covid-19 ini tidak semakin menyebar. 2. Bagi masyarakat hendaknya menghindari mobilitas atau kegiatan diluar rumah secara berlebihan untuk mencegah kontak erat/riwayat perjalanan yang menjadi faktor yang mempengaruhi jumlah covid-19 di Kabupaten Gorontalo. 3. Bagi peneliti dapat menganalisis faktor-faktor lain yang dapat mempengaruhi jumlah penyebaran covid-19 di Kabupaten Gorontalo sehingga hasil analisis dapat



lebih



efektif.



DAFTAR PUSTAKA Ratnasari, V., Purhadi, Zain, I. dan Suhartono. (2012). Estimasi Parameter dan Uji Signifikansi Model Probit Bivariat. Surabaya: ITS. Sugiyono, 2007. Metode Penelitian Kuantitatif Kualitatif dan R&D. Bandung: Alfabeta World Health Organization. (2020). Water, sanitation, hygiene, and waste management for the COVID-19 virus: interim guidance, 23 April 2020 (No.



WHO/2019-nCoV/IPC_WASH/2020.3).



Organization



World



Health



Cameron, A C dan Trivedi, P K. 1998. Regression Analysis of Count Data. Cambridge University Press: Cambridge Hinde, J. and C.G.B. Demetrio, 2007. Overdispersion: Models and Estimation, Brazilian Symposium of Probability and Statistics (13SINAPE). Caxambu, Minas Gerais, Brazil. Nadhiroh, I. M. (2009). Zero Inflated Negative Binomial Models in Small Area Estimation. Bogor: IPB Saffari, S. E., Robiah, A. dan Greene, W. (2012). Hurdle Negative Binomial Regression Model with Right Cencored Count Data. Malaysia: Journal of Statistics and Operations Research Transactions, Vol. 36(2): 181194. Hilbe, J. M. (2011). Negative Binomial Regression. New York: Cambridge University Press. Frone, M. R. (1997). Regression Models for Discrete and Limited Dependent Variables. New York: Research Methods Forum No. 2 (Summer 1997) Walpole, E. and Myers, R.H. 1986. Terjemahan R.K. Sembiring, Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan. Bandung: Penerbit ITB. Agresti, A. 2002. Categorical Data Analisis. Second Edition. New York : John Wiley and Sons, INC. Hocking, R. (1996). Methods and Application of Linear Models. New York: John Wiley and Sons, ltd. Desjardins, C. D. (2013). Dissertation: Evaluating the Performance of Two Competing Models Of School Suspension Under Simulation The Zero



Inflated Negative Binomial and the Negative Binomial Hurdle. San Fransisco California USA: Minnesota University. Hosmer, D.W. dan Lemeshow, S. (2000). Applied Logistic Regression Second Edition. New York : John Willey & Sons. WHO.2020. Coronavirus disease (COVID 19) pandemic.https://who.int. diakses tanggal 20 September 2020 Cen, Y; Chen, X; Shen, Y; Zhang, XH; Lei, Y; Xu, C; Jiang, WR; Xu, HT; Chen, Y; Zhu, J; Zhang, LL, Liu, YH. 2020. Risk Factors for disease progression in patients with mild to moderate Coronavirus disease 2019 a



multi



centre



observational.



Clinical



Microbiology



and



Infection.www.clinicalmicrobiologya ndinfection. Wang, D; Hu, B; Hu, C; Zhu, F; Liu, X; Zhang, J, et al. 2020. Clinical Characteristics of 138 Hospitapized Patients with 2019 Novel CoronaVIRUS-Infected Pneumonia in Wuhan, China.JAMA.Original Investigation. 2020;323(11):1061- 1069 Yusrina, farida N., Sari, M. I., Pratiwi, G. C. A. H., Hidayat, D. W., Jordan, E., & Febriyanti, D. (2018). Analisis Pola Permukiman Menggunakan Pendekatan Nearest Neighbour Untuk Kajian Manfaat Objek Wisata Di Kecamatan Prambanan Kabupaten Klaten. Jurnal Geografi, Edukasi Dan Lingkungan (JGEL), 2(2), 110–120. Hardianto, J. (2020). Korelasi Kepadatan Penduduk dan Penyebaran COVID19. Rujak Center For Urban Studies. Alam, S. O. (2020, Oktober 22). Berubah, Begini Kriteria Terbaru Kontak Dekat COVID-19 Menurut CDC. Retrieved Juni 13, 2021, from health.detik.com:



https://health.detik.com/berita-detikhealth/d-



5223635/berubah-begini-kriteria-terbaru-kontak-dekat-covid-19menurut-cdc Aria, P. (2020, april 28). Mengapa Laki-laki Lebih Rentan Tertular Virus Corona?



Retrieved



juni



13,



2021,



from



katadata.co.id:



https://katadata.co.id/pingitaria/berita/5ea948cbae8c3/mengapa-lakilaki-lebih-rentan-tertular-virus-corona Hardianto, J. (2020, April 4). Korelasi Kepadatan Penduduk dan Penyebaran COVID19.



Retrieved



juni



13,



2021,



from



rujak.org:



https://rujak.org/korelasi-kepadatan-penduduk-dan-penyebaran-covid19/ Indonesia, C. (2020, maret 24). Ahli Ungkap Faktor Pasien Usia 45-65 Rentan Wafat Kena Corona. Retrieved juni 13, 2021, from cnnindonesia.com: https://www.cnnindonesia.com/teknologi/20200324160126-199486545/ahli-ungkap-faktor-pasien-usia-45-65-rentan-wafat-kenacorona Indonesia, K. K. (2020, Oktober 13). 13,2 PERSEN PASIEN COVID-19 YANG Retrieved



MENINGGAL Juni



MEMILIKI 13,



2021,



PENYAKIT from



HIPERTENSI. kemkes.go.id:



https://www.kemkes.go.id/article/print/20101400002/13-2-persenpasien-covid-19-yang-meninggal-memiliki-penyakit-hipertensi.html



LAMPIRAN



Lampiran 1 DATA PENELITIAN Y 395 86 209 130 77 65 17 63 35 20 12 64 24 46 14 43 13 17 4



Perbandingan Laki2 0,989941646 0,991429446 1,006032895 1,003514938 1,028934457 0,994458128 1,034415584 0,99710412 1,039915745 1,010436539 1,027610094 1,002130813 1,026285273 1,025942857 1,049918334 1,027444983 1,075600356 1,045588524 1,073944483



Total Komorbid 1546 870 859 930 632 598



Kepadatan Penduduk 482 318 276 825 2823 1970



Kontak Erat 235 67 164 78 49 53



322 482 840 416 378 1890 887 689 524 443 351 365 213



188 436 334 366 132 281 103 278 90 132 30 87 104



13 52 28 14 8 47 19 38 10 29 7 12 4



Persentase Lansia 0,086931358 0,102405472 0,086105923 0,0893066 0,078683036 0,07849645 0,095276093 0,096361719 0,090608705 0,09411108 0,100541754 0,092961918 0,094544067 0,095504033 0,084258752 0,083022505 0,074917869 0,096157541 0,10572489



Lampiran 2 Output R. Deskripsi Variabel > getwd () [1] "E:/deskripsi" > library (readxl) > penelitian View(penelitian) > View(penelitian) > save.image("E:/deskripsi/zzz.RData") > dim(penelitian) [1] 19 6 > head (penelitian) # A tibble: 6 x 6 Y `Perbandingan Laki2` `Total Komorbid` `Kepadatan Penduduk` `Kontak Erat`











482



1 395



0.990



1546



235



2



86



0.991



870



318



67



3 209



1.01



859



276



164



4 130



1.00



930



825



78



5



77



1.03



632



2823



49



6



65



0.994



598



1970



53



# ... with 1 more variable: Persentase Lansia > str (penelitian) tibble [19 x 6] (S3: tbl_df/tbl/data.frame) $Y



: num [1:19] 395 86 209 130 77 65 17 63 35 20 ...



$ Perbandingan Laki2: num [1:19] 0.99 0.991 1.006 1.004 1.029 ... $ Total Komorbid



: num [1:19] 1546 870 859 930 632 ...



$ Kepadatan Penduduk: num [1:19] 482 318 276 825 2823 ... $ Kontak Erat



: num [1:19] 235 67 164 78 49 53 13 52 28 14 ...



$ Persentase Lansia : num [1:19] 0.0869 0.1024 0.0861 0.0893 0.0787 ...



> summary(penelitian) Y Penduduk



Perbandingan Laki2



Total Komorbid



Kepadatan



Min. : 4.00



Min. :0.9899



Min. : 213.0



Min. : 30.0



1st Qu.: 17.00



1st Qu.:1.0028



1st Qu.: 397.0



1st Qu.: 118.0



Median : 43.00



Median :1.0263



Median : 598.0



Median : 278.0



Mean : 70.21



Mean :1.0237



Mean : 696.6



Mean : 487.1



3rd Qu.: 71.00



3rd Qu.:1.0372



3rd Qu.: 864.5



3rd Qu.: 401.0



Max. :395.00



Max. :1.0756



Max. :1890.0



Max. :2823.0



Kontak Erat



Persentase Lansia



Min. : 4.00



Min. :0.07492



1st Qu.: 12.50



1st Qu.:0.08518



Median : 29.00



Median :0.09296



Mean : 48.79



Mean :0.09084



3rd Qu.: 52.50



3rd Qu.:0.09583



Max. :235.00



Max. :0.10572



Standar Deviasi > sd (penelitian$Y)



[1] 93.04394 > sd (penelitian$`Perbandingan Laki2`) [1] 0.02574988 > sd (penelitian$`Total Komorbid`) [1] 425.0072 > sd (penelitian$`Kepadatan Penduduk`) [1] 712.2873 > sd (penelitian$`Kontak Erat`) [1] 58.57434 > sd (penelitian$`Persentase Lansia`) [1] 0.00842204



Frekuensi Data > Hmisc::describe(penelitian$Y) penelitian$Y n missing distinct Info Mean Gmd .05 .10 .25 19 0 18 0.999 70.21 82.56 11.2 12.8 17.0 .50 .75 .90 .95 43.0 71.0 145.8 227.6 lowest : 4 12 13 14 17, highest: 77 86 130 209 395 Value 4 12 13 14 17 20 24 35 43 46 63 64 Frequency 1 1 1 1 2 1 1 1 1 1 1 1 Proportion 0.053 0.053 0.053 0.053 0.105 0.053 0.053 0.053 0.053 0.053 0.053 0.053 Value 65 77 86 130 209 395 Frequency 1 1 1 1 1 1 Proportion 0.053 0.053 0.053 0.053 0.053 0.053 > Hmisc::describe(penelitian$`Total Komorbid`) penelitian$`Total Komorbid` n missing distinct Info Mean Gmd .05 .10 .25 19 0 19 1 696.6 444.6 311.1 345.2 397.0



.50 598.0



.75 .90 .95 864.5 1053.2 1580.4



lowest : 213 322 351 365 378, highest: 870 887 930 1546 1890 Value 213 322 351 365 378 416 443 482 524 598 632 689 Frequency 1 1 1 1 1 1 1 1 1 1 1 1 Proportion 0.053 0.053 0.053 0.053 0.053 0.053 0.053 0.053 0.053 0.053 0.053 0.053 Value 840 859 870 887 930 1546 1890 Frequency 1 1 1 1 1 1 1 Proportion 0.053 0.053 0.053 0.053 0.053 0.053 0.053 > Hmisc::describe(penelitian$`Kepadatan Penduduk`) penelitian$`Kepadatan Penduduk` n missing distinct Info Mean Gmd .05 .10 .25 19 0 18 0.999 487.1 597.5 81.3 89.4 118.0 .50 .75 .90 .95 278.0 401.0 1054.0 2055.3 lowest : 30 87 90 103 104, highest: 436 482 825 1970 2823 Value 30 87 90 103 104 132 188 276 278 281 318 334 Frequency 1 1 1 1 1 2 1 1 1 1 1 1 Proportion 0.053 0.053 0.053 0.053 0.053 0.105 0.053 0.053 0.053 0.053 0.053 0.053 Value 366 436 482 825 1970 2823 Frequency 1 1 1 1 1 1 Proportion 0.053 0.053 0.053 0.053 0.053 0.053 > Hmisc::describe(penelitian$`Kontak Erat`) penelitian$`Kontak Erat` n missing distinct Info Mean Gmd .05 .10 .25 19 0 19 1 48.79 54.96 6.7 7.8 12.5 .50 .75 .90 .95 29.0 52.5 95.2 171.1 lowest : 4 7 8 10 12, highest: 53 67 78 164 235 Value 4 7 8 10 12 13 14 19 28 29 38 47 Frequency 1 1 1 1 1 1 1 1 1 1 1 1 Proportion 0.053 0.053 0.053 0.053 0.053 0.053 0.053 0.053 0.053 0.053 0.053 0.053



Value 49 52 53 67 78 164 235 Frequency 1 1 1 1 1 1 1 Proportion 0.053 0.053 0.053 0.053 0.053 0.053 0.053 > Hmisc::describe(penelitian$`Persentase Lansia`) penelitian$`Persentase Lansia` n missing distinct Info Mean Gmd .05 .10 .25 19 0 19 1 0.09084 0.009797 0.07814 0.07865 0.08518 .50 .75 .90 .95 0.09296 0.09583 0.10091 0.10274 lowest : 0.07491787 0.07849645 0.07868304 0.08302251 0.08425875 highest: 0.09615754 0.09636172 0.10054175 0.10240547 0.10572489 Histogram hist(penelitian$Y)



hist(penelitian$`Perbandingan Laki2`)



hist(penelitian$`Total Komorbid`)



hist(penelitian$`Kepadatan Penduduk`)



> hist(penelitian$`Kontak Erat`)



> hist(penelitian$`Persentase Lansia`)



Lampiran 3 Output R. Uji Pemodelan Regresi Poisson > library(readxl) > View(covidgto) > View(covidgto) > covidgto=data.frame(covidgto) > y=covidgto$Y > x1=covidgto$x1 > regresi=lm (y~x1) > regresi Call: lm(formula = y ~ x1) Coefficients: (Intercept) x1 2174 -2055 > summary(regresi) Call: lm(formula = y ~ x1) Residuals: Min 1Q Median 3Q Max -77.51 -50.40 -19.55 17.89 255.36 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2174.4 738.1 2.946 0.00903 ** x1 -2055.5 720.8 -2.852 0.01103 * --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 78.74 on 17 degrees of freedom Multiple R-squared: 0.3236, Adjusted R-squared: 0.2838 F-statistic: 8.133 on 1 and 17 DF, p-value: 0.01103



> x2=covidgto$x2 > x3=covidgto$x3 > x4=covidgto$x4 > x5=covidgto$x5 > regresi2=lm (y~x2) > regresi2 Call: lm(formula = y ~ x2) Coefficients: (Intercept) x2 278.2 -2289.2 > summary (regresi2) Call: lm(formula = y ~ x2) Residuals: Min 1Q Median 3Q Max -93.654 -41.875 -33.462 2.043 315.847 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 278.2 239.1 1.163 0.261 x2 -2289.2 2621.3 -0.873 0.395 Residual standard error: 93.66 on 17 degrees of freedom Multiple R-squared: 0.04294, Adjusted R-squared: -0.01336 F-statistic: 0.7626 on 1 and 17 DF, p-value: 0.3947



> regresi3=lm (y~x3) > regresi3 Call: lm(formula = y ~ x3) Coefficients: (Intercept) x3 61.03539 0.01884 > summary (regresi3) Call: lm(formula = y ~ x3) Residuals: Min 1Q Median 3Q Max -58.99 -47.75 -33.14 -4.29 324.89 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 61.03539 26.56344 2.298 0.0345 * x3 0.01884 0.03135 0.601 0.5559 --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 94.74 on 17 degrees of freedom Multiple R-squared: 0.02079, Adjusted R-squared: -0.03681 F-statistic: 0.361 on 1 and 17 DF, p-value: 0.5559



> regresi4=lm (y~x4) > regresi4 Call: lm(formula = y ~ x4) Coefficients: (Intercept) x4 -22.8267 0.1336 > summary (regresi4) Call: lm(formula = y ~ x4) Residuals: Min 1Q Median 3Q Max -165.607 -19.429 -7.373 11.685 211.338 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -22.82669 34.08323 -0.670 0.51202 x4 0.13356 0.04207 3.175 0.00554 ** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 75.86 on 17 degrees of freedom Multiple R-squared: 0.3722, Adjusted R-squared: 0.3353 F-statistic: 10.08 on 1 and 17 DF, p-value: 0.00554



> regresi5=lm (y~x5)



> regresi5 Call: lm(formula = y ~ x5) Coefficients: (Intercept) x5 -6.342 1.569 > summary(regresi5) Call: lm(formula = y ~ x5) Residuals: Min 1Q Median 3Q Max -41.979 -5.342 3.840 5.220 32.620 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -6.3416 4.5097 -1.406 0.178 x5 1.5690 0.0601 26.108 3.7e-15 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 14.94 on 17 degrees of freedom Multiple R-squared: 0.9757, Adjusted R-squared: 0.9742 F-statistic: 681.6 on 1 and 17 DF, p-value: 0,03698



> x=covidgto$x1+covidgto$x2+covidgto$x3+covidgto$x4+covidgto$x5 > regresi=lm (y~x) > regresi Call: lm(formula = y ~ x) Coefficients: (Intercept) x 7.1803 0.0511 > summary(regresi) Call: lm(formula = y ~ x) Residuals: Min 1Q Median 3Q Max -109.274 -30.781 -16.961 5.552 272.137 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 7.18027 33.92827 0.212 0.8349 x 0.05110 0.02264 2.257 0.0375 * --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 83.98 on 17 degrees of freedom Multiple R-squared: 0.2306, Adjusted R-squared: 0.1853 F-statistic: 5.094 on 1 and 17 DF, p-value: 0.03746



Durbin-Watson test data: regresi DW = 1.0155, p-value = 0.00635 alternative hypothesis: true autocorrelation is greater than 0 bptest(regresi, studentize = FALSE) Breusch-Pagan test data: regresi BP = 11.873, df = 1, p-value = 0.0005694



Lampiran 4 Pemodelan Kasus dengan Regresi Binomial Negatif > NegBinBetaBinreg=lm(y~x1+x2+x3+x4+x5) > NegBinBetaBinreg Call: lm(formula = y ~ x1 + x2 + x3 + x4 + x5) Coefficients: (Intercept) x1 x2 x3 x4 -2.919e+02 2.628e+02 8.059e+01 2.795e-03



x5 9.549e-03



> summary (NegBinBetaBinreg) Call: lm(formula = y ~ x1 + x2 + x3 + x4 + x5) Residuals: Min 1Q Median 3Q Max -40.871 -6.663 0.151 6.260 28.930 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -2.919e+02 2.545e+02 -1.147 0.272 x1 2.628e+02 2.195e+02 1.197 0.253 x2 8.059e+01 5.576e+02 0.145 0.887 x3 2.795e-03 6.673e-03 0.419 0.682 x4 9.549e-03 1.200e-02 0.796 0.441 x5 1.595e+00 9.252e-02 17.236 2.46e-10 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 16.07 on 13 degrees of freedom Multiple R-squared: 0.9785, Adjusted R-squared: 0.9702 F-statistic: 118.1 on 5 and 13 DF, p-value: 2.313e-10



1.595e+00



Lampiran 5 PEMILIHAN MODEL TERBAIK library (regresi) library (car) library (lmtest) library (spdep) library (classInt) library (AICcmodavg) library (PoissonBinomial) library (NegBinBetaBinreg) > AIC (PoissonBinomial) [1] 282.5311 > AIC (NegBinBetaBinreg) [1] 166.2342