Handout Analisis Regresi PDF [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

HANDOUT



ANALISIS REGRESI



Kismiantini



NIP. 19790816 200112 2 001 JURUSAN PENDIDIKAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI YOGYAKARTA 2010



1



2



Analisis Regresi dan Analisis Korelasi Analisis Regresi A Analisis li i Korelasi K l i Model Regresi Linear Sederhana



• Apa itu analisis regresi? • Apa bedanya dengan korelasi? Analisis Regresi Î Analisis statistika yang memanfaatkan hubungan antara dua atau lebih peubah kuantitatif sehingga salah satu p peubah dapat p diramalkan dari peubah p lainnya. y Analisis Korelasi Î Analisis statistika yyang g membahas tentang g derajat (kekuatan) hubungan antara peubah-peubah.



3



Korelasi



4



Yi = β 0 + β1 X i + ε i



Korelasi



i = 1, 2, …, n



Yi adalah nilai peubah tak bebas dalam pengamatan ke-i β0 dan d β1 adalah d l h parameter t Xi adalah konstanta yang diketahui, yaitu nilai peubah bebas dari pengamatan ke-i εi adalah galat yang bersifat acak dengan rataan E[εi]=0 dan ragam Var [εi]=σ2; εi dan εj tidak berkorelasi sehingga peragam/kovariansi ,j ; i ≠ j σ {{εi, εj} =0 untuk semua i,j



ε i ~ N (0, σ 2 ) iid



Sehingga :



E[Yi ] = β 0 + β1 X i



5



Model regresi linear sederhana • Model regresi diatas dikatakan sederhana, linear dalam parameter, dan linear dalam peubah bebas. • Dikatakan Dik t k “sederhana” “ d h ” karena k h hanya ada d satu t peubah b h bebas. • Dikatakan “linear linear dalam parameter parameter” karena tidak ada parameter yang muncul sebagai suatu eksponen atau dikalikan atau dibagi oleh parameter lain. • Dikatakan Dik t k “linear “li dalam d l peubah b h bebas” b b ” karena k peubah dalam model tersebut berpangkat satu. • Model yang linear dalam parameter dan linear dalam peubah bebas juga dinamakan model ordo-pertama.



6



Plot Data! NEVER skip this step! The data may not even be linear and a different model may be more appropriate.



7



8



9



10



ei (sisaan ( i kke-i) i) adalah d l hb beda d antara t nilai il i amatan t Yi dengan d nilai il i d dugaannya Yˆi



Persamaan regresi linear dugaan :



Yˆi = 13,82 + 48,60 X i



Yˆ = 13,82 + 48,60 X



11



12



• Pendugaan g terhadap p koefisien regresi: g Bagaimana mendapatkan b0 dan b1? • Metode kuadrat terkecil, terkecil yaitu dengan meminimumkan jumlah kuadrat galat :



Æ b0 penduga bagi β0 dan b1 penduga bagi β1 X Y ∑ X Y − ∑ n∑ = ( X) ∑X − ∑ i



i



i i



n



∑ε i =1



n



2 i



n



= ∑ (Yi − E (Yi )) = ∑ (Yi − (β 0 + β1 X i )) = L i =1



2



i =1



2



b1



b0 = n ∂L = −2∑ (Yi − (β 0 + β1 X i )) = 0 ∂β 0 i =1 n ∂L = −2∑ (Yi − (β 0 + β1 X i ))X i = 0 ∂β1 i =1



2



2 i



i



Metode Kuadrat Terkecil



n



1 (∑ Yi − b1 ∑ X i ) = Y − b1 X n



Bagaimana Pengujian terhadap model regresi ?? • parsial (per koefisien) Æ uji-t • bersama Æ uji-F (Anava) g menilai kesesuaian model ?? Bagaimana R2 (Koef. Determinasi: % keragaman Y yang mampu dijelaskan oleh X)



13



M k dugaan Makna d g k fi i regresi koefisien g i Misalkan ingin mengetahui hubungan jarak tempuh kendaraan mobil dalam k (X) dengan km d ti k t emisinya tingkat i i d l dalam ppm (Y). (Y)



14



Soall 1 i



1



2



3



4



5



6



7



8



9



10



Xi



5,5



4,8



4,7



3,9



4,5



6,2



6,0



5,2



4,7



4,3



• Plot data ternyata menunjukkan ada hubungan linear antara X dan Y • Dicobakan model linear Yi = β0 + β1Xi + εi, diperoleh persamaan regresi



Yi



3,1



2,3



3,0



1,9



2,5



3,7



3,4



2,6



2,8



1,6



i



11



12



13



14



15



16



17



18



19



20



• Apa makna b0 dan b1 pada konteks ini ? Makna dari b1 yaitu rata-rata emisi meningkat 5,47 ppm untuk setiap kenaikan jarak tempuh kendaraan mobil 1 km (atau kenaikan jarak tempuh kendaraan mobil 1 km akan meningkatkan rata-rata emisi yang dihasilkan mobil sebesar 5,47 ppm).



Xi



4,9



5,4



5,0



6,3



4,6



4,3



5,0



5,9



4,1



4,7



Yi



2,0



2,9



2,3



3,2



1,8



1,4



2,0



3,8



2,2



1,5



Yˆi = 364 + 5,47 X i



Makna dari b0 yaitu untuk mobil dengan jarak tempuh kendaraan mobil 0 km (mobil baru) tingkat emisi yang dihasilkan rata-rata sebesar 364 ppm.



∑X



i



= 100,0; ∑ Yi = 50,0; ∑ X = 509,12; ∑ Yi = 134,84; ∑ X iYi = 257,66 2 i



2



1. Apakah nilai mutu rata-rata (NMR) pada akhir tahun pertama (Y) dapat diramalkan dari nilai ujian masuk (X)? Bila jawaban ya, maka 2 Buatlah 2. l h diagram d pencar X d dan Y. 3. Tentukan persamaan regresi dugaannya beserta maknanya!



15



16



Soal 3



Soal 2 • Data berikut merupakan hasil penelitian tentang hubungan antara nilai ulangan Matematika (dalam skala nilai 10 sampai 100) dengan lama waktu belajar matematika (dalam jam selama seminggu) Nilai ulangan 95 100 100 80 70 55 50 75 55 60 65 95 matematika Lama waktu 18 18 19 17 14 5 6 10 13 4 12 10 belajar matematika a) Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y! b) Tentukan persamaan regresi dugaan dan berikan makna dugaan koefisien regresinya!



• Suatu penelitian telah dilakukan untuk mengetahui hubungan pengeluaran g untuk iklan (X dalam jjutaan rupiah) p ) dengan g antara p penerimaan melalui penjualan (Y dalam jutaan rupiah) pada perusahaan tertentu. Berikut ringkasan datanya :



n = 10, ∑ X i = 120, ∑ Yi = 500, ∑ X iYi = 6106, ∑ X i2 = 1470, ∑ Yi 2 = 25440 a) Tentukan persamaan regresi dugaan! Berikan maknanya. b) Bila pengeluaran untuk iklan sebesar 16 juta rupiah, rupiah berapakah penerimaan dari hasil penjualan?



17



Soal 4



Soal 5



Seorang guru matematika mencatat lama waktu (Y, dalam menit), i ) yang diambil di bil dari d i perjalanan j l k sekolah ke k l h ketika k ik meninggalkan rumah setelah jam 7 pagi (X, dalam menit) pada tujuh pagi hari yang tercatat. tercatat X Y



18



0 16



10 27



20 28



30 39



40 39



50 48



60 51



a) Plot data dengan diagram pencar. Berikan penjelasan dari plot tersebut. b) Tentukan persamaan regresi linear sederhana dari dan maknanya. c)) Gambarkan G b k garis i regresii dari d i b) pada d gambar b a). )



Tabel ini menunjukkan j skor tes p penalaran verbal,, X,, dan skor tes Inggris, Y, untuk setiap sampel acak dari 8 anak yang mengikuti kedua tes tersebut: Anak A B C D E F G H X 112 113 110 113 112 114 109 113 Y 69 65 75 70 70 75 68 76



a) Plot data dengan diagram pencar. Berikan penjelasan dari plot tersebut. a) Tentukan persamaan regresi linear dugaan dan berikan maknanya



MODEL REGRESI LINEAR SEDERHANA BERGALAT NORMAL



Yi = β 0 + β1 X i + ε i β0 dan d β1 adalah d l h parameter t Xi adalah konstanta yang diketahui nilainya εi adalah g galat y yang g menyebar y N(0,σ ( , 2) dan bebas satu sama lain



ASUMSI-ASUMSI DALAM ANALISIS REGRESI LINEAR SEDERHANA



Galat memiliki ragam yang konstan | Galat menyebar normal | Galat bersifat saling bebas |



ASUMSI-ASUMSI DALAM ANALISIS REGRESI LINEAR SEDERHANA 1



εi diduga oleh ei = Yi − Yi !!! S l Selanjutnya ei disebut d b sisaan atau nilai l dugaan d galat. l



ˆ



GALAT MEMILIKI RAGAM YANG KONSTAN



GALAT MENYEBAR NORMAL



Plot sisaan (ei) dengan nilai dugaan (Yˆi ) | Plot sisaan (ei) dengan peubah bebas (Xi) |



Plot peluang normal bagi sisaan yaitu ei versus hi



|



⎡ ⎛ i − 0,375 ⎞⎤ hi = KTG ⎢ z ⎜ ⎟⎥ ⎣ ⎝ n + 0,25 ⎠⎦



Bila sisaan-sisaan tidak membentuk suatu pola tertentu maka galat memiliki ragam yang konstan.



KTG = JKG /(n − p )



JKG = ∑ Yi 2 − b0 ∑ Yi − b1 ∑ X iYi



hi adalah nilai harapan di bawah asumsi kenormalan Sisaan diurutkan dari kecil ke besar



|



ei



Galat memiliki ragam konstan (tidak berpola)



2



Galat tidak memiliki ragam konstan (berpola)



Gambar disamping menunjukkan bahwa galat menyebar normal karena titik-titik (sisaan-sisaan) mengikuti arah garis diagonal.



3



4



hi



GALAT BERSIFAT SALING BEBAS



PERHATIKAN TABEL BERIKUT Ŷ = 10 + 2X, KTG = 7,5



Bila data tidak diamati secara bersamaan,melainkan dalam suatu urutan waktu maka buatlah plot sisaan (ei) terhadap waktu. | Tujuan adalah untuk melihat apakah ada korelasi antara suku galat dengan suku galat berikutnya. | Bila suku-suku suku suku galat saling bebas, bebas maka sisaan-sisaan sisaan sisaan berfluktuasi secara acak di sekitar nilai o. |



i



Xi



Yi



Ŷi



ei



1



30



73



70



3



2



20



50



50



0



3



60



128



130



-2



4



80



170



170



0



5



40



87



90



-3



6



50



108



110



-2 2



7



60



135



130



5



8



30



69



70



-1 1



9



70



148



150



-2



10



60



132



130



2



Urutan naik i



ei terurut



hi



1 2 3 4 5 6 7 8 9 10



-3 -2 -2 -2 -1 0 0 2 3 5



-4,24 -2,74 -1,79 -1,02 -0,33 0 33 0,33 1,02 1 79 1,79 2,74 4 24 4,24



Bila data diamati bersamaan, untuk melihat keacakan g galat p percobaan dibuat p plot antara nilai dugaan galat (ei) dengan nilai dugaan respons ( Ŷi ) Apabila berfluktuasi secara acak di sekitar nol maka dapat dikatakan bahwa galat saling bebas. 5



6



SOAL 1 Sebuah penelitian mengukur banyaknya gula yang terbentuk pada berbagai suhu. Data telah dikodekan sebagai berikut:



a) Tentukan persamaan garis regresi linear dugaan b) Dugalah banyaknya gula yang terbentuk bila suhunya 1,75. c) Perhatikan gambar berikut, apa yang dapat Anda simpulkan dari gambar tersebut? Residuals Versus the Fitted Values



Normal Probability Plot of the Residuals



(response is Y)



(response is Y) 99



1.0



95 90 80



Perc cent



Residual



0.5



0.0



70 60 50 40 30 20 10



-0.5



7



1



SOAL 2 Perhatikan gambar berikut :



|



Normal Probability Plot



Versus Fits



Scatterplot of Y vs X



(response is Y)



(response is Y)



90



20



99



80



95 90



10



70 Residual



Y 50



Percent



80



60



0



70 60 50 40 30 20



40



-10



10 5



30 -20



20 30



35



40



45 X



Gambar 1. 1 Plot X dan Y



50



55



1



40



50



60 Fitted Value



70



80



-30



-20



-10



0 Residual



10



20



30



Gambar 2. 2 Plot nilai dugaan vs sisaan Gambar 3. 3 Plot Peluang Normal



a)



Apa yang dapat Anda simpulkan dari gambar 1, 2 dan 3? Berikan penjelasannya. j l



b)



Berdasarkan Gambar 1, apa tanda dari koefisien korelasinya? Berikan penjelasannya. penjelasannya 9



5



8.0



8.5



9.0 Fitted Value



9.5



10.0



-1 5 -1.5



-1 0 -1.0



-0 5 -0.5



00 0.0 Residual



05 0.5



10 1.0



15 1.5



8



Selang Kepercayaan bagi β1 b1 − β1 ~ t( n − 2 ) s{b1}



INFERENSI DALAM ANALISIS REGRESI



Tingkat kepercayaan



⎛ ⎞ b − β1 P⎜⎜ − t α ;(n − 2 ) ≤ 1 ≤ t α ;(n − 2 ) ⎟⎟ = 1 − α 2 2 s{b1} ⎝ ⎠



1. Inferensi tentang β1 a Selang Kepercayaan bagi β1 a. b. Uji bagi β1 2 Inferensi 2. I f i tentang t t β0 a. Selang Kepercayaan bagi β0 b. Uji bagi β0



b1 ± t α 2



;( n− n 2)



s{b1} dengan s 2 {b1} =



KTG



∑ X i2 −



(∑ X )



2



i



n



Misalkan diperoleh selang kepercayaan 95% bagi β1 1,89 ,8 ≤ β1 ≤ 2,11 , Artinya diduga bahwa rata-rata banyaknya jam-orang (Y) naik sekitar antara 1,89 sampai 2,11 satuan untuk setiap kenaikan satu unit it ukuran k llott (X) (X). 1



Perhatikan simpangan total berikut :



Uji bagi β1=0 lawan β1≠0



Yi − Y = Yˆi − Y + Yi − Yˆi



Hipotesis H0 : β1=0 (Tidak ada hubungan linear antara X dan Y) g linear antara X dan Y) H1 : β1≠ 0 (Ada hubungan Sumber Keragaman



db



JK



KT



Regresi



1



JKR



KTR=JKR/1



Galat



n-2 n2



JKG



KTG=JKG/n-2 KTG JKG/n 2



Total



n-1



JKT



2



Jumlah kuadrat simpangan-simpangan tersebut :



∑ (Y − Y ) = ∑ (Yˆ − Y ) + ∑ (Y − Yˆ )



Fhit=KTR/KTG



2



2



Ftabel



Fhit



i



Fα(1,n-2)



2



i



JKT



=



i



+



JKR



i



JKG



JKT = ∑ Yi 2 − nY 2



Kriteria keputusan : H0 ditolak jika Fhit > Fα(1,n-2)



JKG = ∑ Yi 2 − b0 ∑ Yi − b1 ∑ X iYi



thit =



b1 s{b1}



Kriteria keputusan : H0 ditolak dit l k jika jik |thit|> | tα/2(n-2)



⎡ (∑ Yi ) = ⎢∑ Yi 2 − n ⎢⎣



2



3



Uji Satu Arah Bagi β1



⎡ X Y⎤ X Y − ∑ i∑ i ⎥ ⎤ ⎢∑ i i n ⎦ ⎥− ⎣ (∑ X i )2 ⎥⎦ 2 X − ∑ i n



2



JKR = JKT − JKG



4



Mi lk a S Misalkan Suatu t K Konstanta t t



A k h β1 positif Apakah itif atau t tidak tid tidak? k? k?



Hipotesis : H0 : β1 ≤ 0 H1 : β 1 > 0 Taraf nyata : α Statistik uji : t = b1/s{b1} Kriteria Keputusan : H0 ditolak jika thit > tα(n-2)



• Ujilah apakah β1 = a atau tidak? • Statistik St ti tik ujiji :



Apakah β1 negatif atau tidak? tidak?



t=



Hipotesis : H0 : β1 ≥ 0 H1 : β 1 < 0 Taraf nyata : α Statistik uji : t = b1/s{b1} Kriteria Keputusan : H0 ditolak jika thit < -tα(n-2)



b1 − β1 s{b1} Ganti β1 dengan a



5



6



Selang Kepercayaan bagi β0 b0 − β 0 ~ t( n − 2 ) s{b0 }



b0 ± t α 2



(n − 2 )



s{b0 }



Uji bagi β0=0 lawan β0≠0



⎛ ⎞ b − β0 P⎜⎜ − t α ;(n − 2 ) ≤ 0 ≤ t α ;(n − 2 ) ⎟⎟ = 1 − α 2 2 s{b0 } ⎝ ⎠



Hipotesis H0 : β0=0 H1 : β0≠ 0



⎡ ⎤ ⎢ ⎥ 2 1 X dengan s {b } = KTG ⎢ + ⎥ 0 2 ⎢n (∑ X i ) ⎥⎥ 2 X − ⎢ ∑ i n ⎣ ⎦ 2



Taraf Nyata : α Statistik Uji :



Misalkan diperoleh selang kepercayaan 90% bagi β0 5,34 ≤ β0 ≤ 14,66 Artinya diduga bahwa rataan banyaknya jam jam--orang sekitar antara 5,34 sampai 14 14,,66 satuan untuk ukuran lot sebesar 0. Selang g ini tidak mempunyai p y makna. makna. Selang g kepercayaan p y ini tidak selalu memberikan informasi yang bermanfaat



thit =



Kriteria keputusan : H0 ditolak jika |thit|> tα/2(n-2) 7



8



Soal 2



Soal a 1 Data berikut merupakan p hasil p penelitian tentang g hubungan g antara nilai ulangan Matematika (dalam skala nilai 10 sampai 100) dengan lama waktu belajar matematika (dalam jam selama seminggu). Nilai ulangan 95 100 100 80 70 55 50 75 55 60 65 95 matematika L Lama waktu kt 18 18 19 17 14 5 6 10 13 4 12 10 belajar matematika a)Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y! Anggap asumsi asumsi-asumsi asumsi dalam model regresi linear sederhana terpenuhi. b)Tentukan selang kepercayaan 99% bagi β0 dan β1 beserta maknanya! c)Ujilah ) j apakah p ada hubungan g linear antara lama waktu belajar j matematika dan nilai ulangan matematika? Gunakan taraf nyata α = 0,01. d)Ujilah apakah β1 = 5 lawan β1 ≠ 5 ? Gunakan taraf nyata α = 0,01. e)Ujilah apakah β0 = 0 atau tidak? Gunakan taraf nyata α = 0,01. 9



Soal 3 Suatu percobaan dilakukan pada jenis mobil baru merk tertentu, untuk menentukan jarak yang dibutuhkan untuk berhenti bila mobil tersebut direm pada berbagai kecepatan. Data yang diperoleh sebagai berikut: Kecepatan p (kilometer ( per p jam) j ) Jarak sampai berhenti (meter)



b0 s{b0}



Suatu tes diberikan pada semua mahasiswa baru. Seseorang yang memperoleh nilai di bawah 35 tidak diizinkan mengikuti kuliah matematika yang biasa, biasa tetapi harus mengikuti suatu kelas khusus (remedial class). Berikut ringkasan data dari nilai tes dan nilai akhir bagi 20 mahasiswa yang mengikuti kuliah matematika yang biasa: a Tentukan peubah mana sebagai peubah bebas X dan peubah tak a. bebas Y! b. Tentukan b u a persamaan p a aa regresi g dugaan! dugaa c. Bila 60 adalah nilai terendah agar lulus dari pelajaran matematika tersebut, berapakah batas nilai tes terendah di masa mendatang untuk dapat diizinkan mengikuti kuliah tersebut? Bila model regresi ordo pertama layak digunakan. d Ujilah d. Ujil h apakah k h ada d hubungan h b linier li i antara nilai il i tes dan d nilai il i akhir? khi ? Gunakan taraf nyata 0,05. e Tentukan selang kepercayaan 95% bagi β0 dan β1 beserta maknanya. e. maknanya 10



Sum Square of Errors (SSE) → JKG



(



SSE = ∑ Yi − Yˆi



)



2



35 50 65 80 95 110 16 26 41 62 88 119



a)Tentukan )T t k peubah b h mana sebagai b i peubah b h bebas b b X dan d peubah b h tak t k bebas Y! b)Tentukan persamaan regresi dugaan dan berikan makna dugaan koefisien regresinya! Anggap gg p asumsi-asumsinya y terpenuhi. p c)Tentukan selang kepercayaan 95% bagi β1 dan berikan maknanya! d)Tentukan selang kepercayaan 95% bagi β0 dan berikan maknanya! e)Ujilah apakah ada hubungan linear antara kecepatan dan jarak sampai berhenti? Gunakan taraf nyata α = 0,05. f)Ujilah apakah β1 positif? Gunakan taraf nyata α = 0,05.



SSE = ∑ Yi 2 − 2b0 ∑ Yi − 2b1 ∑ X iYi + b0 ∑ Yi + b1 ∑ X iYi 11



12



Normal Equation



Data Kredit Konsumen Hal 204 No. 6.5 Data di bawah ini menunjukkan bagi sebuah perusahaan kredit konsumen yang beroperasi di enam kota, banyaknya perusahaan sejenis yang beroperasi b i di kota k t itu it (X) dan d besarnya b t t l kredit total k dit dalam d l ribuan ib yang tertunggak (Y): i



1



2



3



4



5



6



Xi



4



1



2



3



3



4



Yi



16



5



10



15



13



22



Anggaplah bahwa model regresi ordo pertama layak digunakan.



13



a. Tentukan persamaan regresi dugaannya! b Tentukan selang kepercayaan bagi β0 dan β1 beserta b. maknanya! j apakah p besarnya y total kredit tertunggak gg c. Ujilah berhubungan dengan banyaknya perusahaan sejenis yang beroperasi di kota itu!



1 4



` Perhatikan kembali



Ukuran Deskriptif bagi Hubungan antara Peubah u Bebas s ((X)) d dan Peubah Tak Bebas (Y) dalam Model Regresi



∑ (Y − Y ) = ∑ (Yˆ − Y ) + ∑ (Y − Yˆ ) 2



2



i



2



i



=



JKT



i



+



JKR



i



JKG



` JKT mengukur keragaman di dalam amatan-amatan Yi atau ketidakpastian ketika meramalkan Y tanpa menggunakan peubah bebas X ⇒ keragaman e aga a total o a



* Koefisien Determinasi



` JKG mengukur keragaman dalam Yi dengan menggunakan model regresii yang menyertakan t k peubah b h bebas b b X ⇒ keragaman k yang tidak dapat dijelaskan



* Koefisien Korelasi



` JKR mengukur keragaman Yi yang berasal dari garis regresi ⇒ keragaman Y yang dapat dijelaskan 1 2



Koefisien Determinasi P h k Gambar Perhatikan G b 1 !! ` Ukuran untuk mengukur pengaruh X dalam menurunkan keragaman Y adalah



r2 =



JKT − JKG JKR JKG = = 1− JKT JKT JKT



Koefisien determinasi



Jika semua amatan terletak pada garis regresi maka JKG = 0 dan r2 = 1. Peubah bebas X berhasil menjelaskan semua keragaman di dalam amatan-amatan Yi.



Perhatikan Gambar 2 !! Jika kemiringan garis regresi adalah b1 = 0 sehingga



Karena 0 ≤ JKG ≤ JKT maka 0 ≤ r2 ≤ 1



0 Yˆ ≡ Y maka JKG = JKT dan r2 = 0.



Tidak ada hubungan linear antara X dan Y. Peubah bebas X dalam bentuk regresi linear tidak bisa membantu sama sekali k li dalam d l menurunkan k keragaman k d l dalam amatan-amatan t t Yi.



Yˆ = b0 + b1 X



Yˆ = Y



Semakin dekat pada 1 semakin tinggi tingkat hubungan linear antara X dan Y.



Gambar 2



Gambar 1



3



4



Makna koefisien determinasi ` Misalkan ingin mengetahui hubungan antara jarak kendaraan (X) dengan tingkat emisinya (Y) suatu mobil ?



Hubungan antara b1 dan r



tempuh



r2



` Diperoleh = 89,9% , artinya sekitar 89,9% keragaman dari tingkat emisi suatu mobil yang dapat dijelaskan oleh jarak tempuhnya.



∑ (Y − Y ) ∑ (X − X ) 2



b1 = r



i



2



i



⎛s = r ⎜⎜ Y ⎝ sX



⎞ ⎟⎟ ⎠



dalam hal ini



atau Keragaman tingkat emisi suatu mobil berhasil diturunkan 89,9% dengan disertakan peubah jarak tempuh.



5



∑ (Y − Y )



2



sY =



sX =



i



n −1



6



∑ (X



−X)



2



i



n −1



Koefisien Korelasi



Rumus Hitung bagi r



r = ± r2



r=



Tanda plus atau minus tergantung pada kemiringan garis g y positif p atau negatif. g regresinya -1 ≤ r ≤ 1



∑ (X



− X )(Yi − Y )



[∑ (X − X ) ∑ (Y − Y ) ] i



2



2 12



i



i



X Y ∑ X Y − ∑ n∑ (∑ X ) ⎞⎟⎛⎜ Y − (∑ Y ) − ⎟⎜ ∑ n n i



=



i



i i



⎡⎛ ⎢⎜ ∑ X i2 ⎢⎜⎝ ⎣



2



⎞⎤ ⎟⎥ ⎟⎥ ⎠⎦



2



i



i



2



i



⎠⎝



12



Bila hubungan linear antara X dan Y sempurna maka r = ±1 r = 1 hubungan sempurna dan searah r = -1 hubungan sempurna dan berlawanan arah



β1 < 0



β1 > 0



Korelasi hanya dapat mengukur hubungan linear !!! 8



7



Pengujian hipotesis tentang k fi i korelasi koefisien k l i



Koefisien Korelasi antara X dan Y Koefisien korelasi populasi dinyatakan dengan ρ. U t k menguji Untuk ji apakah k h ada d hubungan h b li linear antara t X dan d Y pada d model Y=β0+β1X+ε dapat pula dengan menguji H0: ρ = 0 lawan H1: ρ ≠ 0



Hipotesis 1) H0: ρ = 0 (Tidak ada hubungan linear antara X dan Y) H1: ρ ≠ 0 (Ada hubungan linear antara X dan Y) 2) H0: ρ ≥ 0 3) H0: ρ ≤ 0 H1: ρ < 0 H1: ρ > 0 T f nyata Taraf t :α r n−2 Statistik uji :



Jika regresi Y atas X merupakan garis lurus maka koefisien korelasi pada populasi adalah ρ atau ρXY



ρ XY =



Cov( X , Y ) E ( XY ) − E ( X )E (Y ) = σ XσY V ( X )Var Var V (Y )



Koefisien korelasi sampel



rXY =



(n∑ X



t=



n∑ XY − ∑ X ∑ Y 2



)(



− (∑ X ) n∑ Y 2 − (∑ Y ) 2



2



1− r2



Kriteria Keputusan : 1) H0 ditolak jika |thit| > tα/2,n-2 2) H0 ditolak jika thit < - tα,n-2 3) H0 ditolak jika thit > tα,n-2



)



9



10



Soal 1 Hipotesis 1) H0: ρ = k H1: ρ ≠ k



2) H0: ρ ≥ k H1: ρ < k



Taraf nyata : α Statistik Uji :



3) H0: ρ ≤ k H1: ρ > k



1+ r 1+ k ln − ln 1− r 1− k Z= 1 n−3



Kriteria Keputusan : 1) H0 ditolak jika |Zhit| > Zα/2 2)) H0 ditolak jjika Zhit < -Zα 3) H0 ditolak jika Zhit > Zα



11



Data nilai mutu ratarata-rata i



1



2



3



4



5



6



7



8



9



10



Xi



5,5



4,8



4,7



3,9



4,5



6,2



6,0



5,2



4,7



4,3



Yi



3,1



2,3



3,0



1,9



2,5



3,7



3,4



2,6



2,8



1,6



i



11



12



13



14



15



16



17



18



19



20



Xi



4,9



5,4



5,0



6,3



4,6



4,3



5,0



5,9



4,1



4,7



Yi



2,0



2,9



2,3



3,2



1,8



1,4



2,0



3,8



2,2



1,5



Keterangan: Keterangan: Y : nilai mutu rata-rata (NMR) pada akhir tahun pertama X : nilai ujian masuk Anggap model regresi linear cocok digunakan. a) Tentukan koefisien determinasi dan maknanya b) Tentukan koefisien korelasi c) Apakah ρ > 0,75? Lakukan pengujian hipotesis dengan α= 0,05. 12



Soal 2



Soal 3



Data Pemeliharaan Kalkulator



∑Y



i



i



1



2



3



4



5



6



7



8



9



Xi



7



6



5



1



5



4



7



3



4



Yi



97



86



78



10



75



62



101



39



53



i



10



11



12



13



14



15



16



17



18



Xi



2



8



5



2



5



7



1



4



5



Yi



33



118



65



25



71



105



17



49



68



= 1152, ∑ X i = 81, ∑ (Yi − Y ) = 16504, ∑ (X i − X ) = 74,.5, ∑ (X i − X )(Yi − Y ) = 1098 2



2



Xi adalah banyaknya kalkulator yang diservis Yi adalah lamanya waktu untuk memperbaiki kalkulator A Anggap model d l regresii linear li sederhana d h cocok k digunakan. di k Hitunglah koefisien determinasi determinasi!! Berikan maknanya maknanya!! Hitunglah koefisien korelasinya korelasinya!! Apakah ρ≠ 0? Lakukan pengujian hipotesis dengan α =0,01.



Data berikut merupakan hasil penelitian tentang hubungan antara nilai ulangan Matematika (dalam skala nilai 10 sampai 100) dengan lama waktu belajar matematika (dalam jam selama seminggu). Nilai a u ulangan a ga 95 100 00 100 00 80 70 0 55 50 75 5 55 60 65 95 matematika Lama waktu 18 18 19 17 14 5 6 10 13 4 12 10 belajar matematika a) Tentukan peubah mana sebagai peubah bebas dan peubah tak bebas! Anggap asumsi asumsi-asumsi asumsi dalam model regresi linear sederhana terpenuhi. terpenuhi b)Tentukan koefisien determinasi dan maknanya c)Tentukan koefisien korelasi d)Ujilah apakah ada hubungan linier antara lama waktu belajar matematika dan nilai ulangan matematika? Gunakan uji korelasi populasi dengan taraf nyata 0,05. 0 05



13



Soal 4 Suatu tes diberikan pada semua mahasiswa baru. Seseorang yang memperoleh nilai di bawah 35 tidak diizinkan mengikuti kuliah matematika yang biasa, tetapi harus mengikuti suatu kelas khusus (remedial class). Berikut ringkasan data dari nilai tes dan nilai akhir bagi 20 mahasiswa yang mengikuti kuliah matematika yang biasa: a) Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y! Bila model regresi ordo pertama layak digunakan. b)Tentukan koefisien determinasi dan maknanya c)Tentukan koefisien korelasi d)Apakah ρ = 0,85? Lakukan pengujian hipotesis dengan α= 0,01.



15



14



K it i kkoefisien Kriteria fi i kkorelasi l i (Sarwono:2006): – 0 : Tidak ada korelasi antara dua variabel – >0 – 0,25: Korelasi sangat lemah – >0,25 – 0,5: Korelasi cukup – >0,5 – 0,75: Korelasi kuat – >0,75 – 0,99: Korelasi sangat kuat – 1: Korelasi sempurna



16



UJI F UNTUK KETIDAKCOCOKKAN MODEL REGRESI LINEAR SEDERHANA



• Uji ini mengasumsikan bahwa pengamatan-pengamatan Y untuk suatu X tertentu bersifat bebas, tersebar normal, memiliki ragam yang sama. • Uji ini menghendaki adanya pengamatan berulang pada satu atau lebih nilai X.



ANALISIS VARIANSI UJI F UNTUK KETIDAKCOCOKKAN MODEL REGRESI LINEAR SEDERHANA



1 2



Jumlah Kuadrat Ketidakcocokkan Model (JKKM)



Formula Hipotesis p Hipotesis H0 : E{Y} = β0+ β1X H1 : E{Y} ≠ β0+ β1X Atau H0 : Tidak ada ketidakcocokan model regresi linear sederhana dengan data H1 : Ada ketidakcocokan model regresi linear sederhana dengan data Atau H0 : Model regresi linear sederhana cocok H1 : Model regresi linear sederhana tidak cocok



JKG = JKGM + JKKM Perhatikan :



Yij − Yˆij = Yij − Y j + Y j − Yˆij



Simpangan galat g



∑∑ (Y



ij



Simpangan g galat murni



− Yˆij



) = ∑∑ (Y 2



ij



JKG =



Simpangan ketidakcocokan model d l



(



− Y j ) + ∑∑ Y j − Yˆij 2



+



JKGM



)



2



JKKM



4 3



Statistik Uji j



J KKM (k − 2 ) F= JKGM (n − k )



JKGM = ∑∑ (Yij − Y j ) JKG = ∑ Yi 2 − b0 ∑ Yi − b1 ∑ X iYi JKKM = JKG − JKGM db(G) = n − 2; db(GM) = n − k; db(KM) = k − 2 2



5



Soal 1, lakukan uji kecocokan model regresi linear sederhana gunakan taraf nyata 0,05. sederhana, 0 05 i



Xi



Xi



Yi



1



125



160



2



100



112



3



200



124



⎯Yj



Yij 75



28 42



35



100



112 136



124



125



160 150



155



4



75



28



5



150



152



6



175



156



150



152



152



7



75



42



175



140



8



175



124



156 124



200



124 104



114



9



125



150



10



200



104



11



100



136



ΣXiYi=186200, ΣXi=1500, ΣYi =1288, ΣYi 2=170696 The regression equation is Ŷi = 50,72251+ 0,48670 Xi 6



Soal 2. Data Konsentrasi Larutan i



Xi



Yi



1



9



0.07



2



9



0 09 0.09



3



9



0.08



4



7



0.16



5



7



0.17



6



7



0.21



7



5



0.49



8



5



0.58



9



5



0 53 0.53



10



3



1.22



11



3



1.15



12



3



1.07



13



1



2.84



14



1



2.57



15



1



3.10



Soal 3



a. Tentukan persamaan regresi linear d dugaannya. b. Lakukan uji F untuk memeriksa apakah ada ketidakcocokan model bila digunakan model regresi linear sederhana, gunakan α = 0.05. c. Buatlah diagram pencar antara X dan Y, mengindikasikan model regresi apa yang cocok? Jelaskan. Jelaskan Seorang g kimiawan mempelajari p j hubungan g konsentrasi suatu larutan (Y) dengan waktu (X).



7



Bagaimana uji kecocokan model regresi linear sederhana dilakukan bila tidak ada pengamatan berulang pada nilai X? Berikan penjelasan. penjelasan.



Perhatikan kembali model regresi linear sederhana sederhana:: Yi = β0+β1Xi+εi



PENDEKATAN MATRIKS TERHADAP ANALISIS REGRESI LINEAR SEDERHANA



Y1 = β 0 + β1 X 1 + ε 1 Y2 = β 0 + β1 X 2 + ε 2 M Yn = β 0 + β1 X n + ε n



⎡Y1 ⎤ ⎡1 ⎢Y ⎥ ⎢1 ⎢ 2⎥ = ⎢ ⎢ M ⎥ ⎢M ⎢ ⎥ ⎢ ⎣Yn ⎦ ⎣1



⎡ε1 ⎤ X1 ⎤ X 2 ⎥ ⎡ β 0 ⎤ ⎢ε 2 ⎥ ⎥⎢ ⎥+⎢ ⎥ M ⎥ ⎣ β1 ⎦ ⎢ M ⎥ ⎢ ⎥ X n ⎦⎥ ⎣ε n ⎦



Y = X β +ε n×1 n×2



2×1 n×1



1



2



Perhatikan bahwa X β adalah vektor nilai-nilai harapan b i amatan-amatan bagi t t Yi sebab b b E{Yi}= } β0+β1Xi



Perhatikan !!!



S h Sehingga : E{Y } = X β n×1



n×2 2×1



Syarat : ε adalah S d l h suatu vektor k peubah-peubah b h b h acakk normall yang bebas dengan E{ε } = 0 dan σ 2 {ε } = σ 2 I Persamaan normal regresi linear sederhana nb0 + b1 ∑ X i = ∑ Yi



ditulis dalam notasi matriks ⎡1 1 K 1 ⎤ ⎢⎢1 ⎡1 ⎢ X X K X ⎥ ⎢M n⎦ 2 ⎣ 1 ⎢ ⎣1



X Xb = X Y t



b0 ∑ X i + b1 ∑ X i2 = ∑ X iYi



t



(



⇒b= X X t



)



−1



t



X Y



X1 ⎤ ⎡Y1 ⎤ X 2 ⎥⎥ ⎡b0 ⎤ ⎡1 1 K 1 ⎤ ⎢⎢Y2 ⎥⎥ =⎢ ⎢ ⎥ ⎥ M ⎥ ⎣b1 ⎦ ⎣ X 1 X 2 K X n ⎦ ⎢ M ⎥ ⎥ ⎢ ⎥ Xn⎦ ⎣Yn ⎦ 3



Uji terhadap β1



Perhatikan !!!



• Untuk menguji apakah ada hubungan linear antara Y dengan X dilakukan X, dil k k pengujian ji berikut b ik t : Hipotesis : H0 : β1 = 0 H1 : β1 ≠ 0 Taraf nyata : α Statistik Uji : F = KTR = JKR /( p − 1)



KTG



4



⎛1⎞ / / JKT = Y Y − ⎜ ⎟Y J Y ⎝n⎠



′ Y Y = ∑ Yi 2



JKG /((n − p )



p : banyaknya parameter ⎛1⎞ / / / / / JKT = Y Y − ⎜ ⎟Y J Y JKG = Y Y − b X Y JKR = JKT-JKG ⎝n⎠ Kriteria Keputusan : H0 ditolak jika Fhit > Fα(p-1,n-p) 5



⎡1 L 1⎤ J = ⎢⎢M M M⎥⎥ n×n ⎢⎣1 L 1⎥⎦



2 ′ Y J Y = (∑ Yi )



6



Soal 1



Selang Kepercayaan bagi βk



bk ± tα / 2,(n − p )s{bk }



⎡ s 2 {b0 } s{b0 ,b1}⎤ s {b} = ⎢ ⎥ 2 ⎣ s{b1 , b0 } s {b1} ⎦ 2



Suatu percobaan telah dilakukan untuk menentukan apakah berat seekor kambing (dalam kilogram) dapat diprediksikan (setelah pada periode tertentu) berdasarkan jumlah makanan yang dimakan (dalam kilogram). Berikut data yang telah dinyatakan dalam notasi matriks.



(



s 2 {b} = KTG X X /



379 ⎤ ⎡ 825 ⎤ ⎡ 10 ′ ′ ′ X X =⎢ ⎥, X Y = ⎢31726⎥, Y Y = [70083], ⎣ ⎦ ⎣379 14533⎦



)



−1



′ Y J Y = [680625]



Anggap model regresi ordo pertama dapat digunakan. a) Tentukan persamaan regresi dugaan beserta maknanya. b) Bila jumlah makanan seekor kambing sebesar 300 kg, berapakah prediksi berat kambing tersebut? c) Buatlah selang kepercayaan 99% bagi β1 dan berikan maknanya. maknanya d) Tentukan koefisien korelasinya.



K fi i Determinasi Koefisien D t i i r2 = JKR/JKT = 1- (JKG/JKT)



Koefisien korelasi r = ± r2



7



Soal 2 (kerjakan dengan pendekatan matriks) matriks) D Data K Kerusakan k Rasa R Data berikut merupakan hasil penelitian tentang hubungan antara suhu penyimpanan (dalam °F) dan lama (dalam minggu ) sebelum mulai terjadi kerusakan rasa suatu produk i



1



2



3



4



5



Xi



8



4



0



-4



-8



Yi



7.8



9.0



10.2



11.0



11.7



Anggap bahwa model regresi ordo pertama dapat digunakan. a)Tentukan persamaan regresi dugaannya b)Ujilah apakah ada hubungan linear antara suhu penyimpanan dan lama sebelum mulai terjadi kerusakan rasa suatu produk ? c)Buat selang kepercayaan bagi β0 dan β1! d)Tentukan ) koefisien determinasi dan koefisien korelasinya! y 9



Ingat!! Ingat Metode Kuadrat Terkecil untuk Model Regresi Linear Sederhana n



n



n



Q = ∑ (Yi − E (Yi )) = ∑ (Yi − (β 0 + β1 X i )) = ∑ (Yi − β 0 − β 1 X i ) 2



i =1



ANALISIS REGRESI LINEAR GANDA



2



i =1



n ∂Q = −2∑ (Yi − β 0 − β1 X i ) ∂β 0 i =1



Dosen Pengampu : Kismiantini, M.Si.



2



i =1



n ∂Q = −2∑ X i (Yi − β 0 − β 1 X i ) ∂β 1 i =1



Lalu kedua turunan parsial tersebut disamadengankan nol nol,, dengan penduga bagi β0 dan β1 adalah b0 dan b1 yang meminimumkan Q. n



− 2∑ (Yi − b0 − b1 X i ) = 0



n



− 2∑ X i (Yi − b0 − b1 X i ) = 0



i =1



n



∑Y i =1



i



i =1



n



− nb0 − b1 ∑ X i = 0 i =1



n



∑X Y i =1



i i



n



n



i =1



i =1



− b0 ∑ X i − b1 ∑ X i2 = 0



1 2



Model Regresi Linear Ganda



Persamaan Normal



n



n



i =1



i =1



Yi = β 0 + β1 X i1 + β 2 X i 2 + L + β p −1 X i , p −1 + ε i dengan : β0, β1, …, βp-1 adalah parameter Xi1, …, Xi,p-1 ,p adalah konstanta yang diketahui nilainya εi saling bebas dan menyebar N(0,σ2) i = 1, 2, …, n



nb0 + b1 ∑ X i = ∑ Yi n



n



n



i =1



i =1



i =1



b0 ∑ X i + b1 ∑ X i2 = ∑ X i Yi



Persamaan regresi g dugaan g : Yˆi = b0 + b1 X i1 + b2 X i 2 + L + b p −1 X i , p −1 4



3



Model Regresi Linear dengan 2 Peubah Bebas



P Persamaan Normal N l



Yi = β 0 + β1 X i1 + β 2 X i 2 + ε i



b0 n + b1 ∑ X i1 + b2 ∑ X i 2 + K + b p −1 ∑ X ip −1 = ∑ Yi



Persamaan regresi dugaan : Yˆ = b + b X + b X



b0 ∑ X i1 + b1 ∑ X i21 + b2 ∑ X i1 X i 2 + K + b p −1 ∑ X i1 X ip −1 = ∑ X i1Yi



b0 ∑ X i 2 + b1 ∑ X i1 X i 2 + b2 ∑ X i22 + K + b p −1 ∑ X i 2 X ip −1 = ∑ X i 2Yi



i



M



0



1



i1



2



i2



Persamaan normal :



b0 ∑ X ipp −1 + b1 ∑ X i1 X ipp −1 + b2 ∑ X i 2 X ipp −1 + K + b p −1 ∑ X ip2p −1 = ∑ X ipp −1Yi



b0 n + b1 ∑ X i1 + b2 ∑ X i 2 = ∑ Yi



b0 ∑ X i1 + b1 ∑ X i21 + b2 ∑ X i1 X i 2 = ∑ X i1Yi



b0 ∑ X i 2 + b1 ∑ X i1 X i 2 + b2 ∑ X i22 = ∑ X i 2Yi 5



6



⎡ 1 X X = ⎢⎢ X 11 ⎢⎣ X 12



⎡1 X 11 1 ⎤⎢ 1 X 21 ⎥ X n1 ⎥ ⎢ ⎢M M L X n 2 ⎥⎦ ⎢ ⎣1 X n1



X 22



⎡ n ⎢ ' X X = ⎢ ∑ X i1 ⎢∑ X i 2 ⎣ ⎡ 1 ' X Y = ⎢⎢ X 11 ⎢⎣ X 12



∑X ∑X ∑X X i1 2 i1



i2



∑X ∑X X ∑X i2



i1



i1



Memaknai Persamaan Regresi g Dugaan g



X 12 ⎤ X 22 ⎥⎥ M ⎥ ⎥ X n2 ⎦



1 L X 21 L



'



i2



2 i2



Misalkan : Ingin mengetahui apakah volume penjualan (Y, gros) b h b berhubungan d dengan j l h penduduk jumlah d d k (X1, ribuan ib ji ) dan jiwa) d pendapatan per kapita (X2, dolar). Diperoleh pe o e pe persamaan sa aa regresi eg es dugaa dugaannya ya ialah aa



⎤ ⎥ ⎥ ⎥ ⎦



Yˆ = 3,453 + 0,496 X 1 + 0,00920 X 2 Persamaan ini menunjukkan bahwa rataan volume penjualan diharapkan akan naik 0,496 gros bila jumlah penduduk naik 1 ribu jjiwa kalau p pendapatan p per kapita p p tetap, p, dan bahwa rataan volume penjualan diharapkan akan naik 0,0092 gros bila pendapatan per kapita naik 1 dolar kalau jumlah penduduk tetap. Bila jumlah penduduk sebesar 0 jiwa dan pendapatan per kapita 0 dollar maka rata-rata volume penjualan sebesar 3,453 gros (tidak bermakna).



⎡Y ⎤ ⎤ 1 ⎤ ⎢ 1 ⎥ ⎡∑ Yi ⎢ ⎥ Y ⎥ X n1 ⎥ ⎢ 2 ⎥ = ⎢∑ X i1Yi ⎥ ⎢M⎥ ⎢ L X n 2 ⎦⎥ ⎢ ⎥ ⎢∑ X i 2Yi ⎥⎥ ⎦ ⎣Yn ⎦ ⎣



1 L X 21 L



X 22



7



Uji terhadap Hubungan Regresi



Soal 1 Suatu percobaan telah dilakukan untuk menentukan apakah berat seekor binatang dapat diprediksikan (setelah pada periode tertentu)) berdasarkan b d k b berat awall dan d j l h makanan jumlah k yang dimakan. Diperoleh data sebagai berikut yang diukur dalam kilogram. Berat Akhir (Y)



95



77



80



100



97



70



50



80



92



Berat Awal (X1)



42



33



33



45



39



36



32



41



40



38



272



226



259



292



311



183



173



236



230



235



Jumlah Makanan (X2)



Untuk menguji apakah peubah tak bebas Y berhubungan dengan peubah-peubah p p bebas ((X1, X2,,…,X , pp-11), dilakukan p pengujian g j berikut : Hipotesis : H0 : β1 = β2 = … = βp-1=0 0 H1 : Tidak semua βk (k=1,2,…,p-1)sama dengan nol Taraf nyata : α Statistik Uji : F = KTR/KTG = (JKR/(p-1))/(JKG/(n-p)) p : banyaknya parameter ⎛1⎞ JKR = JKT-JKG JKT = Y ' Y − ⎜ ⎟Y ' J Y ⎝n⎠ Kriteria Keputusan : JKG = Y ' Y − b' X ' Y H0 ditolak jika Fhit > Fα(p-1,n-p)



84



Tentukan persamaan regresi dugaan dan maknanya! Coefficientsa



Model 1



(Constant) Berat Awal Jumlah Makanan



8



Unstandardized Coefficients B Std. Error -22.993 17.763 1 396 1.396 .583 583 .218 .058



Standardized Coefficients Beta .404 404 .634



t -1.294 2 396 2.396 3.767



Sig. .237 .048 048 .007



95% Confidence Interval for B Lower Bound Upper Bound -64.995 19.009 .018 018 2 773 2.773 .081 .354



a. Dependent Variable: Berat Akhir



9



10



Uji terhadap βk



Perhatikan!!! Perhatikan !!!



s 2 {b} = KTG ( X ' X )



−1



Hipotesis : ⎡ s {b } s{b , b } H0 : βk = 0 H1 : βk ≠ 0 ⎢ s{b , b } s {b } s {b} = ⎢ ⎢ Taraf nyata : α M M ⎢ ⎢⎣ s{b , b } s{b , b } Statistik Uji : t = bk/s{bk} Kriteria Keputusan : Ho ditolak jika |thit| > tα/2, n-p



⎛1⎞ ' JKT = Y Y − ⎜ ⎟Y J Y ⎝n⎠



2



0



'



0



1



2



2



1



p −1



′ Y Y = ∑ Yi 2



0



1



0



p −1



1



L s{b0 , b p −1 }⎤ ⎥ L s{b1 , b p −1 }⎥ ⎥ M M ⎥ L s 2 {b p −1 } ⎥⎦



S l Selang K Kepercayaan b i βk bagi



2 ′ Y J Y = (∑ Yi )



bk ± tα / 2,(n − p )s{bk }



11



12



Soal 2 Makna Selang Kepercayaan



Suatu p penelitian telah dilakukan untuk mengetahui g hubungan g antara persentase kehadiran mahasiswa (X1) dan lama belajar dalam jam per minggu (X2) terhadap nilai akhir ujian suatu mata kuliah (Y). Sebanyak 30 mahasiswa telah dipilih secara acak untuk menjadi subyek penelitian. ⎡ 9,8866861 − 0,132528 0,640573 ⎤ Diketahui : (X′X )−1 = ⎢⎢− 0,132528 0,0018375 − 0,010051⎥⎥



Dari soal 1, diperoleh selang kepercayaan bagi β1 adalah 0 018 ≤ β1 ≤ 2,773 0,018 2 773 artinya diduga bahwa rata-rata berat akhir binatang (Y) naik sekitar antara 0,018 , sampai p 2,773 , kgg untuk setiapp kenaikan satu kilogram g berat awal binatang (X1) bila jumlah makanan tetap (X2).



⎣⎢ 0,640573



− 0,010051



0,079075 ⎥⎦



∑ Yi = 2440, ∑ Yi 2 = 2016000, ∑ X i1Yi = 224670, ∑ X i 2Yi = 8880,



∑X



i1



X i 2 = 9810, ∑ X i21 = 251674, ∑ X i22 = 409



a)) Tentukan p persamaan regresi g dugaan g dan berikan maknanya. y b) Bila dianggap asumsi-asumsi dalam analisis regresi linear ganda terpenuhi, ujilah apakah ada hubungan antara persentase kehadiran mahasiswa dan lama belajar dalam jam per minggu terhadap nilai akhir ujian suatu mata kuliah. Gunakan α = 0,05. c) Tentukan selang kepercayaan bagi β1 dan maknanya.



13



Soal 3 Dari soal 1,



Selang g Kepercayaan p y Serempak p



( X ' X )−1



8.6176001 -0.21777 -0.001093 0 001093



-0.21777 0.0092689 -0.000552 0 000552



Selang S l k kepercayaan b bersama B f Bonferroni i dapat d di digunakan k untukk menduga beberapa koefisien regresi secara serempak. JJika a g bua buah pa parameter a ete a akan a d diduga duga seca secara a be bersamaan sa aa (asa (asalkan a g ≤ p), maka batas-batas kepercayaan serempak dengan tingkat kepercayaan 1-α adalah



-0.001093 -0.000552 0.0000911 0 0000911



a) Ujilah apakah ada hubungan linear antara berat akhir dengan berat awal dan jumlah makanan? b) Ujilah apakah β2=0 atau tidak? c) Buat selang kepercayaan masing-masing bagi β1 dan β2!



bk ± B s{bk } B=tα 2g



(n − p )



15



Makna Selang Kepercayaan Serempak



16



Koefisien Determinasi Ganda (R2)



Misalkan : Ingin g mengetahui g apakah p volume p penjualan j ((Y,, gros) berhubungan dengan jumlah penduduk (X1, ribuan jiwa) dan pendapatan per kapita (X2, dolar). Diperoleh selang kepercayaan serempak 90% sebagai berikut : (g=2) (g 2)



ƒ R2 = JKR/JKT / = 1- (JKG/JKT) ( / ) ƒ Koefisien ini mengukur proporsi pengurangan keragaman total di dalam Y akibat digunakannya peubah-peubah bebas X1,X2, …, Xp-1. ƒ Sifat koefisien determinasi ganda : 0 ≤ R2 ≤ 1. ƒ R2 akan bernilai 0 bila semua bk = 0 (k=1,…,p-1). R2 akan bernilai 1 bila semua amatan Y berada tepat pada permukaan respons dugaannya, Yi = Ŷi untuk semua i.



0 483≤β1≤0,509; 0,483≤β ≤0 509; 0,0071 0 0071 ≤β2≤0,0113 ≤0 0113 Selang kepercayaan serempak ini mengindikasikan bahwa β1 dan β2 keduanya positif, hal ini sesuai harapan teoritis bahwa volume penjualan memang harus naik jika jumlah penduduk naik ik dan d pendapatan d t per kapita k it naik, ik tentu t t saja j asalkan lk peubah-peubah lain dipertahankan konstan.



17



18



Koefisien determinasi ganda terkoreksi



Memaknai Koefisien Determinasi Ganda



ƒ Penambahan lebih banyak y p peubah bebas ke dalam model selalu akan menaikkan nilai R2 tidak pernah menurunkannya, sebab JKG tidak pernah menjadi lebih besar bila peubah bebasnya lebih banyak, sedangkan JKT tidak akan berubah bila data responsnya tetap sama. ƒ Karena R2 sering bisa dibuat besar dengan cara menyertakan peubah bebas, bebas maka ada yang menyarankan agar ukuran ini dimodifikasi untuk mempertimbangkan banyaknya peubah bebas di dalam model. ƒ Koefisien determinasi ganda terkoreksi



Misalkan : Ingin mengetahui apakah volume penjualan (Y, (Y gros) berhubungan dengan jumlah penduduk (X1, ribuan jiwa) dan pendapatan per kapita (X2, dolar) Diperoleh R2 = 0,9989, artinya bila kedua bebas, jumlah penduduk dan pendapatan per kapita ikut diperhitungkan maka keragaman volume penjualan dapat dikurangi sebanyak 99,9%. atau sebesar 99,9% keragaman dari volume penjualan yang dapat dijelaskan oleh jumlah penduduk dan pendapatan per kapita.



⎛ n − 1 ⎞ JKG JKG (n − p ) ⎟⎟ = 1 − ⎜⎜ R = 1− JKT (n − 1) ⎝ n − p ⎠ JKT 2 a



19



20



Chatterjee, S. & Hadi, A.S. 2006. Regression Analysis by Example. New Jersey: John Wiley & Sons.



Koefisien Korelasi Ganda Koefisien korelasi ganda R adalah akar kuadrat positif dari R2 ⇒ R=



R2



Mengapa koefisien k fi i korelasi k l i ganda d diperoleh di l h hanya h dari akar positif koefisien determinasi ganda ganda??



21



22



Soal 4 Dari soal 1, 1 a) Tentukan selang kepercayaan serempak 95% untuk β1 dan β2. b) Hitunglah koefisien determinasi ganda dan berikan maknanya. c) Hitunglah koefisien korelasi ganda.



Soal 5 Dari soal 2, a) Tentukan selang kepercayaan serempak 95% untuk β1 dan β2. b) Hitunglah koefisien determinasi ganda dan berikan maknanya. g koefisien korelasi g ganda. c)) Hitunglah



Soal 6. Data tentangg ppengiriman g bahan kimia Data berikut ini, yang diambil dari 20 kali pengiriman bahan kimia dalam drum drum-drum drum di sebuah gudang, menunjukkan banyaknya drum yang dikirimkan (X1), berat total kiriman (X2, dalam ratusan pon), dan lamanya waktu (dalam menit) untuk menangani kiriman (Y). i



1



2



3



4



5



6



7



8



9



Xi1



7



18



5



14



11



5



23



9



16



10 5



Xi2



5,11



16,72



3,20



7,03



10,98



4,04



22,07



7,03



10,62



4,76



Yi



58



152



41



93



101



38



203



78



117



44 20



i



11



12



13



14



15



16



17



18



19



Xi1



17



12



6



12



8



15



17



21



6



11



Xi2



11 02 11,02



9 51 9.51



3 79 3.79



6 45 6,45



4 60 4,60



13 86 13,86



13 03 13,03



15 21 15,21



3 64 3,64



9 57 9,57



Yi



121



112



50



82



48



127



140



155



39



90



24



Pertanyaan a) Misalkan model regresi linear berganda cocok digunakan, tuliskan persamaan regresi dugaannya. Bagaimana dugaan β1 dan β2 ditafsirkan dalam hal ini? b) Ujilah Ujil h apakah k h ada d hubungan h b regresii linear li antara t k d kedua peubah b h bebas dengan peubah tak bebas, gunakan taraf nyata 0,05. c)) Hitunglah g koefisien determinasi g ganda R2! Bagaimana g ukuran ini ditafsirkan dalam kasus ini? d) Ujilah β1=0 atau tidak, β2=0 atau tidak, α = 0,05. e) Buatlah B atlah selang kepercayaan kepe ca aan 95% secara seca a masing-masing masing masing untuk nt k β1 dan β2. Berikan maknanya. f)) Buatlah selang g kepercayaan p y secara serempak p 95% untuk β1 dan β2. Berikan maknanya.



25



Asumsi--asumsi dalam Regresi Linear Ganda Asumsi



Asumsi-asumsi dalam Regresi Linear Ganda



yMultikolinearitas yHeteroskedastisitas yNormalitas l yAutokorelasi A t k l i



Dosen Pengampu g p : Kismiantini Kismiantini,, M.Si M.Si..



1



2



Multikolinearitas



Kriteria terjadinya multikolinearitas



y Multikolinearitas atau kekolinearan ganda adalah terjadinya



Rule of Thumb



korelasi antar peubah bebas. y Model regresi yang baik seharusnya tidak terjadi korelasi



y Mempunyai nilai l VIF > 10



antar peubah bebas.



y Mempunyai angka TOLERANCE < 0,1



y Metode yang banyak digunakan untuk mendeteksi adanya



y TOLERANCE = 1/VIF.



multikolinearitas adalah faktor inflasi ragam (variance inflation factor/VIF) y Rumusnya



VIFk = (1 − Rk2 )−1 , k = 1,2,..., p − 1



y Rk2 adalah koefisien determinasi ganda bila Xk diregresikan



terhadap p-2 p 2 peubah lainnya lainn a di dalam model model.



3



4



Heteroskedastisitas



Normalitas



y Ragam galat diasumsikan konstan dari satu pengamatan ke



y Galat diasumsikan berdistribusi Normal. Normal



pengamatan lain, hal ini disebut homoskedastisitas.



y Model regresi yang baik adalah distribusi data normal atau



y JJika ragam g ggalat berbeda disebut heteroskedastisitas.



mendekati normal. normal



y Model regresi yang baik adalah tidak terjadi heteroskedastisitas.



y Untuk mendeteksi normalitas digunakan normal p-p plot.



y Untuk mendeteksi heteroskedastisitas adalah dengan membuat



y Jika Jik titik-titik i ik i ik ((sisaan) i ) menyebar b di sekitar ki garis i di diagonall ddan



plot nilai dugaan yang dibakukan (standardized predicted value) dengan sisaan yang dibakukan (studentized residual). y Jika ada pola tertentu (bergelombang, melebar kemudian menyempit) maka terjadi heteroskedastisitas. y Jika tidak ada pola jelas, serta titik-titik (sisaan) menyebar di atas dan di bawah angka 0 pada sumbuY, maka tidak terjadi h t heteroskedastisitas. k d ti it 5



ε i ~ N (0,σ 2 )



mengikuti arah garis diagonal, maka model regresi memenuhi asumsi normalitas. normalitas y Jika titik-titik (sisaan) menyebar jauh dari garis diagonal dan atau tidak mengikuti arah garis diagonal diagonal, maka model regresi tidak memenuhi asumsi normalitas. 6



Autokorelasi



Sifat-sifat Statistik Durbin Watson



y Bila dalam model regresi linear ganda ada korelasi antara galat



pada periode t dengan galat pada periode t-1, maka dinamakan aadaa masalah asa a auto autokorelasi. o e as . y Model regresi yang baik adalah model regresi yang bebas dari autokorelasi. y Autokorelasi sering ditemukan pada regresi yang datanya adalah time series atau berdasarkan waktu berkala seperti bulanan, tahunan. y Deteksi autokorelasi dengan menggunakan besaran Durbin n Watson (D-W) ( e − e )2 d= 7



∑ i =2



∑e i =1



2 i



8



Uji Durbin Watson



Uji Durbin Watson



Hipotesis: H0 : ρ = 0 (Tidak ada autokorelasi) H1 : ρ > 0 (Ad (Ada autokorelasi k l i positif) i if) Taraf nyata : α Statistik Uji : d Kriteria Keputusan: Jika d > dU maka terima H0 (tidak ada autokorelasi) JJika d < dL maka tolak H0 ((ada autokorelasi ppositif)) Jika dL ≤ d ≤ dU , maka uji tidak meyakinkan



Hipotesis: H0 : ρ = 0 (Tidak ada autokorelasi) H1 : ρ < 0 (Ad (Ada autokorelasi k l i negatif) if) Taraf nyata : α Statistik Uji : 4-d Kriteria Keputusan: Jika 4-d > dU maka terima H0 (tidak ada autokorelasi) JJika 4-d < dL maka tolak H0 ((ada autokorelasi negatif) g ) Jika dL ≤ 4-D ≤ dU , maka uji tidak meyakinkan



9



10



Uji Durbin Watson Hipotesis: H0 : ρ = 0 (Tidak ada autokorelasi) H1 : ρ ≠ 0 (Ada (Ad autokorelasi) k l i) Taraf nyata : 2α Statistik Uji : d Kriteria Keputusan: Jika d < dL atau 4-d < dL maka tolak H0 (ada autokorelasi) JJika d > dU dan 4-d > dU maka terima H0 ((tidak ada autokorelasi ) y Selain itu,, maka ujij dikatakan tidak meyakinkan 11



2 2.



i −1



i



n



Selalu 0 ≤ d ≤ 4 Jik sisaan Jika i tterurutt bberkorelasi k l i positif itif ,maka k d mendekati d k ti noll 3. Jika sisaan terurut berkorelasi negatif, maka d mendekati 4 sehingga hi 44-dd mendekati d k ti 0 4. Distribusi d simetrik pada nilai 2 1.



Data tentang pengiriman bahan kimia Data berikut ini, yang diambil dari 20 kali pengiriman bahan kimia dalam drum-drum drum drum di sebuah gudang, gudang menunjukkan banyaknya drum yang dikirimkan (X1), berat total kiriman (X2, dalam ratusan pon), dan lamanya waktu (dalam menit) untuk menangani kiriman (Y).



12



i



1



2



3



4



5



6



7



8



9



Xi1



7



18



5



14



11



5



23



9



16



10 5



Xi2



5,11



16,72



3,20



7,03



10,98



4,04



22,07



7,03



10,62



4,76



Yi



58



152



41



93



101



38



203



78



117



44 20



i



11



12



13



14



15



16



17



18



19



Xi1



17



12



6



12



8



15



17



21



6



11



Xi2



11,02



9,51



3,79



6,45



4,60



3,64



9,57



Yi



121



112



50



82



48



39



90



13,86 13,03 15,21 127



140



155



Model Summaryb Model 1



R .993a



R Square .987



Adjusted R Square .985



Std. Error of the Estimate 5.618



a. Predictors: (Constant), X2, X1 b. Dependent Variable: Y



Model 1



Coefficientsa Unstandardized Coefficients B Std. Error 3 324 3.324 3 111 3.111 3.768 .614 5.080 .666



(Constant) X1 X2



Data tentang Rumah Sakit



DurbinWatson 1.813



Standardized Coefficients Beta



t 1.069 1 069 6.135 7.632



.451 .561



Sig. .300 300 .000 .000



Collinearity Statistics Tolerance VIF .142 .142



7.028 7.028



Direktur sebuah Rumah Sakit ingin g meneliti hubungan g antara kepuasan p pasien (Y) dengan umur pasien (X1, dalam tahun) keparahan penyakit yang diderita (X2, sebuah indeks) dan tingkat kecemasan (X3, suatu indeks). Secara acak diambil 23 pasien dan diperoleh data sbb. :



a. Dependent Variable: Y



Y



X1



X2



X3



Y



X1



X2



X3



48



50



51



2.3



47



38



55



2.2



57



13



14



51



2.3



66



40



48



2.2



57



53



54



2.2



70



41



36



41



46



1.8



2.3



66



51



36



34



49



2



89



28



43



1.8



79



33



56



2.5



36



49



54



2.9



88



29



46



1.9



46



42



50



2.2



60



33



49



2.1



54



45



48



2.4



49



55



51



2.4



26



52



62



2.9



77



29



52



2.3



77



29



50



2.1



52



44



58



2.9



89



29



48



2.4



60



43



50



2.3



67



43



53



2.4



Model Summaryb Model 1



R .820a



R Square q .673



Adjusted R Square q .622



Std. Error of the Estimate 10.281



DurbinWatson 2.017



Data Penjualan Roti Duta Makmur



a. Predictors: (Constant), X3, X1, X2 b. Dependent Variable: Y



y Daerah penjualan roti Duta Makmur meliputi Jakarta, Jakarta Jawa



Coefficientsa



Model 1



(Constant) X1 X2 X3



Unstandardized Coefficients B Std. Error 161.409 24.142 -1.225 1.225 .299 -.649 .782 -8.131 12.517



Standardized Coefficients Beta -.621 .621 -.182 -.148



t 6.686 -4.092 4.092 -.830 -.650



Sig. .000 .001 .417 .524



Barat, Jawa Tengah dan Jawa Timur



Collinearity Statistics Tolerance VIF .748 .357 .332



y Sales (peubah tak bebas) adalah tingkat penjualan roti semua



1.337 2.798 3.008



rasa (dalam unit/bulan)



a. Dependent Variable: Y



y Iklan_koran Iklan koran menyatakan iklan di koran (juta rupiah/bulan) y Iklan_radio menyatakan iklan di radio (juta rupiah/bulan) y Jumlah_outlet J lh l menyatakan k jjumlah l h outlet l perusahaan h untukk



setiap daerah seperti di pasar, supermaket, mall y Jumlah_salesman J lh l menyatakan k jumlah l h salesman l untukk setiap



daerah (orang) 15



16



Daerah Jakarta1 J k t 2 Jakarta2 Jakarta3 Jakarta4 Jakarta5 Jakarta6 Jakarta7 Jawa Barat1 Jawa Barat2 Jawa Barat3 J Jawa Barat4 B t4 Jawa Barat5 Jawa Barat6 Jawa Barat7 g Jawa Tengah1 Jawa Tengah2 Jawa Tengah3 Jawa Tengah4 Jawa Tengah5 Jawa Tengah6 Jawa Tengah7 Jawa Tengah8 Jawa Tengah9 Jawa Timur10 Jawa Timur11 Jawa Timur12 Jawa Timur13 Jawa Timur14 Jawa Timur15 Jawa Timur16



17



Sales 300.12 312 25 312.25 362.02 400.25 412.6 423 320.14 366.25 451.29 430.22 265 99 265.99 254.26 352.16 365.21 295.15 354.25 415.25 400.23 423.22 452 62 452.62 512.33 435.23 302.21 330.92 254.25 265.21 215.36 235.26 222 32 222.32 323.45



Iklan_koran Iklan_radio Jumlah_outlet Jumlah_salesman 26.23 12.23 7 4 25 12 25.12 12 88 12.88 8 3 29.8 15.26 8 2 34.55 14.23 9 1 33.45 13.02 6 4 32.26 13.56 5 2 23.45 12.03 8 3 34.76 15.26 9 3 40.12 14.32 8 2 36.21 13.33 10 5 25 89 25.89 12 05 12.05 11 4 22.98 15.26 10 1 36.25 12.89 9 5 36.87 12.45 8 5 22.41 13.44 5 2 26.25 13.67 6 2 36.99 19.25 8 5 32.79 18.78 9 2 33.98 16.59 7 2 23 21 23.21 18 45 18.45 5 3 44.98 13.45 8 5 35.99 15.78 8 3 25 16.35 9 2 23.25 19.58 8 5 24.86 13.87 6 6 26.23 15.87 5 5 20.98 13.23 7 4 24.88 15.69 9 3 25 87 25.87 18 97 18.97 8 6 28.94 18.29 9 5



Model Summaryb Model M d l 1



R RS Square .869a .755



Adjusted RS Square .716



Std. Error of the Estimate th E ti t 41.58129



DurbinWatson W t 1.592



a. Predictors: (Constant), Jumlah_salesman, Jumlah_outlet, Iklan_radio, Iklan_koran b. Dependent Variable: Sales



Model 1



(Constant) Iklan_koran Iklan_radio Jumlah_outlet Jumlah_salesman



a. Dependent Variable: Sales



18



Unstandardized Coefficients B Std. Error 100.128 71.407 10.913 1.279 4.966 3.316 -13.275 4.969 -13.988 5.263



Coefficientsa Standardized Coefficients Beta .869 .149 -.271 -.265



t 1.402 8.530 1.498 -2.672 -2.658



Sig. .173 .000 .147 .013 .014



Collinearity Statistics Tolerance VIF .942 .985 .955 .984



1.062 1.015 1.048 1.017



Soal Normal P-P Plot of Regression Standardized Residual



Dependent Variable: Y



Expected Cum Prob



1.0



0.8



0.6



0.4



0.2



0.0 0.0



0.2



0.4



0.6



0.8



1.0



Observed Cum Prob



Gambar 1



19



Gambar 2



Bagaimana mengenai pemenuhan asumsi asumsi-asumsi asumsi dalam model regresi linear ganda? Berikan penjelasannya. b)) Berdasarkan a)) apakah p inferensi dalam model regresi g linear ganda g dapat dilakukan? Berikan penjelasannya. a)



Gagasan Dasar (Jumlah Kuadrat Ekstra) Mengukur pengurangan JKG akibat dimasukkannya 1 atau lebih peubah bebas ke dalam model regresi, regresi jika diketahui peubahpeubah peubah lain telah ada di dalam model Mengukur kenaikan JKR akibat dimasukkannya 1 atau beberapa peubah bebas ke dalam model regresi



JUMLAH KUADRAT EKSTRA Dosen Pengampu : Kismiantini, M.Si.



1 2



Untuk mengetahui apakah yang dimaksud dengan Jumlah Kuadrat Ekstra, perhatikan tabel-tabel ANOVA berikut :



Kegunaan Jumlah Kuadrat Ekstra



a) Regresi Y terhadap X1 : Untuk menguji apakah peubah Xk dapat dibuang dari model regresi ganda dengan hipotesis



Sumber Keragaman



H0 : βk = 0 (Xk dapat dikeluarkan) H1 : βk ≠ 0 (Xk tidak dapat dikeluarkan)



JK



Yˆ = −1,496 + 0,8572 X 1 db



KT



Regresi



JKR(X1)=352,27



1



352,27



Galat



JKG(X1)=143,12 )=143 12



18



7 95 7,95



Total



495,39



19



b) Regresi Y terhadap X2 : Sumber Keragaman



JK



Yˆ = −23,634 + 0,8565 X 2 db



KT



Regresi



JKR(X2)=381,97



1



381,97



Galat



JKG(X2)=113,42



18



6,30



Total



495,39



19



3



4



c) Regresi  ) R i Y terhadap X  t h d  X1 dan X d  X2 : Yˆ = −19,174 + 0,2224 X 1 + 0,6594 X 2 Sumber Keragaman



JK



db



KT



Regresi



JKR(X1,X2)=385,44



2



192,72



Galat



JKG(X1,X2)=109,95



17



6,47



Total



495,39



19



Perhatikan bahwa JKG bila X1 dan X2 dalam model ditulis sebagai JKG(X1, X2)=109,95 lebih kecil dari JKG bila di dalam model hanya ada X1 saja yaitu JKG(X1)=143,12. Selisih kedua jumlah kuadrat yaitu JKG(X1)-JKG(X1,X2) disebut j l h kuadrat jumlah k d t ekstra k t dan d dilambangkan dil b k oleh l h JKR(X2|X1). )



d) Regresi Y terhadap X1 , X2 dan X3 : Yˆ = 117,08 + 4,334 X 1 − 2,857 X 2 − 2,186 X 3 Sumber Keragaman



JK



db



KT



Regresi



JKR(X1,X2,X3)=396,98



3



132,33



Galat



JKG(X1,X X2,X X3)=98,41 )=98 41



16



6 15 6,15



Total



495,39



19



JKR(X2|X1) mencerminkan pengurangan JKG bagi X2 bila X1 sudah ada di dalam model JKR(X2|X1) = JKG(X1)-JKG(X1,X2) JKR(X1|X2) = JKG(X2)-JKG(X1,X2) JKR(X2,X3|X1) = JKG(X1)-JKG(X1,X2,X3)



5



6



Definisi-definisi



Data Lemak Tubuh



JKR(X1|X2))=JKG(X JKG(X2))-JKG(X JKG(X1,X2) setara dengan JKR(X1|X2)=JKR(X1,X2)-JKR(X2) JKR(X2|X1)=JKG(X1)-JKG(X1,X2) setara dengan JKR(X2|X1)=JKR(X1,X X2)-JKR(X ) JKR(X1) Perluasan JKR(X3|X1,X2)=JKG(X1,X2) -JKG(X1,X2,X3) JKR(X3|X1,X X2)=JKR(X ) JKR(X1,X X2,X X3) -JKR(X JKR(X1,X X2) JKR(X2,X3|X1)=JKG(X1) -JKG(X1,X2,X3) JKR(X2,X3|X1)=JKR(X1,X2,X3) -JKR(X1)



i



X1



X2



X3



Y



i



X1



X2



X3



Y



1



19,5



43,1



29,1



11,9



11



31,1



56,6



30,0



25,4



2



24,7



49,8



28,2



22,8



12



30,4



56,7



28,3



27,2



3



30,7



51,9



37,0



18,7



13



18,7



46,5



23,0



11,7



4



29,8



54,3



31,1



20,1



14



19,7



44,2



28,6



17,8



5



19,1



42,2



30,9



12,9



15



14,6



42,7



21,3



12,8



6



25,6



53,9



23,7



21,7



16



29,5



54,4



30,1



23,9



7



31,4



58,5



27,6



27,1



17



27,7



55,3



25,7



22,6



8



27,9



52,1



30,6



25,4



18



30,2



58,6



24,6



25,4



9



22,1



49,9



23,2



21,3



19



22,7



48,2



27,1



14,8



10



25,5



53,5



24,8



19,3



20



25,2



51,0



27,5



21,1



X1 : Ketebalan Lipatan Kulit Trisep p p X2 : Lingkar Paha



X3 : Lingkar Lengan g g Y   : Lemak Tubuh



7



Uji Apakah Semua βk = 0



Tabel ANOVA dengan Penguraian JKR Data Lemak Tubuh Sumber Keragaman



JK



db



KT



JKR(X1,X2,X3)=396,98



3



132,33



JKR(X1)=352,27 JKR(X2|X1)=33,17 JKR(X3|X1,X2)=11,54



1 1 1



352,27 33,17 11,54



Galat



JKG(X1,X2,X3)=98,41



16



6,15



Total



JKT=495,39



19



Regresi X1 X2|X1 X3|X1,X2



8



Hipotesis : H0 : β1 = β2 = … = βpp-11 = 0 H1 : Tidak semua βk (k=1, …, p-1) sama dengan nol Taraf nyata y :α Statistik Uji : JKR X 1 , L , X p −1 JKG X 1 , L , X p −1 KTR F= : = p −1 n− p KTG



(



)



(



)



Kriteria Keputusan : H0 ditolak jika Fhit > Fα(p-1,n-p)



Dari data Lemak Tubuh, Tubuh untuk mempelajari hubungan antara banyaknya lemak tubuh (Y) dengan ketebalan lipatan kulit intersep (X1), lingkar paha (X2) dan lingkar lengan (X3) yang didasarkan pada suatu contoh 20 perempuan sehat berusia 25-34 tahun. Diperoleh persamaan regresi dugaanya :



Yˆ = 117,08 + 4,334 X 1 − 2,857 X 2 − 2,186 X 3 9



Uji Apakah Satu βk = 0



Uji Apakah Beberapa βk = 0 Hipotesis : H0 : βq= βq+1 = …= βp-1= 0 H1 : Tidak semua βk di dalam H0 sama dengan nol Taraf nyata : α Statistik Uji : JKR X q , K , X p −1 X 1 , K , X q −1 JKG X 1 , K , X p −1 F= : p−q n− p



Hipotesis : H 0 : β k= 0 H 1 : β k≠ 0 Taraf nyata : α St ti tik Uji : Statistik



JKR(X k X 1 , L , X k −1 , X k +1 , L , X p −1 ) JKG (X 1 , L , X p −1 ) F= : 1 n− p =



10



KTR (X k X 1 , L , X k −1 , X k +1 , L , X p −1 )



=



KTG



Kriteria Keputusan : H0 ditolak jika Fhit > Fα(1,n-p)



(



)



(



)



KTR X q , K , X p −1 X 1 , K , X q −1



(



)



KTG



Kriteria Keputusan : H0 ditolak jika Fhit > Fα(p-q,n-p) 11



12



Dari Data Lemak Tubuh



Dari Data Lemak Tubuh



Ingin diketahui apakah lingkar lengan (X3) dapat dikeluarkan dari model regresi penuh.



Ingin diketahui apakah lingkar paha (X2) dan lingkar lengan (X3) dapat dikeluarkan dari model regresi penuh.



Hipotesis H0 : β3= 0 H1 : β3≠ 0 ƒ Taraf nyata : α = 0,05 0 05 JKR( X 3 X 1 , X 2 ) JKG ( X 1 , X 2 , X 3 ) ƒ Statistik Uji : F = : ƒ



=



Hipotesis: H0 : β2= β3 =0 H1 : Tidak benar bahwa β2 dan β3 keduanya sama dengan nol Taraf nyata : α = 0,01 Statistik Uji : F = JKR(X , X X ) : JKG( X , X , X )



n−4



1 KTR ( X 3 X 1 , X 2 )



2



KTG



Kriteria Keputusan : n = 20, p=4, F0,05(1,16)=4,49 H0 ditolak jika Fhit > 4,49 4 49 ƒ Hitungan : F=(11,54/1)/(98,41/16)=1,876 ( , / )/( , / ) , ƒ Kesimpulan : Karena Fhit=1,876 6,23 Hitungan : F=(44,71/2)/(98,41/16)=3,63 Kesimpulan : Karena Fhit=3,63 2,201 Hitungan : thit = -4,249/0,606 = -7,012 Kesimpulan : Karena |thit| = 7,012 > 2,201 maka H0 ditolak. β2 ≠ 0. Jadi dengan taraf nyata 0,05 dapat disimpulkan bahwa pengaruh g ada,, sehingga gg suku kuadratik harus kuadratik memang dipertahankan di dalam model.



Y = 705.5 + 54.89 xi - 4.249 xi**2 850



10



650 600



Hitungan: F = 3033/61,7 = 49,2 Kriteria Keputusan : F0,05(1,11) = 4,84 H0 ditolak d l k jika k Fhit > 4,84 (thit)2 = (-7,012)2 = 49,2 = Fhit



550 500 -3 3



-2 2



-1 1



0 xi



1



2



3



11



12



Koefisien Determinasi Ganda



Uji Kecocokan Model Regresi Polinomial Kuadratik Hipotesis H0 : E{Y} = β0+β1x+β2x2 (model regresi polinomial kuadratik cocok digunakan) H1 : E{Y} ≠ β0+ β1x+β2x2 (model ( d l regresii polinomial li i lk kuadratik d ik tidak id k cocok k di digunakan) k )



R2 = JKR(x,x2)/JKT = 171773/172453 = 0,996 Artinya keragaman volume penjualan kopi bisa diturunkan p 99,6% , bila hubungan g polinomial kuadratik terhadap p p sampai banyaknya mesin dispenser dimasukkan ke dalam model.



Taraf nyata : α Statistik Uji:



(



F=



k ⎛ ni 2⎞ JKGM = ∑ ⎜⎜ ∑ (Yij − Y j ) ⎟⎟ j =1 ⎝ i =1 ⎠



JKKM /(k − p ) JKGM /( n − k )



)



JKG x, x 2 = ∑ Yi 2 − b0′ ∑Yi − b1′ ∑ xi Yi − b2′ ∑ xi2Yi



(



)



JKKM = JKG x, x 2 − JKGM Kriteria keputusan p : k = banyaknya y y xy yang g berbeda,, p = banyaknya parameter H0 ditolak jika Fhit > Fα(k-p, n-k)



13



14



Soal 2



Soal 1 Data Studi Efisiensi Bahan Bakar Keefektifan suatu persneling baru dalam menurunkan konsumsi b h bakar. bahan b k Xi : kecepatan konstan (dalam km per jam) Yi : km per liter yang diperoleh



Suatu penelitian ingin menyelidiki apakah ada hubungan kuadratik antara berat larva (X) dengan banyaknya oksigen yang dikonsumsi (Y). Data yang diperoleh sebagai berikut:



i



1



2



3



4



5



6



7



8



9



10



11



12



Xi



35



35



40



40



45



45



50



50



55



55



60



60



Yi



22



20



28



31



37



38



41



39



34



37



27



30



a. Buatlah diagram pencar antara X dan Y! Apa yang diketahui dari diagram tsb? b. Tentukan koefisien korelasi antara X dengan X2. c. Bila diperlukan, lakukan transformasi terhadap X. d Apakah model regresi kuadratik cocok digunakan? d. Gunakan α = 0,05



X



Y



X



0,519



0,610



0,114



0,477



Y



0,033



X



0,744



Y



0,140



X



0,855



Y



0,053



0,482



0,137



0,551



0,049



0,711



0,204



0,932



0 190 0,190



0 516 0,516



0 230 0,230



0 588 0,588



0 210 0,210



0 927 0,927



0 265 0,265



0 914 0,914



0,210



0,561



0,240



0,561



0,215



0,914



0,346



0,973



0,260



0,580



0,470



0,718



0,462



1,000



0,544



0,800



0,389



0,674



0,521



0,754



0,468



0,998



0,004



0,654



a. Buatlah tabel Anava untuk regresi polinomial kuadratik b Tentukan b. T t k persamaan regresii polinomial li i l kuadratik k d tik d dugaan c. Apakah model regresi polinomial kuadratik cocok digunakan? 15



Soal 4



Soal 3



Suatu penelitian telah dilakukan untuk mengetahui hubungan antara tentang tes kemampuan bahasa (X) dan nilai karya ilmiah (Y) dari 10 siswa kelas I SMA. Diduga bahwa model regresi polinomial kuadratik cocok digunakan. Diketahui:



Untuk mengetahui hubungan antara pengeluaran untuk promosi (X, dalam ribuan dolar) dan permintaan akan produk perusahaan (Y, (Y dalam ribuan dolar) di suatu daerah telah dilakukan penelitian dan p data sbb : diperoleh i



1



2



3



4



5



6



7



8



9



10



11



12



13



14



Xi



17



15



25



10



18



15



20



25



17



13



20



23



25



16



Yi



56, 15



54, 50



55, 27



52, 56, 55, 54 23 97



55, 55



54, 32



55, 14



54, 28



55, 55, 78 65



54, 96



55, 06



− 0,006212 − 0,002259⎤ 0,0032523 0,0001725 ⎥⎥ ⎢⎣− 0,002259 0,0001725 0,0000627 ⎥⎦ ⎡ 0,1813176



(x′x )−1 = ⎢⎢− 0,006212 ∑Y



i



a. Gambarkan diagram pencarnya pencarnya!! b. Tentukan persamaan regresi kuadratik dugaan! dugaan! c. Ujilah ketidakcocokan model regresi kuadratik! kuadratik! Gunakan α = 0,05



= 458, ∑ Yi 2 = 21604, ∑ xiYi = 304, ∑ xi2Yi = 17252 , ∑ xi2 = 360, ∑ xi4 = 31620



a) Tentukan persamaan regresi polinomial kuadratik dugaan. b) Tentukan koefisien determinasi ganda dan berikan maknanya. c) Apakah suku kuadratik dapat dibuang dari model? Gunakan α = 0,05. 0 05 17



MODEL REGRESI POLINOMIAL ORDE KEDUA



Y = β 0 + β1 x1 + β 2 x 2 + β11 x12 + β 22 x 22 + β 12 x1 x 2 + ε REGRESI POLINOMIAL DUA PEUBAH BEBAS, ORDO KEDUA



E{Y } = β 0 + β1 x1 + β 2 x 2 + β11 x12 + β 22 x 22 + β12 x1 x 2



Y = β 0 + β 1 x1 + β 2 x 2 + β11 x12 + β 22 x 22 + β12 x1 x 2 + ε



ε ~ N (0, σ 2 ) iid



1



Apakah model regresi polinomial orde kedua cocok digunakan? 2



x1 =



CONTOH



X 1 − X 1 X 1 − 1,0 = 0,4 0,4



x2 =



X 2 − X 2 X 2 − 20 = 10 10



i



X1



X2



x1



x2



Y



Yj



1 2 3 4 5 6 7 8 9 10 11



0,6 1,0 1,4 0,6 1,0 1,0 1,0 1,4 06 0,6 1,0 1,4



10 10 10 20 20 20 20 20 30 30 30



-1 0 1 -1 0 0 0 1 -1 1 0 1



-1 -1 -1 0 0 0 0 0 1 1 1



150 86 49 288 157 131 184 109 279 235 224



150 86 49 288



X 1 = 1,0



X 2 = 20



UJI KECOCOKAN MODEL REGRESI POLINOMIAL ORDE KEDUA Hi t i Hipotesis H0 : E{Y} = β0+β1x1+β2x2+β11x12+β22x22+β12x1x2(model regresi polinomial orde kedua cocok digunakan) H1 : E{Y} ≠ β0+β1x1+β2x2+β11x12+β22x22+β12x1x2 (model regresi polinomial orde kedua tidak cocok digunakan) Taraf nyata : α Statistik Uji:



157,33



F=



109 279 235 224



JKKM /(k − p ) JKGM /(n − k )



k ⎛ ni 2⎞ JKGM = ∑ ⎜⎜ ∑ (Yij − Y j ) ⎟⎟ j =1 ⎝ i =1 ⎠



JKKM = JKG − JKGM



3



Kriteria keputusan : k = banyaknya x yang berbeda, p = banyaknya parameter H0 ditolak jika Fhit h > Fα(k-p, (k n-k) k)



4



ANOVAb Model 1



Regression Residual Total



Sum of Squares 55365.561 5240.439 60606.000



df 5 5 10



Mean Square 11073.112 1048.088



F 10.565



Sig. .011a



a. Predictors: (Constant), x1x2, x2kuadrat, x2, x1, x1kuadrat b. Dependent Variable: Y



JKGM=(157-157,33)2+(131-157,33)2+(184-157,33)2=1404,676 JKKM=JKG-JKGM=5240-1404,67=3835,33 db1 = k-p = 9-6 = 3 db2 = n-k = 11-9 = 2 F0,05(3,2)=19,2, 19 2 H0 ditolak dit l k jika jik Fhit > 19,2 19 2



ANOVAb Model 1



Regression Residual Total



Sum of Squares 55365 561 55365.561 5240.439 60606.000



df 5 5 10



Mean Square 11073 112 11073.112 1048.088



a. Predictors: (Constant), x1x2, x2kuadrat, x2, x1, x1kuadrat b. Dependent Variable: Y



F 10 565 10.565



Fhit=(3835,33/3)/(1404,675/2)=1,82



Sig. .011 011a



Karena Fhit=1 1,82 Fα(1, n-p)



) (n − p )



F=



Y = β 0 + β1 x1 + β 2 x2 + β11 x12 + ε Bagaimana untuk uji β11 = 0 atau tidak?



Hipotesis: H0 : β11 = β22 = β12 = 0 H1 : tidak semua βk (k = 11, 22, 12) dalam H0 sama dengan nol Taraf nyata : α Statistik Uji : JKR (x12 , x22 , x1 x2 x1 , x2 ) 3



9



11



(



JKG x1 , x2 , x12 , x22 , x1 x2



Kriteria Keputusan H0 ditolak jika Fhit > Fα(3, n-p)



) (n − p )



10



Latar Belakang • Ingin membandingkan prestasi belajar murid perempuan dan laki-laki • Ingin meneliti bagaimana pengaruh jenis makanan terhadap berat ayam y • Jenis kelamin dan jenis makanan merupakan peubah yang sifatnya klasifikasi • Semua peubah dalam regresi bersifat kuantitatif maka peubah kualitatif dijadikan kuantitatif agar regresi dapat digunakan



DUMMY VARIABLE ((Peubah Boneka)) Dosen Pengampu : Kismiantini Kismiantini,, M.Si M.Si..



1



2



Perhatikan kasus berikut • Dua kelompok murid yang mempunyai tingkat inteligensi yang kira-kira sama diberikan dua metode mengajar yang b b d Kelompok berbeda. K l k pertama t dib i metode diberi t d yang biasa bi sedangkan yang kedua diberikan metode yang modern. Kelompok I



Kelompok II



i



Y



X



i



Y



X



1 2 3 4 5 6 7 8 9 10



81 69 51 59 56 78 53 65 53 57



103 104 92 100 98 105 99 102 101 99



11 12 13 14 15 16 17 18



92 84 76 72 60 81 72 52



105 106 103 98 92 101 101 92



Y : nilai hasil ujian akhir X : skor IQ



• Bila regresi linear sederhana antara X dan Y digunakan, diperoleh persamaan regresi dugaannya : Ŷ = -145,5578 + 2,1272 X • dengan R2 = 53,70%



• Apa yang salah dalam hal ini ini? ?



3



4



Tabel diatas dapat disajikan sebagai berikut No



Y



X1



X2



1



81



0



103



2



69



0



104



3



51



0



92



4



59



0



100



5



56



0



98



6



78



0



105



7



53



0



99



8



65



0



102 0



9



53



0



101



10



57



0



99



11



92



1



105



12



84



1



106



13



76



1



103



14



72



1



98



15



60



1



92



16



81



1



101



17



72



1



101



18



52



1



92



dengan



p I ⎧0 bila murid masuk kelompok X1 = ⎨ ⎩1 bila murid masuk kelompok II Sehingga diperoleh persamaan regresi sebagai berikut : Ŷ = -160,5817 + 12,6466 X1 + 2,2212 X2 dengan R2 = 79,25%. Terlihat bahwa kecocokan model 2 lebih baik dari model 1, R2 naik sekitar 25,55%. (Keterangan model 1 adalah model regresi linear sederhana, model 2 adalah model regresi linear ganda dengan dua peubah bebas). Untuk kelompok I, masukkan X1 = 0, maka diperoleh : Ŷ = -160,5817 + 2,2212 X2 Untuk kelompok II, masukkan X1 = 1, maka diperoleh : Ŷ = -147,9351 + 2,2212 X2



5



Dari gambar tersebut dapat diketahui bahwa metode yang modern terlihat jauh lebih baik atau efektif d l dalam meningkatkan i k tk prestasi t i belajar b l j murid. id 6



Persamaan Normal (2 peubah bebas)



Misalkan ada tiga metode mengajar yang ingin dibandingkan maka diperlukan dua peubah boneka sebagai berikut :



b0 n + b1 ∑ X i1 + b2 ∑ X i 2 = ∑ Yi



b0 ∑ X i1 + b1 ∑ X i21 + b2 ∑ X i1 X i 2 = ∑ X i1Yi



⎧0 bila murid masuk kelompok I atau III X1 = ⎨ ⎩1 bila murid masuk kelompok II



b0 ∑ X i 2 + b1 ∑ X i1 X i 2 + b2 ∑ X i22 = ∑ X i 2Yi



Koefisien Determinasi Ganda ⎧0 bila murid masuk kelompok I atau II X2 = ⎨ ⎩1 bila murid masuk kelompok III



R2 = JKR/JKT = 1- (JKG/JKT) ⎛1⎞ JKT = Y ' Y − ⎜ ⎟Y ' J Y ⎝n⎠



JKG = Y ' Y − b' X ' Y 7



Sehingga misalkan ada 30 murid yang terbagi dalam tiga kelompok tiap kelompok terdiri atas 10 murid kelompok, murid. Maka nilai X1 dan X2 yang mungkin terbentuk sebagai berikut Kelompok p



i



X1



X2



I



1 2 . . . 10



0 0 . . . 0



0 0 . . . 0



II



11 12 . . . 20



1 1 . . . 1



0 0 . . . 0



III



21 22 . . . 30



0 0 . . . 0



1 1 . . . 1



9



perempuan mempunyai nilai ujian matematika tahun pertama di suatu universitas dan nilai matematika pada rapor kelas 3 SMA sebagai berikut : Jenis kelamin



Nilai Matematika Ujian



Rapor



1



L



3



7



2



L



2



8



3



L



4



9



4



L



3



6



5



L



1



7



6



L



2



8



7



P



3



7



8



P



2



6



9



P



2



8



10



P



3



5



11



P



0



9



Soal 1: Suatu penelitian telah dilakukan untuk mengetahui adanya p perbedaan penggajian p gg j ((diskriminasi)) terhadap p karyawan y wanita dan p pria di suatu perusahaan. Karyawan yang diteliti adalah yang memiliki tingkat pendidikan yang sama. Pria



Soal 2: Enam mahasiswa laki-laki dan lima mahasiswa



i



8



a. Tentukan persamaan regresi dugaan yang sesuai untuk permasalahan tsb. tsb b. Buat gambar garis regresi untuk masing-masing jenis kelamin mahasiswa. Apa yang dapat disimpulkan.



Wanita



i



Gaji (dalam ratusan ribu per minggu)



Lama Bekerja (tahun)



1 2 3 4 5 6 7 8 9 10 11



28 28 28 21 28 29 33 36 39 39 43



1 2 4 6 6 8 15 20 25 24 30



i



Gaji (dalam ratusan ribu per minggu)



Lama Bekerja (tahun)



12 13 14 15 16 17 18 19 20 21



20 24 21 28 23 25 23 21 25 26



1 3 4 6 9 11 17 19 23 28



a. Tentukan p persamaan regresi g dugaan g yang y g sesuai untuk p permasalahan tsb. b. Buat gambar garis regresi untuk masing-masing jenis kelamin karyawan. Apa 10 yang dapat disimpulkan.



Soal 3 Berikut B ik adalah d l h data d sampell tentang hubungan h b antara lama l b l j belajar (dalam jam per minggu) terhadap nilai akhir ujian suatu mata g terdiri dari enam mahasiswa lakikuliah dari 12 mahasiswa yyang laki (L) dan enam mahasiswa perempuan (P). Pengamatan Lama belajar Nilai akhir ujian Jeniss kelamin Je ea



1 4 9 L



2 3 7 L



3 3 8 L



4 9 10 L



5 5 7 L



6 2 7 L



7 6 9 P



8 5 8 P



9 6 8 P



10 4 6 P



11 8 10 P



12 5 6 P



a)Tentukan persamaan regresi dugaan yang sesuai untuk permasalahan tersebut. p b)Buat gambar garis regresi untuk masing-masing jenis kelamin mahasiswa. Apa yang dapat disimpulkan. 11



12



Alasan jika ada k kategori maka ada k-1 peubah boneka



Yan, X. & Su, X.G. 2009.Linear regression analysis : theory and computing. New Jersey: World Scientific Publishing. Publishing 13



REGRESI NON LINEAR



2 1



Model Kuadratik



Model Kubik



2 Persamaan regresi dugaan : Yˆ = b0 + b1 X + b2 X



Persamaan regresi dugaan : Persamaan normal :



Persamaan normal :



nb0 + b1 ∑ X i + b2 ∑ X i2 = ∑Yi



nb0 + b1 ∑ X i + b2 ∑ X i2 + b3 ∑ X i3 = ∑Yi



x=X −X



b0 ∑ X i + b1 ∑ X + b2 ∑ X = ∑ X iYi 2 i



3 i



x=X −X



b0 ∑ X i + b1 ∑ X i2 + b2 ∑ X i3 + b3 ∑ X i4 = ∑ X iYi



b0 ∑ X i2 + b1 ∑ X i3 + b2 ∑ X i4 +b3 ∑ X i5 = ∑ X i2Yi



b0 ∑ X i2 + b1 ∑ X i3 + b2 ∑ X i4 = ∑ X i2Yi



b0 ∑ X i3 + b1 ∑ X i4 + b2 ∑ X i5 +b3 ∑ X i6 = ∑ X i3Yi



Data :



Data :



Yˆ = −1,761+ 9,498X − 0,5467X 2



Yˆ = −4,805+12,13X −1,115X 2 + 0,0344X 3 3



3



4



Model Eksponensial Persamaan regresi dugaan : Mencari b0 dan b1 : l b0 = ln



∑ ln Y − (ln ∑X l b) i



n



1



i



n



Data :



X Yˆ = b0 b1



ln Yˆ = ln b0 + (ln b1 )X ln b1 =



n(∑ X i ln Yi ) − (∑ X i )(∑ ln Yi )



Model Geometrik (Power) Persamaan regresi dugaan : Mencari b0 dan b1 : ln b0 =



n∑ X i2 − (∑ X i )



2



∑ ln Y



i



n



− b1



∑ ln X



i



b1 =



n



Data



Yˆ = (377,495) X −0,286



Yˆ = (11,240)(e 0,159 ) X 5



Yˆ = b0 + b1 X + b2 X 2 + b1 X 3



6



Yˆ = b0 X b1



ln Yˆ = ln b0 + b1 ln X



n(∑ ln X i ln Yi ) − (∑ ln X i )(∑ ln Yi ) n∑ ln 2 X i − (∑ ln X i )



2



Yˆ =



Model Logistik



1 b0 b1



Model Hiperbola



X



Yˆ =



Persamaan regresi dugaan : ⎛1⎞ ln⎜ ⎟ = ln b0 + (ln b1 )X Mencari b0 dan b1 : ⎝ Yˆ ⎠ ( ) ln 1 Y X ( n ∑ i − (ln b ) ∑ i lnl b = ∑ X i ln(1 Yi )) − (∑ X i )(∑ ln(1 Yi )) ln b0 = 1 1 2 2



Persamaan regresi dugaan : Mencari b0 dan b1 : ∑ (1 Yi )(∑ X i2 ) − (∑ X i )(∑ X i Yi )



Data :



Data :



n



b0 =



n∑ X i − (∑ X i )



n



1 b0 + b1 X



1 = b0 + b1 X , jika Yˆ ≠ 0 Yˆ



n∑ X i2 − (∑ X i )



2



b1 =



n(∑ X i Yi ) − (∑ X i )∑ (1 Yi ) n∑ X i2 − (∑ X i )



2



160 140 120



Y



100 Y



80



Yduga



60 40 20



Yˆ =



1 (0,089)(0,853) X



Yˆ =



7



0



1 0,0066+ 0,000013X



0



500



1000



1500



2000



X



8



Soal 1



Soal 2



Suatu perusahaan yang mengalami kemunduran ditunjukkan oleh merosotnya hasil h il penjualan j l dari d i tahun h ke k tahun h sebagai b i berikut: b ik T h Tahun



2001



2002



2003



2004



2005



2006



X : harga barang per unit dalam ribuan rupiah Y : hasil penjualan barang tersebut dalam jutaan rupiah



2007



Kode Tahun



1



2



3



4



5



6



7



Hasil Penjualan (dalam jutaan rupiah)



83



60



54



21



22



13



13



X



20



35



60



100



150



300



500



800



Y



150



125



105



100



92



77



62



58



Dengan menggunakan model eksponensial, berapa prediksi hasil penjualan j l kalau k l X = 900? Gambarkan G b k grafik fik Y dan d Ŷ dalam d l satu t gambar.



Dengan menggunakan D k model d l kuadratik, k d tik tentukan t t k b berapa prediksi dik i hasil penjualan untuk tahun 2008 dan 2009? Gambarkan grafik Y dan Ŷ dalam satu gambar.



9



Soal 3



10



Soal 4



X = kecepatan (dalam km) ketika rem mulai diinjak Y = jarak (dalam m) yang masih ditempuh mobil dihitung mulai rem diinjak hingga berhenti. Pemeriksaan jarak berhenti sejak mobil direm pada tiap kecepatan tidak dilakukan hanya sekali melainkan berulang-ulang berulang ulang atau terhadap beberapa mobil. Hasilnya seperti berikut: X



10



20



30



40



50



60



70



80



Y



9,2 8,7 , 9,0 8,9



16,4 15,2 , 16,7



27,3 28,2 , 26,8 27,0



41,8 40,2 ,



62,4 63,1 , 60,9



88,5 86,2 ,



120,0 119,1 , 120,4



141,8 140,1 , 138,9



Selidikilah model regresi mana yang lebih tepat diantara: a. Eksponen c. Logistik e. Kubik b. Geometrik d. Hiperbola



Perkembangan industri rumah tangga dari suatu daerah selama 6 tahun, h adalah d l h sebagai b i berikut: b ik



Tahun



2002



2003



2004



2005



2006



2007



Kode Tahun



2



3



4



5



6



7



Banyaknya industri



4



8



12



18



18



20



Dengan menggunakan model logistik, berapa prediksi banyaknya industri rumah tangga pada tahun 2010. 2010 Gambarkan grafik Y dan Ŷ dalam satu gambar.



11



12



Soal 5



Tabel Model Regresi



Suatu penelitian yang bertujuan untuk menentukan model regresi yang paling li tepat dari d i empat kemungkinan k ki yaitu, i model d l linear, li model kuadrat, model akar serta model logaritmik dalam mengetahui pengaruh dari beberapa faktor yang berpengaruh terhadap produktivitas tenaga kerja di suatu industri kecil. Jumlah observasi ada 168. Data produksi per orang per minggu diperoleh p produktivitas (Y), lama bekerja p j dari industri kecil tersebut meliputi (X1), umur (X2), pendidikan (X3).



Model regresi Linear



Yˆ = 15457,77 + 25,33 X 1 + 19,72 X 2 + 225,22 X 3



Kuadrat



((9,00)) ((0,14)) ( (0,33) ) ((1,62)) R2 = 0,018; F = 1,01 Yˆ = 30783,70 + 846,30 X 1 − 1107,20 X 2 − 784,20 X 3 − 61,90 X 12 + 18,00 X 22 + 119,10 X 32



Akar



• T Tentukan t k model d l regresii yang terbaik t b ik dari d i beberapa b b model d l yang telah dicobakan dengan memperhatikan nilai thitung, koefisien determinasi (R2) dan nilai Fhitungg pada tabel diatas. Gunakan taraf nyata 0,05 bila diperlukan melakukan pengujian.



Logaritmik



P Persamaan regresii dugaan, d nilai il i uji ji t dalam d l kurung, k R2, F



((5,79) , ) ((1,02) , ) ((2,80) , ) ((1,48) , ) ((0,89) , ) ((2,75) , ) ((2,18) , ) R2 = 0,174; F = 2,13 1 1 1 Yˆ = 72602,7 − 232 X 1 + 2005 X 2 + 1534 X 3 + 1896 X 1 2 − 21770 X 2 2 − 3886 X 3 2



(3 63) (3,63) (0 20) (2,72) (0,20) (2 72) (2 94) (2,94) (0 36) (0,36) R2 = 0,173; F = 2,15 ln Yˆ = 9,90 + 0,013 ln X 1 − 0,068 ln X 2 + 0,002 ln X 3 (27 7) (0,22) (27,7) (0 22) R2 = 0,006; F = 0,32



13



(0 54) (0,54)



(2 77) (2,77)



(2 44) (2,44)



(0 25) (0,25)



14



Latar Belakang • Regresi logistik adalah bagian dari analisis regresi yang di digunakan k k ik peubah ketika b h dependen d d ( (respons) ) merupakan k peubah dikotomi. Peubah dikotomi biasanya hanya terdiri atas dua nilai, nilai yang mewakili kemunculan atau tidak adanya suatu kejadian yang biasanya diberi angka 0 atau 1.



REGRESI LOGISTIK REGRESI LOGISTIK



1



Model Regresi Linear Sederhana → Peubah respons biner



2



• Nilai Harapan bagi Yi E(Yi) = 1(πi) + 0(1‐ πi) = πi Sehingga 0 ≤ E(Yi) ≤ 1.



Yi = β0 + β1Xi + εi , Yi = 0, 1 Karena E(εi) = 0 maka E(Yi ) = β0 + β1Xi Yi merupakan peubah acak Bernoulli, sehingga fungsi peluangnya Yi Peluang 1 P(Yi = 1)  1) = π πi 0 P(Yi = 0) = 1‐ πi dengan πi menyatakan d k peluang l b h Yi = 1, dan bahwa 1 d 1‐π 1 i menyatakan k peluang bahwa Yi = 0. 



3



4



• Karena pengamatan Yi  saling bebas, maka fungsi peluang bersama adalah d l h



Model Regresi Model  Regresi Logistik Sederhana • Model regresi logistik sederhana: Yi = E(Yi) + εi , dengan Yi  mer pakan peubah merupakan pe bah acak Bernoulli dengan Berno lli dengan E(ε E( i ) = 0. ) 0 E (Yi ) = π i =



exp(β 0 + β1 X i ) 1 + exp(β 0 + β1 X i )



• Untuk mempermudah estimasi parameter dengan metode maksimum likelihood maka



• Peubah X diasumsikan konstanta yang diketahui. Bernoulli dengan fungsi peluang • Yi i merupakan peubah acak Bernoulli dengan



5



6



Data Tugas Pemrograman (Hal 566)



• Sehingga fungsi likelihood adalah sebagai berikut



• Peubah bebas adalah pengalaman pemrograman dalam bulan.  Peubah tak bebas (peubah respons) adalah kesuksesan program,  dengan 1 = sukses, 0 = gagal. • Dengan estimasi maksimum likelihood diperoleh



• Selanjutnya diturunkan terhadap masing‐masing parameter dan dimaksimumkan Sehingga diperoleh penduga bagi β0 yaitu b0 dan dimaksimumkan. Sehingga penduga bagi β1 yaitu b1. g respons p logistik g dugaan g adalah • Fungsi



Fungsi respons logistik dugaan



πˆ =



exp(− 3,0597 + 0,1615 X ) 1 + exp(− 3,0597 + 0,1615 X )



• Misalkan seseorang selama 14 bulan 14 bulan berpengalaman dalam pemrograman maka peluang suksesnya adalah …………………….. 7



8



Rasio Odds (Odds Ratio Odds (Odds Ratio)) • Secara umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio peluang bagi prediktor (peubah bebas) diartikan sebagai jumlah relatif dimana peluang hasil meningkat (rasio peluang > 1) atau turun (rasio peluang l < 1) ketika k ik nilai il i peubah b h prediktor dik meningkat i k sebesar b 1 unit. i • Pada data tugas pemrograman, diperoleh rasio odds ∧



OR = exp(0,1615) = 1,175 • Peluang menyelesaikan tugas naik sebesar 17,5% 17 5% = (117,5‐100)% (117 5‐100)% untuk setiap kenaikan 1 bulan pengalaman pemrograman. 9



10



Soal (Data kemampuan (Data kemampuan bekerja bekerja)  ) 



Regresi Logistik dg SPSS



Seorang psikologi ingin mengetahui hubungan antara stabilitas emosi karyawan (X) dan kemampuan karyawan bekerja dalam kelompok (Y). Stabilitas emosi diukur dengan uji tertulis dengan semakin tinggi skor menyatakan k stabilitas bili emosii semakin ki tinggi. i i Kemampuan K b k j dalam bekerja d l kelompok (Y = 1 jika dapat, Y = 0 jika tidak dapat) dievaluasi oleh supervisor. Berikut data dari 27 karyawan :



11



i



1



2



3



4



5



6



7



8



9



10



11



12



13



Xi



474



432



453



320



356



532



587



423



552



403



502



321



453



14 579



Yi



0



0



1



0



1



1



0



0



1



0



0



1



0



0



i



15



16



17



18



19



20



21



22



23



24



25



26



27



Xi



537



402



592



320



337



589



513



413



572



422



562



506



600



Yi



1



0



1



0



1



1



0



0



1



0



1



0



1



12



Dimisalkan model regresi logistik dapat digunakan. a. Tentukan fungsi respons dugaan. b. Buatlah plot pencar dari data dan fungsi respons logistik dugaannya. Apakah fungsi respons dugaan cocok? c. Tentukan exp(b1) dan berikan maknanya. d Berapa peluang d. l b h karyawan bahwa k d dengan skor k stabilitas bili emosii 550  akan dapat bekerja dalam kelompok?



Model Regresi Model  Regresi g Logistik g Berganda g • Yi merupakan peubah acak Bernoulli



• Sehingga S hi nilai il i harapan h d i Yi adalah dari d l h



• Dengan estimasi maksimum likelihood diperoleh fungsi respons logistik g dugaan g adalah 13



14