Analisis Regresi Dengan Variabel Dummy [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

ANALISIS REGRESI DGPEUBAH BEBAS DUMMY



Analisis regresi adalah metode statistika yang digunakan untuk mempelajari bentuk hubungan antara variabel bebas dengan variabel tak bebas. Model pada analisis regresi disebut dengan model regresi. Istilah regresi pertama kali diperkenalkan oleh Francis Gulton pada tahun 1885. Jika hubungannya linier, maka analisisnya disebut analisis regresi linier. Bentuk linier model ini adalah linier dalam parameter. Analisis regresi linier dapat dibedakan menjadi analisis regresi linier sederhana dan analisis regresi linier berganda. Analisis regresi linier sederhana adalah analisis regresi yang menggambarkan hubungan antara satu variabel bebas dengan satu variabel tak bebas. Sedangkan hubungan antara satu variabel tak bebas dengan lebih dari satu variabel bebas disebut dengan analisis regresi linier berganda. [1] Variabel bebas terdiri dari variabel numerik dan kategorik. Variabel bebas kategorik dapat dibentuk menjadi variabel buatan yang mengambil nilai 0 dan 1. Variabel ini dinamakan dengan variabel dummy. Sebagai contoh, model regresi besar gaji pengajar di perguruan tinggi dengan jenis kelamin dan lama bekerja di perguruan tinggi. Pada analisis ini ingin diketahui apakah jenis kelamin mempengaruhi besarnya gaji pengajar pada perguruan tinggi, dengan mengasumsikan bahwa variabel lain seperti umur, gelar yang diperoleh, dan lain-lain tidak diperhatikan. Untuk melihat pengaruh variabel dummy pada model regresi biasanya dianalisis dengan analisis regresi berganda dengan menggunakan analisis ragam dan uji 𝑑. Variabel Dummy Pada analisis regresi, variabel tak bebas kadang-kadang dipengaruhi oleh variabel bebas yang bersifat kategorik, misalnya jenis kelamin, ras, warna kulit, suku, tingkat pendidikan, dan agama. Misalnya, dosen wanita pada perguruan tinggi ternyata menerima penghasilan yang lebih rendah dibandingkan dengan rekannya yang pria, dan pekerja yang bukan kulit putih ternyata berpenghasilan lebih rendah dari yang berkulit putih. Hal seperti 1



ini mungkin saja diakibatkan oleh diskriminasi jenis kelamin dan ras. Variabel bebas yang bersifat kategorik seperti jenis kelamin dan ras memang bisa mempengaruhi variabel tak bebas. Variabel dummy dapat digunakan dalam memodelkan permasalahan di atas dalam bentuk sebuah model regresi. Sebagai contoh, perhatikan model berikut [4] π‘Œπ‘– = 𝛼0 + 𝛼1 𝐷𝑖 + 𝛽𝑋𝑖 + πœ€π‘– dimana,



(2.3.1)



π‘Œπ‘– = besarnya penghasilan seseorang 𝑋𝑖 = lama bekerja 𝐷𝑖 = ras, dimana 𝐷𝑖 = {



1, 0,



Kulit Putih . Kulit Hitam



Dengan cara yang sama kita juga dapat mengetahui apakah jenis kelamin juga mempengaruhi penghasilan seseorang ditempatnya bekerja dengan menggunakan model sebagai berikut, π‘Œπ‘– = 𝛼0 +𝛼1 𝐷𝑖 + 𝛽𝑋𝑖 + πœ€π‘– dimana,



(2.3.2)



π‘Œπ‘– = gaji tahunan pengajar perguruan tinggi 𝑋𝑖 = lama mengajar 1, 𝐷𝑖 = jenis kelamin, dimana 𝐷𝑖 = { 0,



Pria . Wanita



Uji Koefisien Regresi Pada model regresi, uji koefisien dilakukan untuk melihat apakah ada pengaruh variabel bebas terhadap variabel tak bebas. Misalkan modelnya adalah π’š = π‘Ώπœ· + 𝜺 dengan uji hipotesis untuk model ini adalah 𝐻0 : 𝛽1 = 𝛽2 = β‹― = π›½π‘˜ = 0 𝐻1 : Ada 𝛽𝑗 β‰  0,



𝑗 = 1,2, … , π‘˜.



Sedangkan model regresi yang menggunakan variabel dummy, yaitu 2



π’š = π‘«πœΆ + π‘Ώπœ· + 𝜺 dengan uji hipotesisnya adalah 𝐻0 : 𝛼1 = β‹― = π›Όπ‘š = 𝛽1 = β‹― = π›½π‘˜ = 0 𝐻1 : Ada 𝛽𝑗 β‰  0 atau 𝛼𝑖 β‰  0, 𝑗 = 1,2, … , π‘˜ dan 𝑖 = 1,2, … , π‘š Jika 𝐻0 ditolak pada uji ini, untuk melihat pengaruh peubah bebas mana yang berpengaruh terhadap peubah tak bebas maka uji 𝐹 dilanjutkan dengan uji 𝑑 dengan menguji semua koefisien regresi.



Regresi Atas Variabel Dummy Dalam analisis regresi, variabel tak bebas tidak hanya dipengaruhi oleh variabel numerik tapi juga dengan variabel yang bersifat kategorik. Misalnya, jenis kelamin akan mempengaruhi gaji pegawai. Variabel kategorik seperti jenis kelamin (laki-laki atau perempuan), ras (kulit putih, kulit hitam, tionghoa), dan variabel kategorik lainnya tidak berupa angka. Oleh sebab itu, dibuat suatu variabel buatan yang mengambil nilai 0 dan 1. Variabel ini disebut variabel dummy (dummy variables). Terdapat berbagai kemungkinan regresi dengan variabel dummy. Pada bagian berikut akan diberikan beberapa kemungkinannya, yaitu 1. Regresi Atas Satu Variabel Bebas Numerik Dan Satu Variabel Bebas Kategorik Dengan Dua Kelas Pada bagian ini akan dibahas regresi dengan satu variabel dummy dan satu variabel bebas numerik. Model regresi yang dimaksud adalah sebagai berikut: [2] π‘Œπ‘– = 𝛼0 + 𝛼1 𝐷𝑖 + 𝛽𝑋𝑖 + πœ€π‘– dimana,



π‘Œπ‘–



(4.1.1)



= gaji tahunan pengajar perguruan tinggi



3



𝑋𝑖



= lama mengajar



𝐷𝑖



1, = jenis kelamin, dimana 𝐷𝑖 = { 0,



Pria Wanita



Model (4.1.1) di atas berisi satu variabel bebas numerik yaitu lama mengajar dan satu variabel bebas kategorik yaitu jenis kelamin yang mempunyai dua kategori, yaitu laki-laki dan wanita. Dengan mengasumsikan 𝐸(πœ€π‘– ) = 0, kita dapat melihat bahwa model untuk, Gaji pengajar perguruan tinggi wanita 𝐸 (π‘Œπ‘– |𝑋𝑖 , 𝐷𝑖 = 0) = 𝛼0 + 𝛽𝑋𝑖 ,



(4.1.2)



Gaji pengajar perguruan tinggi pria 𝐸(π‘Œπ‘– |𝑋𝑖 , 𝐷𝑖 = 1) = (𝛼0 + 𝛼1 ) + 𝛽𝑋𝑖 .



Gambar 4.1



(4.1.3)



Diagram antara gaji tahunan dan pengalaman mengajar di perguruan tinggi



Sebelum melangkah lebih lanjut, perhatikan ciri model regresi variabel dummy, yaitu 1. Untuk membedakan kedua kategori, pria dan wanita, kita hanya punya satu variabel dummy, yaitu 𝐷. Jika 𝐷 = 1 menggambarkan pria dan 𝐷 = 0 menggambarkan wanita, maka satu variabel dummy cukup untuk menggambarkan kedua kategori tersebut. Aturan umumnya adalah jika suatu variabel kategorik mempunyai m kategori, gunakan π‘š βˆ’ 1 variabel dummy. Pada contoh sebelumnya, jenis kelamin mempunyai dua kategori, jadi hanya ada satu dummy.



4



2. Penetapan nilai 1 dan 0 untuk dua kategori, seperti pria dan wanita adalah tanpa suatu dasar (bersifat berubah-ubah) dalam arti bahwa dalam contoh kita dapat menetapkan 𝐷 = 1 untuk wanita dan 𝐷 = 0 untuk pria. Dalam situasi ini, kedua regresi yang diperoleh dari (4.1.1) akan menjadi Gaji pengajar perguruan tinggi wanita 𝐸(π‘Œπ‘– |𝑋𝑖 , 𝐷𝑖 = 1) = (𝛼0 + 𝛼1 ) + 𝛽𝑋𝑖 ,



(4.1.4)



Gaji pengajar perguruan tinggi pria 𝐸(π‘Œπ‘– |𝑋𝑖 , 𝐷𝑖 = 0) = 𝛼0 + 𝛽𝑋𝑖 .



(4.1.5)



Sekarang kalau dibandingkan dengan (4.1.2) dan (4.1.3), dalam model tadi 𝛼1 mempengaruhi seberapa banyak gaji pengajar perguruan tinggi wanita dari gaji pengajar perguruan tinggi pria. Jadi, dalam menginterpretasikan hasil dari model yang menggunakan variabel dummy penting untuk mengetahui bagaimana nilai 1 dan 0 diterapkan. 3. Kelompok, kategori, atau klasifikasi yang diberi nilai 0 seringkali disebut sebagai kategori



dasar.



Jadi



dalam



model



(4.1.1)



pengajar



wanita merupakan kategori dasar. Perhatikan bahwa unsur intersep 𝛼0 adalah unsur intersep untuk kategori dasar ini, dalam arti jika kita melakukan regresi 𝐷 = 0, yaitu hanya untuk wanita saja, intersepnya adalah 𝛼0 . Juga perhatikan bahwa kategori yang berlaku sebagai kategori dasar adalah masalah pilihan yang kadang-kadang ditentukan dengan pertimbangan yang bersifat berubah-ubah. 4. Koefisien 𝛼1 yang diberikan untuk variabel dummy 𝐷 dapat disebut koefisien intersep diferensial karena koefisien tadi menyatakan berapa banyak nilai unsur intersep dari kategori yang mendapat nilai 1 berbeda dari koefisien intersep dari kategori dasar.



5



2.



Regresi Atas Satu Variabel Bebas Numerik Dan Satu Variabel Bebas Kategorik Dengan Lebih Dari Dua Kelas Kita ingin membuat model regresi pendapatan tahunan seorang pekerja terhadap tingkat pendidikan. Misalkan kita mempertimbangkan empat tingkat pendidikan yang terpisah satu sama lain, yaitu sekolah dasar, sekolah lanjutan tingkat pertama, sekolah menengah atas, dan lebih tinggi dari sekolah menengah atas atau perguruan tinggi [2], seperti yang ditunjukkan oleh tabel di bawah ini: Tabel 4.1



Tingkat Pendidikan Kategori



π‘«πŸ



π‘«πŸ



π‘«πŸ‘



SD



1



0



0



SLTP



0



1



0



SMA



0



0



1



> SMA(PT)



0



0



0



Sekarang kita mempunyai lebih dari tiga kategori. Oleh karena itu, dengan mengikuti aturan bahwa banyaknya dummy satu lebih sedikit dari banyaknya kategori variabel sehingga kita harus menggunakan tiga dummy untuk empat tingkat pendidikan, kita dapat menggunakan model berikut: π‘Œπ‘– = 𝛼0 + 𝛼1 𝐷1𝑖 + 𝛼2 𝐷2𝑖 + 𝛼3 𝐷3𝑖 + 𝛽𝑋𝑖 + πœ€π‘– dimana,



(4.1.6)



π‘Œπ‘– = pengeluaran tahunan untuk pemeliharaan kesehatan 𝑋𝑖 = pendapatan tahunan 6



𝐷1 = 1 jika pendidikan sekolah dasar = 0 jika yang lain 𝐷2 = 1 jika pendidikan sekolah lanjutan tingkat pertama = 0 jika yang lain 𝐷3 = 1 jika pendidikan sekolah menengah atas = 0 jika yang lain 3.



Regresi Atas Satu Variabel Bebas Numerik Dan Dua Variabel Bebas Kategorik Teknik variabel dummy dapat diperluas untuk menangani lebih dari satu variabel bebas kategorik. Mari kita lihat kembali regresi gaji pengajar perguruan tinggi (4.1.1), akan tetapi sekarang diasumsikan bahwa sebagai tambahan terhadap pendapatan dan jenis kelamin, warna kulit dari pengajar juga menjadi penentu penting dari gaji. Asumsikan bahwa warna kulit mempunyai dua kategori, yaitu hitam dan putih. [2] Perhatikan tabel di bawah ini: Tabel 4.2



Jenis Kelamin dan Ras Kategori π‘«πŸ



π‘«πŸ



π‘ΏπŸ



π‘ΏπŸ



Wanita



Hitam



0



0



Wanita



Putih



0



1



Pria



Hitam



1



0



Pria



Putih



1



1



Sekarang (4.1.1) dapat ditulis sebagai π‘Œπ‘– = 𝛼0 + 𝛼1 𝐷1𝑖 + 𝛼2 𝐷2𝑖 + 𝛽𝑋𝑖 + πœ€π‘– dimana,



(4.1.7)



π‘Œπ‘– dan 𝑋𝑖 = gaji tahunan dan tahun pengalaman mengajar



7



𝐷1



1, Pria = jenis kelamin, dimana 𝐷𝑖 = { , 0, Lainnya



𝐷2



= ras, dimana 𝐷𝑖 = {



1, Putih . 0, Hitam



Perhatikan bahwa dua variabel kategorik diatas mempunyai dua kategori sehingga memerlukan satu variabel dummy untuk masing-masing variabel kategori. Dengan mengasumsikan 𝐸(πœ€π‘– ) = 0, kita dapat memperoleh regresi berikut dari (4.1.1.7) sebagai berikut Gaji pengajar wanita berkulit hitam 𝐸(π‘Œπ‘– |𝐷1 = 0, 𝐷2 = 0, 𝑋𝑖 ) = 𝛼0 + 𝛽𝑋𝑖 ,



(4.1.8)



Gaji pengajar laki-laki berkulit hitam 𝐸(π‘Œπ‘– |𝐷1 = 1, 𝐷2 = 0, 𝑋𝑖 ) = (𝛼0 + 𝛼1 ) + 𝛽𝑋𝑖 ,



(4.1.9)



Gaji pengajar wanita berkulit putih 𝐸(π‘Œπ‘– |𝐷1 = 0, 𝐷2 = 1, 𝑋𝑖 ) = (𝛼0 + 𝛼2 ) + 𝛽𝑋𝑖 ,



(4.1.10)



Gaji pengajar laki-laki berkulit putih 𝐸(π‘Œπ‘– |𝐷1 = 1, 𝐷2 = 1, 𝑋𝑖 ) = (𝛼0 + 𝛼1 + 𝛼2 ) + 𝛽𝑋𝑖 .



(4.1.11)



Class Observation 1 2 3 4 5 Sums Means



1 Y 22 22 20 24 12 100 20



2 X 29 20 14 21 6 90 18



Y 30 32 26 25 37 150 30



3 X 15 9 1 6 19 50 10



Y 12 8 13 25 7 65 13



4 X 16 31 26 35 12 120 24



Y 23 25 28 26 23 125 25



X 5 25 16 10 24 80 16



Y X 440 340 22 17



8