Makalah Analisis Diskriminan [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

STATISTIKA MULTIVARIAT ANALISIS DISKRIMINAN



OLEH:



NURUL AZIZAH MUZAKIR



(1611140003)



ZAENAL



(1611140006)



JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI MAKASSAR 2018



i



KATA PENGANTAR



Assalamuโ€™alaikum wr.wb Segala puji dan syukur atas kehadirat Allah SWT atas segala nikmat dan karunia-Nya sehingga kami dapat menyelesaikan makalah ini dan disusun sebagai salah satu syarat untuk memperoleh nilai pada mata kuliah Statistika Multivariat. Di dalam makalah yang berjudul โ€œAnalisis Diskriminanโ€ mungkin masih terdapat banyak kekurangan. Kami menyadari bahwa karya tulis ini masih jauh dari sempurna. Oleh karena itu, kami sangat membutuhkan kritik dan saran yang sifatnya membangun dari para pembaca guna perbaikan dan kesempurnaan makalah ini di masa yang akan datang. Wassalamuโ€™alaikum wr.wb



Makassar, 26 September 2018



Penyusun



ii



DAFTAR ISI



HALAMAN JUDUL .............................................................................................. i KATA PENGANTAR ........................................................................................... ii DAFTAR ISI ......................................................................................................... iii BAB I PENDAHULUAN .......................................................................................1 A. Latar Belakang ............................................................................................1 B. Rumusan Masalah .......................................................................................2 C. Tujuan Penulisan ........................................................................................2 BAB II PEMBAHASAN ........................................................................................3 1. Definisi Analisis Diskriminan....................................................................3 2. Tujuan Analisis Diskriminan .....................................................................4 3. Asumsi Analisis Diskriminan ....................................................................4 4. Langkah-Langkah Analisis Diskriminan ...................................................7 5. Contoh Kasus Analisis Diskriminan ........................................................13 DAFTAR PUSTAKA ...........................................................................................19



iii



BAB I PENDAHULUAN



A. Latar Belakang Analisis statistika bisa dikelompokkan berdasarkan jumlah variabel yang dianalisis. Berdasarkan pengelompokkan jumlah variabel ini maka statistika dibagi menjadi analisis univariat (univariate), bivariat (bivariate) dan multivariat (multivariate). Analisis univariat berasal dari kata uni dan variate yaitu analisis satu variabel. Misalnya pengukuran rata-rata (mean) sebagai ukuran pusat dari sekelompok data. Analisis bivariat berasal dari akar kata bi dan variate yang merupakan analisis statistika yang berkaitan dengan dua variabel. Misalnya analisis korelasi yang mencari hubungan antara dua variabel. Sedangkan analisis multivariat dilihat dari akar katanya merupakan pengembangan lanjutan dari analisis univariat maupun bivariat. Analisis multivariat merujuk kepada teknik statistika tertentu yang menganalisis banyak variabel secara simultan. Analisis multivariat terdiri dari beberapa jenis, yaitu teknik dependen (dependent technique), teknik interdependen (interdependent technique), dan model struktural (stuctural model). Analisis multivariat yang termasuk ke dalam teknik dependen yaitu analisis regresi, analisis regresi logistik, analisis diskriminan, analisis konjoin, analisis kanonikal, dan analisis manova. Analisis diskriminan adalah metode teknik dependen dimana variabel dependennya bersifat non metrik. Analisis diskriminan merupakan kombinasi linear dari dua atau lebih variabel independen yang akan membedakan atau mendiskriminasikan dua objek atau lebih di dalam sebuah kelompok atau grup. Metode diskriminan bisa dikelompokkan ke dalam dua jenis yaitu metode diskriminan dengan dua kategori (Two-Group Discriminant Analysis) dan



1



metode diskriminan dengan lebih dari dua kategori (Multiple Discriminant Analysis). B. Rumusan Masalah Berdasarkan latar belakang, diperoleh rumusan masalah yaitu: 1. Apa yang dimaksud dengan analisis diskriminan? 2. Apa tujuan analisis diskriminan? 3. Apa asumsi yang harus dipenuhi di dalam analisis diskriminan? 4. Bagaimana langkah-langkah dalam melakukan analisis diskriminan?



C. Tujuan Penulisan Berdasarkan rumusan masalah yang diperoleh, tujuan penulisan yaitu: 1. Untuk mengetahui definisi analisis diskriminan. 2. Untuk mengetahui tujuan analisis diskriminan. 3. Untuk mengetahui asumsi yang harus dipenuhi di dalam analisis diskriminan. 4. Untuk mengetahui langkah-langkah analisis diskriminan.



2



BAB II PEMBAHASAN



1. Definisi Analisis Diskriminan Analisis diskriminan adalah metode teknik dependen dimana variabel dependennya bersifat non metrik. Analisis diskriminan merupakan kombinasi linear dari dua atau lebih variabel independen yang akan membedakan atau mendiskriminasikan dua objek atau lebih di dalam sebuah kelompok atau grup. Metode diskriminan bisa dikelompokkan ke dalam dua jenis yaitu metode diskriminan dengan dua kategori (Two-Group Discriminant Analysis) dan metode diskriminan dengan lebih dari dua kategori (Multiple Discriminant Analysis). Ide dasar dari analisis diskriminan sama dengan analisis regresi logistik. Pada awalnya analisis diskriminan dikembangkan untuk menganalisis variabel dependen yang bersifat non metrik atau non numerik dengan dua atau lebih kategori. Sebagai moteode untuk membedakan objek menjadi dua atau lebih grup, maka analisis diskriminan dapat dihitung dengan memberi timbangan kepada setiap variabel independen agar bisa memaksimalkan perbedaan antara grup yang ada. Formula persamaan analisis diskriminan ini seperti halnya regresi dapat ditulis dalam bentuk fungsi diskriminan sebagai berikut: D = a + b1X1 + b2X2 + ... + bnXn Dimana : D



= Nilai diskriminan



a



= intersep



b1...n



= koefisien diskriminan atau bobot



3



X1...n



= variabel independen



Analisis diskriminan ini merupakan teknik untuk menguji hipotesis apakah rata-rata grup dari beberapa variabel independen untuk dua atau lebih grup adalah sama atau tidak. Rata-rata grup yang diperoleh dari menghitung rata-rata skor diskriminan disebut centroid atau rata-rata skor diskriminan. Centroid menunjukkan pusat lokasi dari setiap anggota grup. Sedangkan perbandingan group centroid menunjukkan seberapa jauh grup di dalam fungsi diskriminan.



2. Tujuan Analisis Diskriminan Oleh karena bentuk multivariate dari analisis diskriminan adalah dependence, maka variabel dependen adalah variabel yang menjadi dasar analisis diskriminan. Variabel dependen bisa berupa kode grup 1 atau grup 2 atau lainnya, dengan tujuan diskriminan secara umum adalah : a) Untuk mengetahui apakah ada perbedaan yang jelas antar grup pada variabel dependen. Jika ada perbedaan, variabel independen mana pada fungsi diskriminan yang membuat perbedaan tersebut. b) Membuat fungsi atau model diskriminan yang pada dasarnya mirip persamaan regresi. c) Melakukan klasifikasi terhadap objek, apakah suatu objek (bisa nama orang, tumbuhan, benda, dan lainnya) termasuk pada grup 1 atau grup 2 atau lainnya.



3. Asumsi Analisis Diskriminan



Sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap perbedaan nilai rataan dari kelompok-kelompok tersebut. Dalam pengujian tersebut, asumsi analisis diskriminan yang harus dipenuhi adalah :



4



a) Variabel



independen



seharusnya



berdistribusi



normal



multivariat



(Multivariate Normality), jika data tidak berdistribusi normal, akan menyebabkan masalah pada ketepatan fungsi (model) diskriminan. b) Matriks varians kovarians grup dari semua variabel independen seharusnya sama. c) Tidak ada data yang sangat ekstrim (outlier) pada variabel independen, jika ada data ekstrim yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan klasifikasi dari fungsi diskriminan. d) Tidak ada korelasi yang kuat antar-variabel independen, jika dua variabel independen



mempunyai



korelasi



yang



kuat,



dikatakan



terjadi



multikolinieritas. Untuk mengetahui adanya multikolinieritas dapat dilakukan dengan melihat korelasi antar variabel independen (r) yaitu jika nilai r > 0.6 menunjukkan adanya multikolinieritas.



3.1. Uji Kenormalan Peubah Ganda (Multivariate Normality)



Menurut Johnson dan Wichern, untuk menguji kenormalan ganda (Multivariate Normality) adalah dengan mencari nilai jarak kuadrat untuk setiap pengamatan yaitu: di2 = (Xi -๐‘‹ฬ…)โ€™S-1 (Xi - ๐‘‹ฬ…) dimana : di2 adalah dengan mencari nilai jarak kuadrat untuk setiap pengamatan ke-i Xi adalah pengamatan yang ke-i, dengan i = 1,2,3,...,n ๐‘‹ฬ… adalah rata-rata variabel bebas X S-1 adalah invers matriks varians kovarians S Kemudian di2 diurutkan dari yang paling kecil ke yang paling besar, selanjutnya dibuat plot di2 dimana i = urutan = 1, 2, ..., n . Bila hasil plot



5



dapat didekati dengan garis lurus, maka dapat disimpulkan bahwa peubah ganda menyebar normal. 3.2. Uji Kesamaan Matriks Varians Kovarians Untuk menguji kesamaan matriks varians kovarians kelompok I berhasil (S1) dan kelompok II gagal (S2) digunakan hipotesa : H0 : โˆ‘1 = โˆ‘2 =...=โˆ‘k = โˆ‘, matriks varians kovarians kelompok adalah relatif sama. H1 : minimal ada satu โˆ‘i โ‰  โˆ‘j , matriks varians kovarians kelompok adalah berbeda secara nyata. Terima H0 yang berarti matriks varians kovarians sama jika :



X2hit โ‰ค X2ฮฑ;



1 (k-1)p (p+1)



2



dengan : 1



1



2



2



X2hit = -2(1-C1)[ โˆ‘๐‘˜๐‘–=1 ๐‘‰๐‘– ln|๐‘†๐‘– | โˆ’ ln|๐‘†| โˆ‘๐‘˜๐‘–=1 ๐‘‰๐‘– ] k = banyaknya kelompok ( grup ) P = jumlah peubah pembeda (Y) dalam fungsi diskriminan = 1 S = matriks varians kovarians dalam kelompok gabungan. Si = matriks varians kovarians kelompok ke-i. i = 1,2, ... , k ni = jumlah responden pada kelompok ke- i dengan Vi = ni โ€“ 1



S=



โˆ‘๐‘˜ ๐‘–=1 ๐‘‰๐‘– ๐‘†



๐‘–



โˆ‘๐‘˜ ๐‘–=1 ๐‘‰๐‘–



6



C1 = [ โˆ‘๐‘˜ ๐‘–=1



1 ๐‘‰๐‘–



โˆ’ โˆ‘๐‘˜



1



๐‘–=1 ๐‘‰๐‘–



2๐‘2 +3๐‘โˆ’1



] [6(๐‘+1)(๐‘˜โˆ’1)]



4. Langkah-langkah Analisis Diskriminan Langkah-langkah dalam analisis diskriminan adalah sebagai berikut: 1. Pengecekan adanya kemungkinan hubungan linear antara variabel penjelas. Untuk point ini, dilakukan dengan bantuan matriks korelasi (pembentukan matriks korelasi sudah difasilitasi pada analisis diskriminan). Pada output SPSS, matriks korelasi bisa dilihat pada Pooled Within-Groups Matrices. 2. Uji Vektor Rata-Rata Antar Kelompok Pengujian terhadap vektor nilai rataan antar kelompok dilakukan dengan hipotesa: H0 : ๐œ‡0 = ๐œ‡1 = ๐œ‡2 = โ‹ฏ = ๐œ‡๐‘˜ H1 : paling tidak ada dua kelompok yang berbeda Statistik uji yang digunkan dalam pengujian hipotesis tersebut adalah statistik V-Barlettt yang menyebar mengikuti sebaran Chi-Square (X2) dengan derajat bebas p(k-1), apabila H0 diterima. Statistik V-Barlett diperoleh melalui: ๐‘‰ = โˆ’[(๐‘› โˆ’ 1) โˆ’ (๐‘ + ๐‘˜)/2]๐‘™๐‘›โˆ† Dimana: n = banyaknya pengamatan p = banyaknya peubah dalam fungsi diskriminan k = banyaknya kelompok โˆ†=



|๐‘พ| |๐‘พ+๐‘ฉ|



= Wilksโ€™ Lambda



Dalam hal ini W = matriks jumlah kuadrat dan hasil kali data dalam kelompok ฬ… ฬ… โˆ‘๐‘˜๐‘–=1 โˆ‘๐‘›๐‘– ๐‘—=1(๐‘‹๐‘–๐‘— โˆ’ ๐‘‹๐‘– )(๐‘‹๐‘–๐‘— โˆ’ ๐‘‹๐‘– )โ€™ B = matriks jumlah kuadrat dan hasil kali data antar kelompok



7



๐‘˜



โˆ‘ ๐‘›๐‘– (๐‘‹๐‘–๐‘— โˆ’ ๐‘‹ฬ…) (๐‘‹๐‘–๐‘— โˆ’ ๐‘‹ฬ…)โ€ฒ ๐‘–=1



๐‘‹๐‘–๐‘— = pengamatan ke-j kelompok ke-i ๐‘‹ฬ…๐‘– = vektor rataan kelompok ke-i ๐‘›๐‘– = jumlah pengamatan pada kelompok ke-i ๐‘‹ฬ… = vektor rata-rata total Titik keputusan: H0 = tidak ada perbedaan vektor nilai rataan antar kelompok H1 = ada perbedaan vektor nilai rataan antar kelompok 2 Jika ๐‘‰ โ‰ค ๐‘‹๐‘(๐‘˜โˆ’1)(1โˆ’๐›ผ) maka H0 diterima 2 Jika ๐‘‰ > ๐‘‹๐‘(๐‘˜โˆ’1)(1โˆ’๐›ผ) maka H0 ditolak



Bila dari hasil pengujian ada perbedaan vektor nilai rataan, maka fungsi diskriminan layak disusun untuk mengkaji hubungan antar kelompok serta berguna untuk mengelompokkan suatu objek ke salah satu kelompok tersebut. Diharapkan dalam uji ini adalah hipotesis nol ditolak, sehingga kita mempunyai informasi awal bahwa variabel yang sedang diteliti memang membedakan kedua kelompok.



3. Uji Kesamaan Matriks Varians Kovarians Dilanjutkan pemeriksaan asumsi homoskedastisitas dengan uji Boxโ€™s M. Untuk menguji kesamaan matriks peragam (โˆ‘) antar kelompok digunakan hipotesis: ๐ป0 : โˆ‘0 = โˆ‘1 = โˆ‘2 = โ‹ฏ = โˆ‘๐‘˜ = โˆ‘ ๐ป1 : sedikitnya ada dua kelompok yang berbeda Statistik uji yang digunakan adalah statistik Boxโ€™s M, yaitu: ๐‘˜



๐‘Š โˆ’2๐‘™๐‘›๐œ†โˆ— = (๐‘› โˆ’ ๐‘˜)๐‘™๐‘› | | โˆ’ โˆ‘(๐‘›๐‘— โˆ’ 1)๐‘™๐‘›|๐‘†๐‘— | (๐‘› โˆ’ ๐‘˜) ๐‘—=1



(๐‘› โˆ’1)/2



โˆ๐‘˜๐‘—=1|๐‘†๐‘— | ๐‘— ๐œ† = |๐‘Š/(๐‘› โˆ’ ๐‘˜)|(๐‘›โˆ’๐‘˜)/2 โˆ—



Dimana: 8



k



= banyaknya kelompok



W/(n-k) = matriks ragam-peragam dalam kelompok gabungan Sj



= matriks ragam-peragam kelompok ke-j



Bila ๐ป0 diterima, maka (โˆ’



2๐‘™๐‘›๐œ†โˆ— ๐‘



) akan mengikuti sebaran F



denganderajat bebas V1 dan V2 pada taraf signifikan ฮฑ, dimana: 1 ๐‘ฃ1 = ( ) (๐‘˜ โˆ’ 1)๐‘(๐‘ + 1) 2 ๐‘ฃ2 = (๐‘ฃ1 + 2)(๐‘Ž2 โˆ’ ๐‘Ž12 ) ๐‘ฃ1 ๐‘ = ๐‘ฃ1 /(1 โˆ’ ๐‘Ž1 โˆ’ ) ๐‘ฃ2 ๐‘˜



2๐‘3 + 3๐‘ โˆ’ 1 1 1 ๐‘Ž1 = [โˆ‘ โˆ’ ] 6(๐‘˜ โˆ’ 1)(๐‘ + 1) (๐‘›๐‘— โˆ’ 1) (๐‘› โˆ’ ๐‘˜) ๐‘—=1



๐‘˜



(๐‘ โˆ’ 1)(๐‘ + 2) 1 1 ๐‘Ž2 = [โˆ‘ โˆ’ ] 2 6(๐‘˜ + 1) (๐‘›๐‘— โˆ’ 1) (๐‘› โˆ’ ๐‘˜)2 ๐‘—=1



๐‘ = jumlah peubah pembeda dalam fungsi diskriminan Asumsikan dalam uji ini hipotesis nol tidak ditolak ๐ป0 : โˆ‘0 = โˆ‘1 Hipotesis : ๐ป0 : matriks kovarians grup adalah sama ๐ป1 : matriks kovarins grup adalah berbeda secara nyata Jika (โˆ’ Jika (โˆ’



2๐‘™๐‘›๐œ†โˆ— ๐‘ 2๐‘™๐‘›๐œ†โˆ— ๐‘



) > ๐น๐‘ฃ1, ๐‘ฃ2, ๐›ผ berarti ๐ป0 diterima ) โ‰ค ๐น๐‘ฃ1, ๐‘ฃ2, ๐›ผ berarti ๐ป1 diterima



Sama tidaknya grup kovarians matriks juga bisa dilihat dari tabel output Log Determinant pada software SPSS. Jika dalam pengujian ini ๐ป0 ditolak maka proses lanjutan seharusnya tidak bisa dilakukan.



4. Menentukan Signifikansi Fungsi Diskriminan H0 : ๐œ‡0 = ๐œ‡1 = ๐œ‡2 = โ‹ฏ = ๐œ‡๐‘˜ 9



H1 : ๐œ‡๐‘– โ‰  ๐œ‡๐‘— ๐‘–, ๐‘— = 1,2, โ€ฆ , ๐‘˜ sedikitnya ada dua kelompok yang berbeda Jika kelompok sejumlah k maka fungsi diskriminan dapat dibentuk sebanyak k-1. Untuk mengetahui apakah k-1 fungsi diskriminan tersebut signifikan untuk membedakan k kelompok sehingga layak untuk digunakan untuk analisis selanjutnya, suatu uji dilakukan yaitu menggunakan statistik Barlett ๐‘‰๐‘— = {๐‘ โˆ’ 1โˆ’1/2(๐‘ + ๐‘˜)}ln(1 + ๐‘’๐‘—) dengan N = โˆ‘ NI akan mengikuti distribusi Chi Kuadrat dengan derajat bebas p(k-1) jika H0 benar. Dimana : ฮปi = 1/(1+ej) ej = akar karakteristik (eigen value) ke-j dari BW-1 B = variasi / jumlah kuadrat antar kelompok (between groups sum of squares) W = variasi / jumlah kuadrat dalam kelompok (within groups sum of squares)



5. Pembentukan model diskriminan a. Kriteria Fungsi Linier Fisher ๏ƒ˜ Pembentukan Fungsi Linier (teoritis) Fisher mengelompokkan suatu observasi berdasarkan nilai skor yang dihitung dari suatu fungsi linier Y = ฮป'X dimana ฮป' menyatakan vektor yang berisi koefisien-koefisien variabel independen yang membentuk persamaan linier terhadap variabel dependen, ฮป' = [ฮป1 , ฮป2 , โ€ฆ , ฮป๐‘ ]. X=[



๐‘‹1 ] ๐‘‹2



Xk menyatakan matriks data pada kelompok ke-k 10



๐‘‹11๐‘˜ Xk =[ โ‹ฎ ๐‘‹๐‘›1๐‘˜



โ‹ฏ โ‹ฑ โ‹ฏ



๐‘‹1๐‘๐‘˜ โ‹ฎ ] ๐‘‹๐‘›๐‘๐‘˜



i = 1,2,...,n j = 1,2,...,p k = 1,2 Xijk menyatakan observasi ke-i variabel ke-j pada kelompok ke-k. Di bawah asumsi Xk ~ N(๐œ‡๐‘˜ , โˆ‘๐‘˜ ) ๐œ‡= [



๐œ‡1 ๐ธ(๐‘‹1 ) ]= [๐œ‡ ] dan โˆ‘๐‘˜ = ๐ธ(๐‘‹๐‘˜ โˆ’ ๐œ‡๐‘˜ )(๐‘‹๐‘˜ โˆ’ ๐œ‡๐‘˜ )' ; โˆ‘1 = โˆ‘2 =...= โˆ‘ ๐ธ(๐‘‹2 ) 2



๐œ‡1๐‘˜ ๐œ‡๐‘˜ = [ โ‹ฎ ] ; ๐œ‡๐‘˜ adalah vektor rata-rata tiap variabel X pada kelompok ๐œ‡๐‘๐‘˜ ke-k. ๐œŽ11 โ‹ฎ โˆ‘=[ โ‹ฎ โ€ฆ



๐œŽ12 ๐œŽ22 โ‹ฎ โ‹ฏ



โ‹ฏ โ‹ฏ โ‹ฏ โ‹ฏ



๐œŽ1๐‘ ๐œŽ2๐‘ โ‹ฎ ] ๐œŽ๐‘๐‘



Diagonal utama dari matriks menyatakan varians, dan selain diagonal utama menyatakan kovarians. Fisher mentransformasikan observasi-observasi x yang multivariate menjadi



observasi y yang univariate. Dari persamaan



Y = ฮป'X



diperoleh ๐œ‡๐‘˜๐‘ฆ = ๐ธ(๐‘Œ๐‘˜ ) = ๐ธ(๐œ†โ€ฒX) = ๐œ†โ€ฒ๐œ‡๐‘˜ ; ๐œŽ๐‘Œ2 = ๐‘ฃ๐‘Ž๐‘Ÿ(โ„“โ€ฒ๐‘‹) = โ„“โ€ฒโˆ‘โ„“ ๐œ‡๐‘˜๐‘ฆ adalah rata-rata Y yang diperoleh dari X yang termasuk ke dalam kelompok ke-k, ๐œŽ๐‘Œ2 adalah varians Y yang diasumsikan sama untuk kedua kelompok. Kombinasi linear yang terbaik menurut Fisher adalah yang dapat memaksimumkan rasio antara jarak kuadrat rata-rata Y yang diperoleh 11



dari x dari kelompok 1 dan 2 dengan varians Y, atau dirumuskan sebagai berikut: (๐œ‡1๐‘Œ โˆ’ ๐œ‡2๐‘Œ )2 ) ๐œ†โ€ฒ(๐œ‡1 โˆ’ ๐œ‡2 )(๐œ‡1 โˆ’ ๐œ‡2 )โ€ฒ๐œ† = 2 ๐œ†โ€ฒโˆ‘๐œ† ๐œŽ๐‘Œ Jika (๐œ‡1 โˆ’ ๐œ‡2 ) = ๐›ฟ, maka persamaan di atas menjadi



(๐œ†โ€ฒ๐›ฟ)2 ๐œ†โ€ฒโˆ‘๐œ†



. Karena โˆ‘



adalah matriks definit positif, maka menurut teori pertidaksamaan Cauchy-Schwartz, rasio



(๐œ†โ€ฒ๐›ฟ)2 ๐œ†โ€ฒโˆ‘๐œ†



dapat dimaksimumkan jika



ฮปโ€ฒ = ๐‘ โˆ‘โˆ’1 ๐›ฟ = ๐‘ โˆ‘โˆ’1 (๐œ‡1 โˆ’ ๐œ‡2 )



Dengan memilih c = 1, menghasilkan kombinasi linear yang disebut kombinasi linear Fisher sebagai berikut: ๐‘Œ = ๐œ†โ€ฒ ๐‘‹ = (๐œ‡1 โˆ’ ๐œ‡2 ) โˆ‘โˆ’1 ๐‘‹ ๏ƒ˜ Pembentukan Fungsi Linier (dengan bantuan SPSS) Pada output SPSS, koefisien untuk tiap variabel yang masuk dalam model dapat



dilihat pada tabel Canonical Discriminant Function



Coefficient. Tabel ini akan dihasilkan pada output apabila pilihan Function Coefficient bagian Unstandardized diaktifkan. ๏ƒ˜ Menghitung discriminant score Setelah dibentuk fungsi liniernya, maka dapat dihitung skor diskriminan untuk tiap observasi dengan memasukkan nilai-nilai variabel independen.



๏ƒ˜ Menghitung cutting score Cutting score (m) dapat dihitung dengan rumus sebagai berikut: ๐‘š=



๐‘›1 ๐œ‡1๐‘Œ + ๐‘›2 ๐œ‡2๐‘Œ ๐‘›1 + ๐‘›2



Dimana nk adalah jumlah sampel pada kelompok ke-k, k=1,2 12



Kemudian



nilai-nilai



dibandingkan dengan



discriminant



score



tiap



observasi



akan



cutting score, sehingga dapat diklasifikasikan



suatu observasi akan termasuk ke dalam kelompok yang mana. Suatu observasi dengan karakteristik x akan diklasifikasikan sebagai anggota kelompok kode 1 jika ๐‘ฆ = (๐œ‡1 โˆ’ ๐œ‡2 )โ€ฒ โˆ‘โˆ’1 ๐‘‹ โ‰ฅ ๐‘š, selain itu dimasukkan ke dalam kelompok 2 (kode nol). Penghitungan m dilakukan secara manual, karena SPSS tidak mengeluarkan output m. Namun, kita dapat menghitung m dengan bantuan tabel Function at Group Centroids dari output SPSS. ๏ƒ˜



Penghitungan Hit Ratio (dalam model regresi logistik disebut percentage correct) Setelah semua observasi diprediksi keanggotaannya, dapat



dihitung hit ratio, yaitu



rasio antara observasi yang tepat



pengklasifikasiannya dengan total seluruh observasi. b. Kriteria Posterior Probability Aturan pengklasifikasian yang ekivalen dengan model linier Fisher adalah berdasarkan nilai peluang suatu observasi dengan karakteristik tertentu (x) berasal dari suatu kelompok. Nilai peluang ini disebut posterior probability dan bisa ditampilkan pada sheet SPSS dengan mengaktifkan option probabilities of group membership pada bagian Save di kotak dialog utama.



5. Contoh Kasus Menggunakan SPSS Di sebuah laboratorium dilakukan penelitian untuk mengetahui apa saja yang membedakan bunga A dan bunga B yang masih satu species. Untuk itu, diambil sampel bunga A dan B masing-masing sebanyak 10 buah. Kedua bunga dihitung lebar kelopaknya (X1)dan lebar daunnya (X2). Diketahui juga bahwa kedua bunga dapat dijadikan indikator derajat keasaman suatu zat (pH), maka diteliti juga



pada trayek pH berapa saja kedua bunga sensitif untuk 13



mendeteksinya(X3). Data yang telah diperoleh akan dianalisis dengan menggunakan analisis diskriminan.



Untuk melakukan analisis diskriminan dengan bantuan SPSS, ikuti langkahlangkah berikut: ๏ƒ˜ Pada menu Analyze, pilih submenu Classify, lalu pilih Discriminant. ๏ƒ˜ Kemudian akan muncul kotak dialog.



14



๏‚ท



Bagian Grouping Variable diisi dengan variabel respon dan harus didefinisikan range- nya pada bagian Define Range.



๏‚ท



Bagian Minimum diisi dengan kode terkecil dan Maximum diisi dengan kode terbesar dari variabel respon.



๏‚ท



Bagian Independents diisi dengan variabel penjelas. Metode yang sering dipaparkan pada literatur-literatur



adalah



metode bertatar (stepwise), maka kali ini hanya akan diberi contoh penggunaan metode ini. Posterior probability yang dihasilkan dengan metode Enter dan Stepwise agak berbeda, sehingga



pada



metode



Stepwise



nilai



ketepatan



klasifikasinya juga akan berbeda. Berdasarkan literatur๏‚ท



literatur yang pernah dibaca, penulis lebih menyarankan untuk menggunakan metode Stepwise. Untuk menampilkan nilai hit ratio, pada bagian Classify klik Summary Table.



๏‚ท



Bagian Save memungkinkan kita untuk menampilkan nilainilai posterior probability



observasi untuk masuk ke



kelompok kode nol(dis1_2), nilai-nilai posterior probability observasi untuk masuk ke kelompok kode satu (dis2_2), nilai-nilai discriminant score (dis1_1), dan pengklasifikasian observasi oleh model (dis_1) pada Sheet SPSS. Misalnya untuk observasi pertama, nilai peluangnya untuk masuk ke dalam kelompok kode nol (1,00000) lebih besar daripada peluangnya untuk masuk dalam kelompok kode satu (0,00000), maka observasi ini akan dimasukkan oleh model ke dalam kelompok kode nol.



15



Sampai di sini pengisian kotak dialog dirasa cukup untuk analisis diskriminan. Selanjutnya, kita akan mulai interpretasikan outputoutputnya. ๏ƒ˜ Pengecekan multikolinieritas



Dari matriks korelasi di atas, tidak ada angka yang mencapai 0,5 atau di atasnya sehingga kita mengidentifikasi tidak ada multikolinieritas pada data. ๏ƒ˜ Uji Kesamaan vektor rata-rata



Dilihat dari nilai p-value nya, masing-masing variabel mempunyai rata-rata yang berbeda untuk kedua kelompok. Ingat, yang diuji adalah kesamaan rata-rata pada tiap kelompok (kelompok kode nol dan kode satu), bukan rata-rata antar variabel. ๏ƒ˜ Uji Kesamaan matriks varians-covarians (homoskedastisitas)



16



Tabel di atas memperlihatkan bahwa kita dapat menolak hipotesis nol karena nilai pvaluenya kurang dari 0,05 (dalam hal ini penelitian menggunakan tingkat kepercayaan 95%). Dari hasil pengujian ini, kita dapat mengatakan bahwa data kita berasal dari populasi yang mempunyai matriks varians-covarians yang sama ๏ƒ˜ Pembentukan fungsi linear



Dari tabel di atas, dapat kita bentuk fungsi liniernya sebagai berikut: Y= -13,988+1,935X1 +0,163X3 ๏ƒ˜ Perhitungan skor diskriminan Misalnya untuk observasi pertama, dengan memasukkan nilai X1=4,46209; dan X3=14,3488 maka diperoleh discriminant scorenya sebesar -5,117 ๏ƒ˜ Perhitungan cutting score



Dari tabel di atas, dapat dihitung cutting score nya 10(โˆ’3,817)+10(3,817) 20



=0.



17



Untuk observasi pertama, karena discriminant score nya kurang dari cutting score, maka



dimasukkan ke dalam kelompok kode 0



(pengklasifkasian tepat karena sebenarnya observasi pertama sebelumnya memang termasuk ke dalam anggota kelompok nol atau bunga A). ๏ƒ˜ Hit ratio



Angka hit ratio di atas sudah mencapai 100% (pada kenyataannya sulit mencapai angka sebesar ini, ingat ini hanya data fiktif yang dibangitkan dengan bantuan komputer). ๏ƒ˜ Pengklasifikasian observasi baru Jika ada bunga dari species yang sama, dapat diprediksi akan termasuk dalam kelompok mana berdasarkan karakteristik yang dimilikinya dengan fungsi linier yang sudah terbentuk. Inilah yang menjadi tujuan pembentukan fungsi diskriminan



18



DAFTAR PUSTAKA Mintu, Shinta. 2012. Analisis Diskriminan untuk Mengkaji Misklasifikasi Pemilihan Jurusan. Skripsi. Fakultas Matematika dan Ilmu Pengetahuan Alam. Universitas Negeri Makassar: Makassar. Widarjono, Agus. 2010. Analisis Statistika Multivariat Terapan. UPP STIM YKPN. Yogyakarta.



19