Analisis Multiple Diskriminan [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.com



Beberapa Diskriminan Analisis TUJUAN PEMBELAJARAN Setelah menyelesaikan bab ini, Anda harus dapat melakukan hal berikut:



Nyatakan keadaan di mana analisis diskriminan linier harus digunakan daripada regresi berganda. Identifikasi masalah utama yang berkaitan dengan jenis variabel yang digunakan dan ukuran sampel yang diperlukan dalam penerapan analisis diskriminan.



Memahami asumsi yang mendasari analisis diskriminan dalam menilai kesesuaiannya untuk masalah tertentu. Jelaskan dua pendekatan komputasi untuk analisis diskriminan dan metode untuk menilai kecocokan model secara keseluruhan.



Jelaskan apa itu matriks klasifikasi dan bagaimana mengembangkannya, dan jelaskan cara mengevaluasi akurasi prediksi fungsi diskriminan. Ceritakan bagaimana mengidentifikasi variabel independen dengan daya diskriminatif. Membenarkan penggunaan pendekatan sampel terpisah untuk validasi.



Pratinjau BAB Regresi berganda tidak diragukan lagi merupakan teknik ketergantungan multivariat yang paling banyak digunakan. Dasar utama popularitas regresi adalah kemampuannya untuk memprediksi dan menjelaskan variabel metrik. Tapi apa yang terjadi ketika variabel dependen nonmetrik membuat regresi berganda tidak cocok? Bab ini memperkenalkan teknik—analisis diskriminan—yang membahas situasi variabel dependen nonmetrik. Dalam situasi seperti ini, peneliti tertarik pada prediksi dan penjelasan tentang hubungan yang mempengaruhi kategori di mana suatu objek berada, seperti mengapa seseorang menjadi atau bukan pelanggan, atau apakah suatu perusahaan akan berhasil atau gagal. Dua tujuan utama dari bab ini adalah sebagai berikut:



1. Untuk memperkenalkan sifat, filosofi, dan kondisi yang mendasari analisis diskriminan ganda 2. Untuk mendemonstrasikan penerapan dan interpretasi teknik-teknik ini dengan contoh ilustratif



Dari Bab 5 dari Analisis Data Multivariat, 7/e. Joseph F. Rambut, Jr., William C. Black, Barry J. Babin, Rolph E. Anderson. Hak Cipta © 2010 oleh Pearson Prentice Hall. Seluruh hak cipta.



231



Analisis Diskriminan Ganda Tujuan dasar dari analisis diskriminan adalah untuk memperkirakan hubungan antara variabel dependen nonmetrik (kategoris) tunggal dan satu set variabel independen metrik dalam bentuk umum ini:



kamu1



= x1 + x2 + x3 + A + xn



(nonmetrik)



(metrik)



Analisis diskriminan ganda memiliki aplikasi luas dalam situasi di mana tujuan utama adalah untuk mengidentifikasi kelompok yang objek (misalnya, orang, perusahaan, atau produk) milik. Aplikasi potensial termasuk memprediksi keberhasilan atau kegagalan produk baru, memutuskan apakah seorang siswa harus diterima di sekolah pascasarjana, mengklasifikasikan siswa untuk minat kejuruan, menentukan kategori risiko kredit untuk seseorang, atau memprediksi apakah suatu perusahaan akan berhasil. Dalam setiap contoh, objek jatuh ke dalam kelompok, dan tujuannya adalah untuk memprediksi dan menjelaskan dasar untuk keanggotaan kelompok setiap objek melalui satu set variabel independen yang dipilih oleh peneliti.



Teknik kedua—regresi logistik—juga cocok untuk menangani pertanyaan penelitian di mana variabel dependennya nonmetrik. Namun, regresi logistik terbatas pada situasi dengan variabel dependen biner (misalnya, Ya/Tidak, Pembelian/Tidak membeli, dll.). Pembaca didorong untuk meninjau regresi logistik, karena menyajikan banyak fitur yang berguna dalam hal interpretasi dampak dari variabel independen. ISTILAH KUNCI Sebelum memulai bab ini, tinjaulah istilah-istilah kunci untuk mengembangkan pemahaman tentang konsep dan terminologi yang akan digunakan. Di sepanjang bab, istilah kunci muncul ditebal. Poin-poin penekanan lain dalam bab dan referensi silang istilah kunci adalah: dicetak miring.



sampel analisis



Kelompok kasus yang digunakan dalam memperkirakan fungsi diskriminan. Ketika kon-



menyusun matriks klasifikasi, sampel asli dibagi secara acak menjadi dua kelompok, satu untuk estimasi model (sampel analisis) dan yang lainnya untuk validasi ( sampel ketidaksepakatan).



Kotak M



Uji statistik untuk kesetaraan matriks kovarians variabel independen di seluruh kelompok variabel dependen. Jika signifikansi statistik tidak melebihi tingkat kritis (yaitu, nonsignifikansi), maka kesetaraan matriks kovarians didukung. Jika pengujian menunjukkan signifikansi statistik, maka kelompok tersebut dianggap berbeda dan asumsi tersebut dilanggar.



Variabel kategori Lihat variabel nonmetrik.



pusat Nilai rata-rata untuk skor Z diskriminan dari semua objek dalam kategori atau kelompok tertentu. Misalnya, analisis diskriminan dua grup memiliki dua centroid, satu untuk objek di masing-masing dari dua grup.



Fungsi klasifikasi



Metode klasifikasi di mana fungsi linier didefinisikan untuk masing-masing



kelompok. Klasifikasi dilakukan dengan cara menghitung skor untuk setiap observasi pada fungsi klasifikasi masingmasing kelompok dan kemudian memberikan hasil observasi tersebut kepada kelompok yang memiliki skor tertinggi. Berbeda dengan perhitunganskor Z diskriminan, yang dihitung untuk masing-masing fungsi diskriminan.



Matriks klasifikasi



Cara menilai kemampuan prediksi dari fungsi diskriminan



(juga disebut matriks kebingungan, penugasan, atau prediksi). Dibuat dengan mentabulasi silang keanggotaan grup aktual dengan prediksi keanggotaan grup, matriks ini terdiri dari angka pada diagonal yang mewakili klasifikasi yang benar dan angka di luar diagonal yang mewakili klasifikasi yang salah. Validasi silang Prosedur membagi sampel menjadi dua bagian: sampel analisis Digunakan dalam estimasi fungsi diskriminan dan sampel ketidaksepakatan digunakan untuk memvalidasi hasil. Validasi silang menghindari overfitting fungsi diskriminan dengan mengizinkan validasinya pada sampel yang benar-benar terpisah.



232



Analisis Diskriminan Ganda Skor pemotongan



Kriteria yang menjadi tujuan masing-masing individu diskriminatif Z skor dibandingkan dengan



menentukan keanggotaan kelompok yang diprediksi. Ketika analisis melibatkan dua kelompok, prediksi kelompok ditentukan dengan menghitung skor pemotongan tunggal. Entitas dengan diskriminanZ skor di bawah skor ini ditugaskan ke satu kelompok, sedangkan mereka dengan skor di atas itu diklasifikasikan dalam kelompok lain. Untuk tiga atau lebih grup, digunakan beberapa fungsi diskriminan, dengan skor pemotongan yang berbeda untuk setiap fungsi.



Koefisien diskriminan Lihat berat diskriminan.



Fungsi diskriminan



Variate dari variabel independen yang dipilih karena diskriminatifnya



kekuatan yang digunakan dalam prediksi keanggotaan kelompok. Nilai prediksi dari fungsi diskriminan adalahdiskriminatif Z skor, yang dihitung untuk setiap objek (orang, perusahaan, atau produk) dalam analisis. Ini mengambil bentuk persamaan linier



Zjk = a + W1x1k + W2 x2k + + Wn xnk di mana



Zjk = diskriminatif Z skor fungsi diskriminan J untuk objek ka = mencegat WSaya = bobot diskriminan untuk variabel bebas saya Xik = variabel bebas Saya untuk objek k Pemuatan diskriminan Pengukuran korelasi linier sederhana antara masing-masing variabel bebas dengan diskriminatif Z skor untuk setiap fungsi diskriminan; disebut jugakorelasi struktur. Pembebanan diskriminan dihitung apakah variabel independen termasuk dalam fungsi diskriminan atau tidak. Berat diskriminan Bobot yang ukurannya berhubungan dengan daya pembeda variabel bebas itu di seluruh kelompok variabel terikat. Variabel bebas dengan daya pembeda yang besar biasanya memiliki bobot yang besar, dan variabel dengan daya pembeda yang kecil biasanya memiliki bobot yang kecil. Namun, multikolinearitas antar variabel independen akan menyebabkan pengecualian terhadap aturan ini. Disebut jugakoefisien diskriminan. Diskriminan Z skor Skor ditentukan oleh fungsi diskriminan untuk setiap objek dalam analisis dan biasanya dinyatakan dalam istilah standar. Disebut juga sebagaiZ skor, itu dihitung untuk setiap objek pada setiap fungsi diskriminan dan digunakan bersama dengan skor pemotongan untuk menentukan keanggotaan kelompok yang diprediksi. Ini berbeda denganz istilah skor yang digunakan untuk variabel standar.



Fungsi diskriminan linier Fisher Lihat fungsi klasifikasi. Rasio hit Persentase objek (individu, responden, perusahaan, dll.) yang diklasifikasikan dengan benar berdasarkan fungsi diskriminan. Hal ini dihitung sebagai jumlah objek di diagonal matriks klasifikasi dibagi dengan jumlah benda. Juga dikenal sebagaipersentase diklasifikasikan dengan benar.



Contoh penangguhan Sekelompok objek yang tidak digunakan untuk menghitung fungsi diskriminan. Kelompok ini kemudian digunakan untuk memvalidasi fungsi diskriminan dengan sampel responden yang terpisah. Disebut jugasampel validasi.



Regresi logistik Bentuk khusus regresi di mana variabel dependennya adalah variabel nonmetrik, dikotomis (biner). Meskipun ada beberapa perbedaan, cara interpretasi secara umum cukup mirip dengan regresi linier. Kriteria peluang maksimum Ukuran akurasi prediktif dalam matriks klasifikasi itu adalah dihitung sebagai persentase responden dalam kelompok terbesar. Alasannya adalah bahwa pilihan tanpa informasi terbaik adalah dengan mengklasifikasikan setiap pengamatan ke dalam kelompok terbesar.



Variabel metrik Variabel dengan satuan pengukuran yang konstan. Jika variabel metrik diskalakan dari 1 sampai 9, perbedaan antara 1 dan 2 sama dengan perbedaan antara 8 dan 9.



233



Analisis Diskriminan Ganda Variabel nonmetrik Variabel dengan nilai yang hanya berfungsi sebagai label atau alat identifikasi, disebut juga sebagai kategoris, variabel nominal, biner, kualitatif, atau taksonomi. Nomor pada jersey sepak bola adalah contohnya. Skor pemotongan optimal Skor Z diskriminan nilai yang paling baik memisahkan kelompok pada setiap fungsi diskriminan untuk tujuan klasifikasi. Persentase yang diklasifikasikan dengan benar Lihat rasio pukulan.



Pendekatan ekstrem kutub Metode membangun variabel dependen kategoris dari A variabel metrik. Pertama, variabel metrik dibagi menjadi tiga kategori. Kemudian kategori ekstrim digunakan dalam analisis diskriminan dan kategori sedang tidak dimasukkan dalam analisis. indeks potensi Ukuran gabungan dari kekuatan diskriminatif dari variabel independen ketika lebih dari satu



fungsi diskriminan diperkirakan. Berdasarkanbeban diskriminan, itu adalah ukuran relatif yang digunakan untuk membandingkan diskriminasi keseluruhan yang diberikan oleh setiap variabel independen di semua fungsi diskriminan yang signifikan.



pers Q statistik Ukuran kekuatan klasifikasi dari fungsi diskriminan dibandingkan dengan hasil yang diharapkan dari model peluang. Nilai yang dihitung dibandingkan dengan nilai kritis berdasarkan distribusi chi-kuadrat. Jika nilai yang dihitung melebihi nilai kritis, hasil klasifikasi secara signifikan lebih baik daripada yang diharapkan secara kebetulan. Kriteria peluang proporsional Kriteria lain untuk menilai rasio pukulan, di mana probabilitas rata-rata klasifikasi dihitung dengan mempertimbangkan semua ukuran kelompok.



Estimasi simultan Estimasi dari fungsi diskriminan dimana bobot untuk semua variabel independen dihitung secara bersamaan; kontras denganestimasi bertahap di mana variabel independen dimasukkan secara berurutan sesuai dengan daya pembeda. Validasi sampel terpisah Lihat validasi silang.



Estimasi bertahap



Proses memperkirakan fungsi diskriminan dimana mandiri



variabel dimasukkan secara berurutan sesuai dengan kekuatan diskriminatif yang mereka tambahkan ke prediksi keanggotaan kelompok.



Membentang vektor Vektor skala di mana vektor asli diskalakan untuk mewakili yang sesuai F perbandingan. Digunakan untuk secara grafis mewakilibeban diskriminan secara bersama-sama dengan kelompok centroid.



Korelasi struktur Lihat beban diskriminan. Peta teritorial Penggambaran grafis dari memotong skor pada grafik dua dimensi. Kapan dikombinasikan dengan plot kasus individu, penyebaran setiap kelompok dapat dilihat dan kesalahan klasifikasi kasus individu diidentifikasi langsung dari peta. Toleransi Proporsi variasi variabel bebas yang tidak dijelaskan oleh variabel yang sudah ada dalam model (fungsi). Hal ini dapat digunakan untuk melindungi terhadap multikolinearitas. Dihitung sebagai



R2* Saya , di mana Saya adalah jumlah varians dari variabel bebas Saya dijelaskan oleh semua 1 - R2*



lainnya dalam variabel terikat. Toleransi 0 berarti bahwa variabel bebas yang dipertimbangkan adalah kombinasi linier sempurna dari variabel bebas yang sudah ada dalam model. Toleransi 1 berarti bahwa sebuah variabel independen benar-benar independen dari variabel lain yang sudah ada dalam model. Contoh validasi Lihat sampel ketidaksepakatan.



Variasikan Kombinasi linier yang merepresentasikan jumlah bobot dari dua atau lebih



variabel bebas yang membentuk fungsi diskriminan. Juga disebut kombinasi linier atau senyawa linier.



Vektor Representasi arah dan besaran peran suatu variabel sebagaimana digambarkan dalam interpretasi grafis hasil analisis diskriminan.



Z skor Lihat diskriminatif Z skor.



234



Analisis Diskriminan Ganda



APA ITU ANALISIS DISKRIMINAN? Dalam upaya memilih teknik analisis yang tepat, terkadang kita menghadapi masalah yang melibatkan variabel dependen kategoris dan beberapa variabel independen metrik. Misalnya, kita mungkin ingin membedakan risiko kredit yang baik dari yang buruk. Jika kita memiliki ukuran metrik risiko kredit, maka kita bisa menggunakan regresi berganda. Dalam banyak kasus, kami tidak memiliki ukuran metrik yang diperlukan untuk regresi berganda. Sebaliknya, kami hanya dapat memastikan apakah seseorang termasuk dalam kelompok tertentu (misalnya, risiko kredit baik atau buruk).



Analisis diskriminan adalah teknik statistik yang tepat ketika variabel dependen adalah kategoris ( nominal atau nonmetrik) variabel dan variabel bebasnya adalah variabel metrik. Dalam banyak kasus, variabel terikat terdiri dari dua kelompok atau klasifikasi, misalnya laki-laki versus perempuan atau tinggi versus rendah. Dalam kasus lain, lebih dari dua kelompok yang terlibat, seperti klasifikasi rendah, sedang, dan tinggi. Analisis diskriminan mampu menangani dua kelompok atau beberapa (tiga atau lebih) kelompok. Ketika dua klasifikasi terlibat, teknik ini disebut sebagaianalisis diskriminan dua kelompok. Ketika tiga atau lebih klasifikasi diidentifikasi, teknik ini disebut sebagai:analisis diskriminan ganda (MDA). Regresi logistik terbatas dalam bentuk dasarnya menjadi dua kelompok, meskipun formulasi lain dapat menangani lebih banyak kelompok.



Analisis Diskriminan Analisis diskriminan melibatkan penurunan a bervariasi. Variate diskriminan adalah kombinasi linier dari dua (atau lebih) variabel independen yang akan membedakan terbaik antara objek (orang, perusahaan, dll) dalam kelompok yang ditentukan.apriori. Diskriminasi dicapai dengan menghitung bobot variat untuk setiap variabel independen untuk memaksimalkan perbedaan antara kelompok (yaitu, varians antar-kelompok relatif terhadap varians dalam-kelompok). Variate untuk analisis diskriminan, juga dikenal sebagaifungsi diskriminan, diturunkan dari persamaan seperti yang terlihat dalam regresi berganda. Ini mengambil bentuk berikut:



Zjk = a + W1x1k + W2x2k + + Wnxnk di mana



Zjk = diskriminatif Z skor fungsi diskriminan J untuk objek ka = mencegat WSaya = bobot diskriminan untuk variabel bebas saya Xik = variabel bebas Saya untuk objek k Seperti halnya variasi dalam regresi atau teknik multivariat lainnya, kita melihat skor diskriminan untuk setiap objek dalam analisis (orang, perusahaan, dll.) sebagai penjumlahan dari nilai-nilai yang diperoleh dengan mengalikan setiap variabel independen dengan bobot diskriminannya. Yang unik dari analisis diskriminan adalah bahwa lebih dari satu fungsi diskriminan mungkin ada, sehingga setiap objek mungkin memiliki lebih dari satu skor diskriminan. Kita akan membahas apa yang menentukan jumlah fungsi diskriminan nanti, tetapi di sini kita melihat bahwa analisis diskriminan memiliki kesamaan dan elemen unik jika dibandingkan dengan teknik multivariat lainnya. Analisis diskriminan adalah teknik statistik yang tepat untuk menguji hipotesis bahwa rata-rata kelompok dari sekumpulan variabel bebas untuk dua atau lebih kelompok adalah sama. Dengan merata-ratakan skor diskriminan untuk semua individu dalam kelompok tertentu, kita sampai pada mean kelompok. Rata-rata kelompok ini disebut sebagaipusat. Ketika analisis melibatkan dua kelompok, ada dua centroid; dengan tiga kelompok, ada tiga centroid; Dan seterusnya. Centroid menunjukkan yang paling



235



Analisis Diskriminan Ganda A



B



Fungsi Diskriminan



A



Z



B



Fungsi Diskriminan



Z



GAMBAR 1 Representasi Univariat dari Diskriminan Z Skor



lokasi khas dari setiap anggota dari kelompok tertentu, dan perbandingan centroid kelompok menunjukkan seberapa jauh jarak kelompok dalam hal fungsi diskriminan.



Uji signifikansi statistik dari fungsi diskriminan adalah ukuran umum jarak antara pusat kelompok. Ini dihitung dengan membandingkan distribusi skor diskriminan untuk kelompok. Jika tumpang tindih dalam distribusi kecil, fungsi diskriminan memisahkan kelompok dengan baik. Jika tumpang tindihnya besar, fungsinya adalah pembeda yang buruk antar kelompok. Dua distribusi skor diskriminan yang ditunjukkan pada Gambar 1 lebih lanjut menggambarkan konsep ini. Diagram atas mewakili distribusi skor diskriminan untuk fungsi yang memisahkan grup dengan baik, menunjukkan tumpang tindih minimal (area yang diarsir) di antara grup. Diagram bawah menunjukkan distribusi skor diskriminan pada fungsi diskriminan yang merupakan diskriminator yang relatif buruk antara grup A dan B. Analisis diskriminan ganda adalah unik dalam satu karakteristik di antara hubungan ketergantungan. Jika variabel terikat terdiri lebih dari dua kelompok, analisis diskriminan akan menghitung lebih dari satu fungsi diskriminan. Faktanya, itu akan menghitungNG - 1 fungsi, dimana



NG adalah jumlah kelompok. Setiap fungsi diskriminan akan menghitung diskriminan terpisah Z skor. Dalam kasus variabel dependen tiga kelompok, setiap objek (responden, perusahaan, dll.) akan memiliki skor terpisah untuk fungsi diskriminan satu dan dua, yang memungkinkan objek diplot dalam dua dimensi, dengan masing-masing dimensi mewakili diskriminan. fungsi. Dengan demikian, analisis diskriminan tidak terbatas pada satu variasi, seperti regresi berganda, tetapi menciptakan banyak variasi yang mewakili dimensi diskriminasi di antara kelompok.



ANALOGI DENGAN REGRESI DAN MANOVA Penerapan dan interpretasi analisis diskriminan hampir sama dengan analisis regresi. Artinya, fungsi diskriminan adalah kombinasi linear (variat) pengukuran metrik untuk dua atau lebih variabel independen dan digunakan untuk menggambarkan atau memprediksi variabel dependen tunggal.



236



Analisis Diskriminan Ganda Perbedaan utama adalah bahwa analisis diskriminan sesuai untuk masalah penelitian di mana variabel dependen adalah kategoris (nominal atau nonmetrik), sedangkan regresi digunakan ketika variabel dependen adalah metrik. Seperti yang telah dibahas sebelumnya, regresi logistik adalah varian dari regresi dengan banyak kesamaan kecuali untuk jenis variabel dependen. Analisis diskriminan juga sebanding dengan "membalikkan" analisis varians multivariat (MANOVA). Dalam analisis diskriminan, variabel terikat tunggal bersifat kategoris, dan variabel bebas bersifat metrik. Hal sebaliknya berlaku untuk MANOVA, yang melibatkan variabel dependen metrik dan variabel independen kategoris. Kedua teknik keduanya menggunakan ukuran statistik yang sama dari model fit secara keseluruhan seperti yang akan dilihat nanti dalam bab ini.



CONTOH HIPOTETIK ANALISIS DISKRIMINAN Analisis diskriminan berlaku untuk setiap pertanyaan penelitian dengan tujuan memahami keanggotaan kelompok, apakah kelompok terdiri dari individu (misalnya, pelanggan versus nonpelanggan), perusahaan (misalnya, menguntungkan versus tidak menguntungkan), produk (misalnya, berhasil versus tidak berhasil), atau lainnya objek yang dapat dievaluasi pada serangkaian variabel bebas. Untuk mengilustrasikan premis dasar analisis diskriminan, kami menguji dua pengaturan penelitian, satu melibatkan dua kelompok (pembeli versus nonpembeli) dan tiga kelompok lainnya (tingkat perilaku beralih).



Analisis Diskriminan Dua Kelompok: Pembeli Versus Nonpembeli Misalkan KitchenAid ingin menentukan apakah salah satu produk barunya—pencampur makanan yang baru dan lebih baik—akan sukses secara komersial. Dalam melakukan penyelidikan, KitchenAid terutama tertarik untuk mengidentifikasi (jika mungkin) konsumen yang akan membeli produk baru versus mereka yang tidak. Dalam terminologi statistik, KitchenAid ingin meminimalkan jumlah kesalahan dalam memprediksi konsumen mana yang akan membeli mixer makanan baru dan mana yang tidak. Untuk membantu mengidentifikasi pembeli potensial, KitchenAid merancang skala penilaian pada tiga karakteristik—daya tahan, kinerja, dan gaya—untuk digunakan oleh konsumen dalam mengevaluasi produk baru. Daripada mengandalkan setiap skala sebagai ukuran terpisah, KitchenAid berharap bahwa kombinasi tertimbang dari ketiganya akan memprediksi kemungkinan pembelian konsumen dengan lebih baik.



Tujuan utama dari analisis diskriminan adalah untuk mengembangkan kombinasi tertimbang dari tiga skala untuk memprediksi kemungkinan bahwa konsumen akan membeli produk. Selain menentukan apakah konsumen yang cenderung membeli produk baru dapat dibedakan dari mereka yang tidak, KitchenAid juga ingin mengetahui karakteristik produk barunya yang berguna dalam membedakan calon pembeli dari bukan pembeli. Yaitu, evaluasi yang mana dari tiga karakteristik produk baru yang paling baik memisahkan pembeli dari nonpembeli? Misalnya, jika respons "akan membeli" selalu dikaitkan dengan peringkat daya tahan tinggi dan respons "tidak akan membeli" selalu dikaitkan dengan peringkat daya tahan rendah, KitchenAid dapat menyimpulkan bahwa karakteristik daya tahan membedakan pembeli dari bukan pembeli. Sebaliknya, jika KitchenAid menemukan bahwa sebanyak orang dengan peringkat tinggi pada gaya mengatakan mereka akan membeli mixer makanan seperti mereka yang mengatakan tidak, maka gaya adalah karakteristik yang membedakan dengan buruk antara pembeli dan nonpembeli. MENGIDENTIFIKASI VARIABEL DISKRIMINASI Untuk mengidentifikasi variabel yang mungkin berguna dalam



membedakan antara kelompok (yaitu, pembeli versus nonpembeli), penekanan ditempatkan pada perbedaan kelompok daripada ukuran korelasi yang digunakan dalam regresi berganda. Tabel 1 mencantumkan peringkat mixer baru pada ketiga karakteristik ini (dengan harga tertentu) oleh panel yang terdiri dari 10 pembeli potensial. Dalam menilai mixer makanan, setiap anggota panel secara implisit



237



Analisis Diskriminan Ganda TABEL 1 Hasil Survey KitchenAid untuk Evaluasi Produk Konsumen Baru



Evaluasi Produk Baru*



x2



Daya tahan



Pertunjukan



x3 Gaya



8 6 10 9 4 7.4



9 7 6 4 8 6.8



6 5 3 4 2 4.0



Grup 2: Tidak akan membeli Subjek 6 Subyek 7 Subyek 8 Subyek 9 Subyek 10 Grup berarti



5 3 4 2 2 3.2



4 7 5 4 2 4.4



7 2 5 3 2 3.8



Perbedaan antara kelompok berarti



4.2



2.4



0.2



x1



Grup Berdasarkan



niat beli



Grup 1: Akan membeli Subjek 1 Subyek 2 Subyek 3 Subyek 4 Subyek 5 Grup berarti



* Evaluasi dilakukan pada skala 10 poin (1 = sangat buruk hingga 10 = sangat baik).



membandingkannya dengan produk yang sudah ada di pasaran. Setelah produk dievaluasi, evaluator diminta untuk menyatakan niat beli mereka (“akan membeli” atau “tidak akan membeli”). Lima menyatakan bahwa mereka akan membeli mixer baru dan lima mengatakan tidak akan membeli. Memeriksa Tabel 1 mengidentifikasi beberapa variabel pembeda potensial. Pertama, perbedaan substansial memisahkan peringkat rata-rata darix1 (daya tahan) untuk kelompok "akan membeli" dan "tidak akan membeli" (7,4 versus 3,2). Dengan demikian, daya tahan tampaknya membedakan dengan baik antara kedua kelompok dan kemungkinan menjadi karakteristik penting bagi pembeli potensial. Sebaliknya, karakteristik gaya (x3) memiliki perbedaan yang jauh lebih kecil sebesar 0,2 antara peringkat rata-rata (4,0 - 3,8 = 0,2) untuk kelompok “akan membeli” dan “tidak akan membeli”. Oleh karena itu, kami berharap karakteristik ini tidak terlalu diskriminatif dalam hal keputusan pembelian. Namun, sebelum kita dapat membuat pernyataan seperti itu secara meyakinkan, kita harus memeriksa distribusi skor untuk setiap kelompok. Deviasi standar yang besar dalam satu atau kedua kelompok mungkin membuat perbedaan antara sarana tidak signifikan dan tidak penting dalam membedakan antara kelompok.



Karena kami hanya memiliki 10 responden dalam dua kelompok dan tiga variabel independen, kami juga dapat melihat data secara grafis untuk menentukan apa yang ingin dicapai oleh analisis diskriminan. Gambar 2 menunjukkan 10 responden pada masing-masing dari tiga variabel. Grup "akan membeli" diwakili oleh lingkaran dan grup "tidak akan membeli" dengan kotak. Nomor identifikasi responden ada di dalam formulir.







x1 (Daya tahan) memiliki perbedaan substansial dalam skor rata-rata, memungkinkan kita untuk membedakan hampir sempurna antara kelompok hanya dengan menggunakan variabel ini. Jika kami menetapkan nilai 5,5 sebagai titik batas kami untuk membedakan antara dua kelompok, maka kami hanya akan salah mengklasifikasikan responden 5, salah satu anggota kelompok "akan membeli". Variabel ini menggambarkan kekuatan diskriminatif dalam memiliki perbedaan rata-rata yang besar untuk kedua kelompok dan tidak adanya tumpang tindih antara distribusi kedua kelompok.



• x2 (Kinerja) memberikan perbedaan yang kurang jelas antara kedua kelompok. Namun, variabel ini memberikan diskriminasi yang tinggi untuk responden 5, yang salah diklasifikasikan jika kita



238



Analisis Diskriminan Ganda 10



8



9



7



5



6



2



2



3



4



5



6



1



4



3



8



9



10



x1



Daya tahan



1



7



9 6 10



7



4



8



3



2



5



1



4



5



6



7



8



9



10



8



9



10



x2



Performa 1



2



3



10



x3 Gaya



1



7



9



8



5



3



4



2



1



6



2



3



4



5



6



7



GAMBAR 2 Representasi Grafis dari 10 Pembeli Potensial pada Tiga Kemungkinan



Variabel pembeda



hanya digunakan x1. Selain itu, responden yang akan salah diklasifikasikan menggunakanx2 dipisahkan dengan baik pada



x1. Dengan demikian,x1 dan x2 mungkin digunakan cukup efektif dalam kombinasi untuk memprediksi keanggotaan kelompok.



• x3 (Gaya) menunjukkan sedikit perbedaan antara kelompok. Jadi, dengan membentuk variasi hanya x1 dan x2, dan menghilangkan x3, fungsi diskriminan dapat dibentuk yang memaksimalkan pemisahan kelompok pada skor diskriminan. MENGHITUNG FUNGSI DISKRIMINAN Dengan tiga variabel pembeda potensial diidentifikasi, perhatian



bergeser ke arah penyelidikan kemungkinan menggunakan variabel pembeda dalam kombinasi untuk meningkatkan daya pembeda dari setiap variabel individu. Untuk tujuan ini, suatu variate dapat dibentuk dengan dua atau lebih variabel pembeda untuk bertindak bersama-sama dalam membedakan antar kelompok.



Tabel 2 berisi hasil untuk tiga formulasi yang berbeda dari fungsi diskriminan, masingmasing mewakili kombinasi yang berbeda dari tiga variabel independen.



• Fungsi diskriminan pertama berisi just x1, menyamakan nilai x1 ke diskriminan Z skor (juga menyiratkan bobot 1,0 untuk x1 dan bobot nol untuk semua variabel lainnya). Seperti yang ditunjukkan sebelumnya, gunakan hanyax1, pembeda terbaik, menghasilkan kesalahan klasifikasi subjek 5 seperti yang ditunjukkan pada Tabel 2, di mana empat dari lima subjek dalam kelompok 1 (semua kecuali subjek 5) dan lima dari lima subjek dalam kelompok 2 diklasifikasikan dengan benar (yaitu, berbaring di diagonal dari matriks klasifikasi). Persentase yang diklasifikasikan dengan benar adalah 90 persen (9 dari 10 mata pelajaran). • Karena x2 memberikan diskriminasi untuk subjek 5, kita dapat membentuk fungsi diskriminan kedua dengan menggabungkan secara merata x1 dan x2 (yaitu, menyiratkan bobot 1,0 untuk x1 dan x2 dan berat 0,0



239



Analisis Diskriminan Ganda MEJA 2 Membuat Fungsi Diskriminan untuk Memprediksi Pembeli Versus Nonpembeli



Diskriminan Terhitung Z Skor Fungsi 1: Kelompok



ZX1



Grup 1: Akan membeli



Fungsi 2:



Z



x1



x2



Z



Fungsi 3: . 476x1



4,53



8 6 10 9 4



17 13 16 13 12



Grup 2: Tidak akan membeli Subjek 6 Subyek 7 Subyek 8 Subyek 9 Subyek 10



5 3 4 2 2



9 10 9 6 4



- 2.14 - 2.86



Skor pemotongan



5.5



11



0,0



Subyek 1 Subyek 2 Subyek 3 Subyek 4 Subyek 5



. 359x2



2.51 . 84 2.38 1.19 . 25 - . 71 - . 59 - . 83



Akurasi Klasifikasi: Grup yang Diprediksi Grup Sebenarnya



1: Akan membeli 2: Tidak akan membeli



12 41 05



Grup yang Diprediksi



12 50 05



Grup yang Diprediksi



12 50 05



untuk x3) untuk memanfaatkan kekuatan diskriminatif unik setiap variabel. Menggunakan skor pemotongan 11 dengan fungsi diskriminan baru ini (lihat Tabel 2) mencapai klasifikasi sempurna dari dua kelompok (100% diklasifikasikan dengan benar). Dengan demikian,x1 dan x2 dalam kombinasi mampu membuat prediksi yang lebih baik dari keanggotaan kelompok daripada variabel baik secara terpisah.



• Fungsi diskriminan ketiga pada Tabel 2 mewakili estimasi fungsi diskriminan aktual (Z = –4,53 + 0,476x1 + 0,359x2). Berdasarkan skor pemotongan 0, fungsi ketiga ini juga mencapai tingkat klasifikasi benar 100 persen dengan pemisahan maksimum yang dimungkinkan antar kelompok. Seperti yang terlihat dalam contoh sederhana ini, analisis diskriminan mengidentifikasi variabel dengan perbedaan terbesar antara kelompok dan menurunkan koefisien diskriminan yang memberi bobot pada setiap variabel untuk mencerminkan perbedaan ini. Hasilnya adalah fungsi diskriminan yang paling baik membedakan antara kelompok berdasarkan kombinasi variabel independen.



Representasi Geometris dari Fungsi Diskriminan Dua-Grup Sebuah ilustrasi grafis dari analisis dua kelompok lain akan membantu untuk lebih menjelaskan sifat analisis diskriminan [6]. Gambar 3 menunjukkan apa yang terjadi ketika fungsi diskriminan dua kelompok dihitung. Asumsikan kita memiliki dua kelompok, A dan B, dan dua pengukuran,V1 dan V2, pada setiap anggota dari dua kelompok. Kita dapat memplot dalam diagram pencar dari asosiasi variabel V1 dengan variabel V2 untuk setiap anggota dari dua kelompok. Pada Gambar 3 titik-titik kecil mewakili pengukuran variabel untuk anggota grup B dan titik-titik besar untuk grup A. Elips yang digambar di sekitar titik-titik besar dan kecil akan menyertakan beberapa proporsi titik yang telah ditentukan sebelumnya, biasanya 95 persen atau lebih di setiap titik. kelompok. Jika kita menggambar garis lurus



240



Analisis Diskriminan Ganda



V2 A



B



A'



B'



Fung si



Disk



rimin



V1



an



Z GAMBAR 3 Ilustrasi Grafis Analisis Diskriminan Dua Kelompok



melalui dua titik di mana elips berpotongan dan kemudian memproyeksikan garis ke yang baru Z sumbu, kita dapat mengatakan bahwa tumpang tindih antara distribusi univariat A dan B (diwakili oleh area yang diarsir) lebih kecil daripada yang diperoleh oleh garis lain yang ditarik melalui elips yang dibentuk oleh scatterplot [6]. Hal penting yang perlu diperhatikan tentang Gambar 3 adalah bahwa Z sumbu menyatakan profil dua variabel grup A dan B sebagai angka tunggal (skor diskriminan). Dengan menemukan kombinasi linier dari variabel asliV1 dan V2, kita dapat memproyeksikan hasilnya sebagai fungsi diskriminan. Misalnya, jika titik-titik besar dan kecil diproyeksikan ke yang baruZ sumbu sebagai diskriminan Z skor, hasilnya memadatkan informasi tentang perbedaan kelompok (ditunjukkan pada V1V2 plot) menjadi satu set poin (Z skor) pada satu sumbu, ditunjukkan oleh distribusi A dan B .



Untuk meringkas, untuk masalah analisis diskriminan yang diberikan, kombinasi linier dari variabel independen diturunkan, menghasilkan serangkaian skor diskriminan untuk setiap objek dalam setiap kelompok. Skor diskriminan dihitung menurut aturan statistik memaksimalkan varians antara kelompok dan meminimalkan varians di dalamnya. Jika varians antar grup relatif besar terhadap varians dalam grup, kita katakan bahwa fungsi diskriminan memisahkan grup dengan baik.



241



Analisis Diskriminan Ganda



Contoh Tiga Kelompok Analisis Diskriminan: Beralih Niat Contoh dua kelompok yang baru saja diperiksa menunjukkan alasan dan manfaat menggabungkan variabel independen ke dalam variasi untuk tujuan pembedaan antar kelompok. Analisis diskriminan juga memiliki cara lain untuk diskriminasi—estimasi dan penggunaan berbagai variasi—dalam hal tiga atau lebih kelompok. Fungsi diskriminan ini sekarang menjadi dimensi diskriminasi, masing-masing dimensi terpisah dan berbeda satu sama lain. Jadi, selain meningkatkan penjelasan tentang keanggotaan grup, fungsi diskriminan tambahan ini menambah wawasan tentang berbagai kombinasi variabel independen yang membedakan antar grup. Sebagai ilustrasi dari aplikasi tiga kelompok analisis diskriminan, kami memeriksa penelitian yang dilakukan oleh HBAT mengenai kemungkinan pelanggan pesaing beralih pemasok. Sebuah pretest skala kecil melibatkan wawancara dari 15 pelanggan dari pesaing utama. Selama wawancara, pelanggan ditanya kemungkinan mereka berpindah pemasok pada skala tiga kategori. Tiga tanggapan yang mungkin adalah "pasti beralih," "belum memutuskan," dan "pasti tidak beralih." Pelanggan ditugaskan ke kelompok 1, 2, atau 3, masing-masing, menurut tanggapan mereka. Pelanggan juga menilai pesaing berdasarkan dua karakteristik: daya saing harga (x1) dan tingkat layanan (x2). Masalah penelitian sekarang adalah untuk menentukan apakah penilaian pelanggan terhadap pesaing dapat memprediksi kemungkinan mereka untuk berpindah pemasok. Karena variabel dependen dari pemasok beralih diukur sebagai variabel kategoris (nonmetrik) dan peringkat harga dan layanan adalah metrik, analisis diskriminan sesuai. MENGIDENTIFIKASI VARIABEL DISKRIMINASI Dengan tiga kategori variabel terikat, analisis diskriminan dapat memperkirakan dua fungsi diskriminan, masing-masing mewakili dimensi diskriminasi yang berbeda. Tabel 3 berisi hasil survei untuk 15 pelanggan, 5 di setiap kategori variabel dependen. Seperti yang kita lakukan dalam contoh dua kelompok, kita dapat melihat skor rata-rata untuk setiap kelompok untuk melihat apakah salah satu variabel mendiskriminasi dengan baik di antara semua kelompok. Untukx1, daya saing harga, kami melihat perbedaan rata-rata yang agak besar antara kelompok 1 dan kelompok 2 atau 3 (2,0 versus 4,6 atau 3,8).



x1 dapat membedakan dengan baik antara kelompok 1 dan kelompok 2 atau 3, tetapi kurang efektif dalam membedakan antara kelompok 2 dan 3. Untuk x2, tingkat layanan, kita melihat bahwa perbedaan antara kelompok 1 dan 2 sangat kecil (2,0 berbanding 2,2), sedangkan perbedaan besar ada antara kelompok 3 dan kelompok 1 atau 2 (6,2 berbanding 2,0 atau 2,2). Dengan demikian,x1 membedakan kelompok 1 dari kelompok 2 dan 3, dan x2 membedakan kelompok 3 dari kelompok 1 dan 2. Akibatnya, kita melihat bahwa x1 dan x2 memberikan yang berbeda ukuran diskriminasi antar kelompok. MENGHITUNG DUA FUNGSI DISKRIMINAN Dengan teridentifikasinya variabel-variabel pembeda potensial, langkah



selanjutnya adalah menggabungkannya ke dalam fungsi-fungsi pembeda yang akan memanfaatkan daya pembeda gabungannya untuk membedakan antar kelompok. Untuk menggambarkan dimensi ini secara grafis, Gambar 4 menggambarkan tiga kelompok pada masing-masing variabel independen secara terpisah. Melihat anggota grup pada satu variabel, kita dapat melihat bahwa tidak ada variabel yang membedakan dengan baik di antara semua grup. Namun, jika kita membangun dua fungsi diskriminan sederhana, dengan hanya menggunakan bobot sederhana 0,0 atau 1,0, hasilnya menjadi lebih jelas. Fungsi diskriminan 1 memberikanx1 bobot 1,0, dan x2 berat 0,0. Demikian juga, fungsi diskriminan 2 memberikanx2 bobot 1,0, dan x1 berat 0,0. Fungsi dapat dinyatakan secara matematis sebagai



Fungsi diskriminan 1 = 1.0(x1) + 0,0(x2) Fungsi diskriminan 2 = 0,0(x1) + 1.0(x2) Persamaan ini menunjukkan secara sederhana bagaimana prosedur analisis diskriminan memperkirakan bobot untuk memaksimalkan diskriminasi.



242



Analisis Diskriminan Ganda TABEL 3 Hasil Survei HBAT tentang Switching Intentions oleh Calon Pelanggan



Evaluasi Pemasok Saat Ini* Grup Berdasarkan



Beralih Niat



Grup 1: Pasti beralih Subjek 1 Subyek 2 Subyek 3 Subyek 4 Subyek 5 Grup berarti Grup 2: Belum diputuskan



Subyek 6 Subyek 7 Subyek 8 Subyek 9 Subyek 10 Grup berarti Grup 3: Jelas tidak mengganti Subjek 11



Subjek 12 Subyek 13



Subjek 14 Subjek 15 Grup berarti



x1



Daya Saing Harga



x2 Tingkat Layanan



2 1 3 2 2 2.0



2 2 2 1 3 2.0



4 4 5 5 5 4.6



2 3 1 2 3 2.2



2 3 4 5 5 3.8



6 6 6 6 7 6.2



* Evaluasi dilakukan pada skala 10 poin (1 = sangat buruk hingga 10 = sangat baik).



Dengan dua fungsi tersebut, sekarang kita dapat menghitung dua skor diskriminan untuk setiap responden. Selain itu, kedua fungsi diskriminan memberikan dimensi diskriminasi. Gambar 4 juga memuat plot masing-masing responden dalam representasi dua dimensi. Pemisahan antar kelompok sekarang menjadi sangat jelas, dan setiap kelompok dapat dengan mudah dibedakan. Kita dapat menetapkan nilai pada setiap dimensi yang akan menentukan wilayah yang berisi setiap grup (misalnya, semua anggota grup 1 berada di wilayah kurang dari 3,5 pada dimensi 1 dan kurang dari 4,5 pada dimensi 2). Masing-masing kelompok lain dapat didefinisikan sama dalam hal rentang skor fungsi diskriminan mereka. Dalam hal dimensi diskriminasi, fungsi diskriminan pertama, daya saing harga, membedakan antara pelanggan yang ragu-ragu (ditunjukkan dengan kotak) dan pelanggan yang telah memutuskan untuk beralih (lingkaran). Namun daya saing harga tidak membedakan mereka yang telah memutuskan untuk tidak beralih (berlian). Sebaliknya, persepsi tingkat layanan, mendefinisikan fungsi diskriminan kedua, memprediksi apakah pelanggan akan memutuskan untuk tidak beralih versus apakah pelanggan ragu-ragu atau bertekad untuk beralih pemasok. Peneliti dapat menyajikan kepada manajemen dampak terpisah dari daya saing harga dan tingkat layanan dalam membuat keputusan ini. Estimasi lebih dari satu fungsi diskriminan, bila memungkinkan, memberikan peneliti diskriminasi yang lebih baik dan perspektif tambahan tentang fitur dan kombinasi yang paling baik membedakan antara kelompok. Bagian berikut merinci langkah-langkah yang diperlukan untuk melakukan analisis diskriminan, menilai tingkat kecocokan prediktifnya, dan kemudian menafsirkan pengaruh variabel independen dalam membuat prediksi tersebut.



243



Analisis Diskriminan Ganda 15



(a) Variabel Individu



11



14



5



x1



0



13



10



4



12



7



9



2



1



3



6



8



1



2



3



4



5



6



7



9 14



6



Pasti Beralih Bimbang Pasti Tidak Beralih



(b) Dua Dimensi Perwakilan dari Fungsi Diskriminan Diskriminan Fungsi 1 = 1.0x1 + 0x2 Diskriminan Fungsi 2 = 0x1 + 1.0x2



x2



0



13



3



10



8



2



7



12



4



1



5



11



15



1



2



3



6



7



4



5



Diskriminan Fungsi 2



7



15



6



11



12



13



14



7



10



6



9



5



4



3



2



5



2



1



3



Pasti Beralih Bimbang



4



1



8



Pasti Tidak Beralih



1



2



3



4



5



6



GAMBAR 4 Representasi Grafis dari Variabel Pembeda Potensial untuk Analisis Diskriminan Tiga Kelompok



244



Diskriminan Fungsi 1



Analisis Diskriminan Ganda



PROSES KEPUTUSAN UNTUK ANALISIS DISKRIMINAN Penerapan analisis diskriminan dapat dilihat dari perspektif pembangunan model enam tahap yang digambarkan pada Gambar 5 (tahap 1-3) dan Gambar 6 (tahap 4-6). Seperti semua aplikasi multivariat, menetapkan tujuan adalah langkah pertama dalam analisis. Kemudian peneliti harus mengatasi masalah desain khusus dan memastikan asumsi yang mendasari terpenuhi. Analisis dilanjutkan dengan penurunan fungsi diskriminan dan penentuan apakah fungsi yang signifikan secara statistik dapat diturunkan untuk memisahkan dua (atau lebih) kelompok. Hasil diskriminan kemudian dinilai untuk akurasi prediksi dengan mengembangkan matriks klasifikasi. Selanjutnya, interpretasi fungsi diskriminan menentukan variabel independen mana yang paling berkontribusi untuk membedakan antar kelompok. Akhirnya, fungsi diskriminan harus divalidasi dengan sampel ketidaksepakatan. Masing-masing tahapan ini dibahas pada bagian berikut.



TAHAP 1: TUJUAN ANALISIS DISKRIMINAN Tinjauan terhadap tujuan penerapan analisis diskriminan harus lebih memperjelas sifatnya. Analisis diskriminan dapat membahas salah satu dari tujuan penelitian berikut: 1. Menentukan apakah terdapat perbedaan yang signifikan secara statistik antara profil skor rata-rata pada sekumpulan variabel untuk dua (atau lebih) sebuah prioritas grup yang ditentukan



2. Menentukan variabel independen mana yang paling menjelaskan perbedaan dalam profil skor rata-rata dari dua atau lebih kelompok



Tahap 1



Permasalahan penelitian



Pilih tujuan: Mengevaluasi perbedaan kelompok pada profil multivariat Mengklasifikasikan pengamatan ke dalam kelompok



Identifikasi dimensi diskriminasi antar kelompok



Tahap 2



Masalah Desain Penelitian



Pemilihan variabel independen Pertimbangan ukuran sampel Pembuatan sampel analisis dan ketidaksepakatan



Asumsi



Tahap 3



Normalitas variabel bebas Linearitas hubungan



Kurangnya multikolinearitas antar variabel independen Matriks dispersi yang sama



Ke Panggung



4



GAMBAR 5 Tahapan 1-3 dalam Keputusan Analisis Diskriminan Diagram



245



Analisis Diskriminan Ganda



3. Menetapkan jumlah dan komposisi dimensi diskriminasi antar kelompok yang dibentuk dari himpunan variabel bebas 4. Menetapkan prosedur untuk mengklasifikasikan objek (individu, perusahaan, produk, dll.) ke dalam kelompok berdasarkan skor mereka pada satu set variabel independen



Sebagaimana dicatat dalam tujuan ini, analisis diskriminan berguna ketika peneliti tertarik untuk memahami perbedaan kelompok atau mengklasifikasikan objek ke dalam kelompok atau kelas dengan benar. Analisis diskriminan, oleh karena itu, dapat dianggap sebagai jenis analisis profil atau teknik prediksi analitis. Dalam kedua kasus, teknik ini paling tepat dalam situasi dengan variabel dependen kategoris tunggal dan beberapa variabel independen skala metrik. • Sebagai analisis profil, analisis diskriminan memberikan penilaian objektif perbedaan antara kelompok pada satu set variabel independen. Dalam situasi ini, analisis diskriminan sangat mirip dengan analisis varians multivariat. Untuk memahami perbedaan kelompok, analisis diskriminan memberikan wawasan tentang peran variabel individu serta mendefinisikan kombinasi variabelvariabel ini yang mewakili dimensi diskriminasi antar kelompok. Dimensi ini merupakan efek kolektif dari beberapa variabel yang bekerja bersama untuk membedakan antar kelompok. Penggunaan metode estimasi sekuensial juga memungkinkan untuk mengidentifikasi subset variabel dengan daya diskriminatif terbesar. • Untuk tujuan klasifikasi, analisis diskriminan memberikan dasar untuk mengklasifikasikan tidak hanya sampel yang digunakan untuk memperkirakan fungsi diskriminan tetapi juga pengamatan lain yang dapat memiliki nilai untuk semua variabel independen. Dengan cara ini, analisis diskriminan dapat digunakan untuk mengklasifikasikan pengamatan lain ke dalam kelompok yang ditentukan.



TAHAP 2: DESAIN PENELITIAN UNTUK ANALISIS DISKRIMINAN Penerapan analisis diskriminan yang berhasil memerlukan pertimbangan beberapa masalah. Masalah-masalah ini termasuk pemilihan variabel dependen dan independen, ukuran sampel yang diperlukan untuk estimasi fungsi diskriminan, dan pembagian sampel untuk tujuan validasi.



Memilih Variabel Dependen dan Independen Untuk menerapkan analisis diskriminan, peneliti terlebih dahulu harus menentukan variabel mana yang menjadi ukuran independen dan variabel mana yang menjadi ukuran dependen. Ingat bahwa variabel dependen adalah nonmetrik dan variabel independen adalah metrik. VARIABEL TERGANTUNG Peneliti harus fokus pada variabel dependen terlebih dahulu. Jumlah kelompok



variabel terikat (kategori) dapat dua atau lebih, tetapi kelompok-kelompok ini harus saling eksklusif dan lengkap. Dengan kata lain, setiap pengamatan hanya dapat ditempatkan ke dalam satu kelompok. Dalam beberapa kasus, variabel dependen mungkin melibatkan dua kelompok (dikotomis), seperti baik versus buruk. Dalam kasus lain, variabel terikat dapat melibatkan beberapa kelompok (multikotomi), seperti pekerjaan dokter, pengacara, atau profesor. Berapa Banyak Kategori dalam Variabel Dependen? Secara teoritis, analisis diskriminan



dapat menangani jumlah kategori yang tidak terbatas dalam variabel terikat. Namun, sebagai masalah praktis, peneliti harus memilih variabel dependen dan jumlah kategori berdasarkan beberapa pertimbangan: 1. Selain saling eksklusif dan lengkap, kategori variabel dependen harus berbeda dan unik pada himpunan variabel independen yang dipilih. Analisis diskriminan mengasumsikan bahwa setiap kelompokSebaiknya memiliki profil unik pada variabel independen yang digunakan dan dengan demikian mengembangkan fungsi diskriminan untuk secara maksimal memisahkan kelompok berdasarkan ini



246



Analisis Diskriminan Ganda variabel. Analisis diskriminan tidak memiliki sarana untuk mengakomodasi atau menggabungkan kategori yang tidak berbeda pada variabel independen. Jika dua atau lebih kelompok memiliki profil yang sangat mirip, analisis diskriminan tidak akan dapat membuat profil setiap kelompok secara unik, sehingga menyebabkan penjelasan dan klasifikasi kelompok secara keseluruhan menjadi lebih buruk. Dengan demikian, peneliti harus memilih variabel dependen dan kategorinya untuk mencerminkan perbedaan variabel independen. Sebuah contoh akan membantu menggambarkan masalah ini.



Asumsikan peneliti ingin mengidentifikasi perbedaan antara kategori pekerjaan berdasarkan sejumlah karakteristik demografi (misalnya, pendapatan, pendidikan, karakteristik rumah tangga). Jika pekerjaan diwakili oleh sejumlah kecil kategori (misalnya, kerah biru, kerah putih, juru tulis/staf, dan profesional/manajemen atas), maka kita akan mengharapkan perbedaan unik antara kelompok dan analisis diskriminan akan paling mampu untuk mengembangkan fungsi diskriminan yang akan menjelaskan perbedaan kelompok dan berhasil mengklasifikasikan individu ke dalam kategori yang benar. Namun, jika jumlah kategori pekerjaan diperluas, analisis diskriminan mungkin lebih sulit mengidentifikasi perbedaan. Misalnya, anggap kategori profesional/manajemen atas diperluas ke kategori dokter, pengacara, manajemen tingkat atas, profesor perguruan tinggi, dan seterusnya. Meskipun perluasan ini memberikan klasifikasi pekerjaan yang lebih halus, akan jauh lebih sulit untuk membedakan antara masing-masing kategori ini pada variabel demografis. Hasilnya akan menjadi kinerja yang lebih buruk dengan analisis diskriminan baik dalam penjelasan maupun klasifikasi. 2. Peneliti juga harus berusaha, semua hal lain sama, untuk jumlah kategori yang lebih kecil daripada yang lebih besar dalam ukuran dependen. Tampaknya lebih logis untuk memperluas jumlah kategori untuk mencari pengelompokan yang lebih unik, tetapi memperluas jumlah kategori menghadirkan lebih banyak kompleksitas dalam tugas pembuatan profil dan klasifikasi dari analisis diskriminan. Jika analisis diskriminan dapat memperkirakan hinggaNG - 1 (jumlah grup dikurangi satu) fungsi diskriminan, kemudian menambah jumlah grup memperluas jumlah kemungkinan fungsi diskriminan, meningkatkan kompleksitas dalam mengidentifikasi dimensi dasar diskriminasi yang dicerminkan oleh setiap fungsi diskriminan serta mewakili efek keseluruhan dari masing-masing independen variabel. Seperti yang disarankan oleh dua masalah ini, peneliti harus selalu menyeimbangkan keinginan untuk memperluas kategori untuk meningkatkan keunikan versus peningkatan efektivitas dalam jumlah kategori yang lebih sedikit. Peneliti harus mencoba dan memilih variabel dependen dengan kategori yang memiliki perbedaan maksimum di antara semua kelompok sambil mempertahankan dukungan konseptual dan relevansi manajerial. Konversi Variabel Metrik. Contoh variabel kategoris sebelumnya adalah dikotomi sejati (atau



multikotomi). Dalam beberapa situasi, bagaimanapun, analisis diskriminan tepat bahkan jika variabel dependen bukan variabel nonmetrik (kategoris) yang sebenarnya. Kami mungkin memiliki variabel dependen yang merupakan pengukuran ordinal atau interval yang ingin kami gunakan sebagai variabel dependen kategoris. Dalam kasus seperti itu, kita harus membuat variabel kategori, dan dua pendekatan yang paling umum digunakan: • Pendekatan yang paling umum adalah menetapkan kategori menggunakan skala metrik. Misalnya, jika kita memiliki variabel yang mengukur jumlah rata-rata minuman cola yang dikonsumsi per hari, dan individu merespons pada skala dari nol hingga delapan atau lebih per hari, kita dapat membuat trikotomi buatan (tiga kelompok) dengan hanya menunjuk mereka individu yang tidak mengonsumsi, satu, atau dua minuman cola per hari sebagai pengguna ringan, mereka yang mengonsumsi tiga, empat, atau lima kali sehari sebagai pengguna sedang, dan mereka yang mengonsumsi enam, tujuh, delapan, atau lebih sebagai pengguna berat. Prosedur seperti itu akan menciptakan variabel kategoris tiga kelompok di mana tujuannya adalah untuk membedakan antara pengguna cola ringan, sedang, dan berat. Sejumlah kelompok kategoris dapat dikembangkan. Paling sering, pendekatan ini melibatkan pembuatan dua, tiga, atau empat kategori.



247



Analisis Diskriminan Ganda • Ketika tiga atau lebih kategori dibuat, kemungkinan muncul untuk memeriksa hanya kelompok ekstrim dalam analisis diskriminan dua kelompok. NSpendekatan ekstrem kutub melibatkan membandingkan hanya dua kelompok ekstrim dan mengecualikan kelompok tengah dari analisis diskriminan. Misalnya, peneliti dapat meneliti pengguna minuman cola ringan dan berat dan mengecualikan pengguna sedang. Pendekatan ini dapat digunakan kapan saja peneliti ingin meneliti hanya kelompok ekstrim. Namun, peneliti mungkin juga ingin mencoba pendekatan ini ketika hasil analisis regresi tidak sebaik yang diharapkan. Prosedur seperti itu dapat membantu karena ada kemungkinan bahwa perbedaan kelompok dapat muncul meskipun hasil regresi buruk. Artinya, pendekatan kutub ekstrim dengan analisis diskriminan dapat mengungkapkan perbedaan yang tidak begitu menonjol dalam analisis regresi dari kumpulan data lengkap [6]. Manipulasi data seperti itu secara alami akan memerlukan kehati-hatian dalam menafsirkan temuan seseorang. VARIABEL INDEPENDEN Setelah



keputusan dibuat pada variabel dependen, peneliti harus memutuskan variabel independen mana yang akan dimasukkan dalam analisis. Variabel bebas biasanya dipilih dengan dua cara. Pendekatan pertama melibatkan identifikasi variabel baik dari penelitian sebelumnya atau dari model teoritis yang menjadi dasar pertanyaan penelitian. Pendekatan kedua adalah intuisi—memanfaatkan pengetahuan peneliti dan secara intuitif memilih variabel yang tidak ada penelitian atau teori sebelumnya tetapi secara logis mungkin terkait dengan memprediksi kelompok untuk variabel terikat. Dalam kedua kasus tersebut, variabel independen yang paling tepat adalah variabel yang berbeda setidaknya di dua kelompok variabel dependen. Ingat bahwa tujuan dari setiap variabel independen adalah untuk menyajikan profil unik dari setidaknya satu kelompok dibandingkan dengan yang lain. Variabel yang tidak berbeda antar kelompok tidak banyak digunakan dalam analisis diskriminan. Ukuran sampel Analisis diskriminan, seperti teknik multivariat lainnya, dipengaruhi oleh ukuran sampel yang dianalisis. Sampel yang sangat kecil memiliki begitu banyak kesalahan pengambilan sampel sehingga identifikasi semua kecuali perbedaan terbesar tidak mungkin. Selain itu, ukuran sampel yang sangat besar akan membuat semua perbedaan signifikan secara statistik, meskipun perbedaan yang sama ini mungkin memiliki sedikit atau tidak ada relevansi manajerial. Di antara ekstrem ini, peneliti harus mempertimbangkan dampak ukuran sampel pada analisis diskriminan, baik di tingkat keseluruhan dan berdasarkan kelompok demi kelompok.



UKURAN SAMPEL KESELURUHAN Pertimbangan



pertama melibatkan ukuran sampel keseluruhan. Analisis



diskriminan cukup sensitif terhadap rasio ukuran sampel terhadap jumlah variabel prediktor. Akibatnya, banyak penelitian menyarankan rasio 20 pengamatan untuk setiap variabel prediktor. Meskipun rasio ini mungkin sulit dipertahankan dalam praktiknya, peneliti harus mencatat bahwa hasilnya menjadi tidak stabil karena ukuran sampel menurun relatif terhadap jumlah variabel independen. Ukuran minimum yang direkomendasikan adalah lima observasi per variabel independen. Perhatikan bahwa rasio ini berlaku untuk semua variabel yang dipertimbangkan dalam analisis, bahkan jika semua variabel yang dipertimbangkan tidak dimasukkan ke dalam fungsi diskriminan (seperti dalam estimasi bertahap). UKURAN SAMPEL PER KATEGORI Selain ukuran sampel secara keseluruhan, peneliti juga harus mempertimbangkan ukuran sampel dari setiap kategori. Minimal, ukuran kelompok terkecil dari suatu kategori harus melebihi jumlah variabel bebas. Sebagai pedoman praktis, setiap kategori harus memiliki setidaknya 20 pengamatan. Bahkan ketika semua kategori melebihi 20 pengamatan, peneliti juga harus mempertimbangkan ukuran relatif dari kategori tersebut. Variasi yang luas dalam ukuran kelompok akan mempengaruhi estimasi fungsi diskriminan dan klasifikasi pengamatan. Pada tahap klasifikasi, kelompok yang lebih besar memiliki peluang klasifikasi yang jauh lebih tinggi. Jika ukuran kelompok sangat bervariasi, peneliti mungkin ingin mengambil sampel secara acak dari kelompok yang lebih besar.



248



Analisis Diskriminan Ganda sehingga mengurangi ukuran mereka ke tingkat yang sebanding dengan kelompok yang lebih kecil. Namun, selalu ingat untuk mempertahankan ukuran sampel yang memadai baik secara keseluruhan maupun untuk setiap kelompok.



Pembagian Sampel Satu catatan terakhir tentang dampak ukuran sampel dalam analisis diskriminan. Seperti yang akan dibahas nanti di tahap 6, cara yang lebih disukai untuk memvalidasi analisis diskriminan adalah dengan membagi sampel menjadi dua subsampel, satu digunakan untuk estimasi fungsi diskriminan dan satu lagi untuk tujuan validasi. Dalam hal pertimbangan ukuran sampel, penting bahwa setiap subsampel memiliki ukuran yang memadai untuk mendukung kesimpulan dari hasil. Dengan demikian, semua pertimbangan yang dibahas di bagian sebelumnya tidak hanya berlaku untuk sampel total, tetapi juga untuk masing-masing dari dua subsampel (terutama subsampel yang digunakan untuk estimasi). Tidak ada aturan keras dan cepat yang telah ditetapkan, tetapi tampaknya logis bahwa peneliti ingin setidaknya 100 dalam total sampel untuk membenarkan membaginya menjadi dua kelompok. MENCIPTAKAN SUBSAMPLE Sejumlah



prosedur telah disarankan untuk membagi sampel menjadi subsampel.



Prosedur yang biasa dilakukan adalah membagi total sampel responden secara acak menjadi dua subsampel. Salah satu subsampel ini,sampel analisis, digunakan untuk mengembangkan fungsi diskriminan. Yang kedua, sampel ketidaksepakatan, digunakan untuk menguji fungsi diskriminan. Metode validasi fungsi ini disebut sebagaivalidasi sampel terpisah atau validasi silang [1, 4, 8, 14]. Tidak ada pedoman pasti yang ditetapkan untuk menentukan ukuran relatif dari subsampel analisis dan ketidaksepakatan (atau validasi). Pendekatan yang paling populer adalah dengan membagi total sampel sehingga setengah dari responden ditempatkan dalam sampel analisis dan setengah lainnya ditempatkan dalam sampel yang tidak dapat diterima. Namun, tidak ada aturan keras dan cepat yang telah ditetapkan, dan beberapa peneliti lebih memilih pemisahan 60–40 atau bahkan 75–25 antara analisis dan kelompok ketidaksepakatan, tergantung pada ukuran sampel keseluruhan. Ketika memilih analisis dan sampel ketidaksepakatan, seseorang biasanya mengikuti prosedur pengambilan sampel bertingkat secara proporsional. Asumsikan dulu bahwa peneliti menginginkan pembagian 50-50. Jika kelompok kategori untuk analisis diskriminan terwakili secara merata dalam total sampel, maka estimasi dan sampel ketidaksepakatan harus berukuran kira-kira sama. Jika kelompok asli tidak sama, ukuran estimasi dan sampel ketidaksepakatan harus proporsional dengan distribusi sampel total. Misalnya, jika sampel terdiri dari 50 laki-laki dan 50 perempuan, estimasi dan sampel ketidaksepakatan akan memiliki 25 laki-laki dan 25 perempuan. Jika sampel terdiri dari 70 perempuan dan 30 laki-laki, maka sampel estimasi dan holdout masing-masing terdiri dari 35 perempuan dan 15 laki-laki. BAGAIMANA JIKA SAMPEL KESELURUHAN TERLALU KECIL? Jika ukuran sampel terlalu kecil untuk membenarkan pembagian ke



dalam kelompok analisis dan ketidaksepakatan, peneliti memiliki dua pilihan. Pertama, kembangkan fungsi tersebut pada seluruh sampel dan kemudian gunakan fungsi tersebut untuk mengklasifikasikan kelompok yang sama yang digunakan untuk mengembangkan fungsi tersebut. Prosedur ini menghasilkan bias ke atas dalam akurasi prediksi fungsi, tetapi tentu saja lebih baik daripada tidak menguji fungsi sama sekali. Kedua, beberapa teknik yang dibahas pada tahap 6 dapat melakukan jenis prosedur holdout di mana fungsi diskriminan diestimasi berulang kali pada sampel, setiap kali "menahan" pengamatan yang berbeda. Dalam pendekatan ini, ukuran sampel yang jauh lebih kecil dapat digunakan karena sampel keseluruhan tidak perlu dibagi menjadi subsampel.



TAHAP 3: ASUMSI ANALISIS DISKRIMINAN Seperti semua teknik multivariat, analisis diskriminan didasarkan pada sejumlah asumsi. Asumsi ini berhubungan dengan proses statistik yang terlibat dalam prosedur estimasi dan klasifikasi dan masalah yang mempengaruhi interpretasi hasil. Bagian berikut membahas masing-masing jenis asumsi dan dampaknya terhadap penerapan analisis diskriminan yang tepat.



249



Analisis Diskriminan Ganda



Dampak pada Estimasi dan Klasifikasi Asumsi kunci untuk menurunkan fungsi diskriminan adalah normalitas multivariat dari variabel independen dan struktur dispersi dan kovarians (matriks) yang tidak diketahui (tetapi sama) untuk grup seperti yang didefinisikan oleh variabel dependen [7, 9]. Meskipun buktinya beragam mengenai sensitivitas analisis diskriminan terhadap pelanggaran asumsi ini, peneliti harus selalu memahami dampak pada hasil yang dapat diharapkan. Selain itu, jika asumsi dilanggar dan solusi potensial tidak dapat diterima atau tidak mengatasi beratnya masalah, peneliti harus mempertimbangkan metode alternatif (misalnya, regresi logistik). MENGIDENTIFIKASI PELANGGARAN ASUMSI Mencapai normalitas univariat dari variabel individu akan berkali-kali cukup untuk mencapai normalitas multivariat. Sejumlah tes untuk normalitas tersedia bagi peneliti, bersama dengan solusi yang tepat, yang paling sering adalah transformasi variabel.



Masalah dispersi yang sama dari variabel independen (yaitu, matriks kovarians setara) mirip dengan homoskedastisitas antara variabel individu. Tes yang paling umum adalahKotak M tes menilai signifikansi perbedaan dalam matriks antara kelompok. Disini peneliti mencaritidak signifikan tingkat probabilitas yang akan menunjukkan bahwa tidak ada perbedaan antara matriks kovarians kelompok. Mengingat sensitivitas uji Box's M, bagaimanapun, untuk ukuran matriks kovarians dan jumlah kelompok dalam analisis, peneliti harus menggunakan tingkat perbedaan signifikan yang sangat konservatif (misalnya, 0,01 daripada 0,05) ketika menilai apakah perbedaan hadir. Ketika desain penelitian meningkat dalam ukuran sampel atau istilah kelompok atau jumlah variabel independen, bahkan tingkat signifikansi yang lebih konservatif dapat dianggap dapat diterima. DAMPAK TERHADAP ESTIMASI Data yang tidak memenuhi asumsi normalitas multivariat dapat



menimbulkan masalah dalam pendugaan fungsi diskriminan. Perbaikan mungkin dilakukan melalui transformasi data untuk mengurangi perbedaan di antara matriks kovarians. Namun, dalam banyak kasus pengobatan ini tidak efektif. Dalam situasi ini, model harus benar-benar divalidasi. Jika ukuran dependen adalah biner, regresi logistik harus digunakan jika memungkinkan. DAMPAK TERHADAP KLASIFIKASI Matriks



kovarians yang tidak sama juga berdampak negatif pada proses klasifikasi. Jika ukuran sampel kecil dan matriks kovarians tidak sama, maka signifikansi statistik dari proses estimasi terpengaruh. Kasus yang lebih mungkin adalah kovarians yang tidak sama di antara kelompok-kelompok dengan ukuran sampel yang memadai, di mana pengamatan diklasifikasi secara berlebihan ke dalam kelompok-kelompok dengan matriks kovarians yang lebih besar. Efek ini dapat diminimalkan dengan meningkatkan ukuran sampel dan juga dengan menggunakan matriks kovarians kelompok khusus untuk tujuan klasifikasi, tetapi pendekatan ini mengamanatkan validasi silang dari hasil diskriminan. Akhirnya, teknik klasifikasi kuadrat tersedia di banyak program statistik jika ada perbedaan besar antara matriks kovarians kelompok dan solusi tidak meminimalkan efek [5, 10, 12].



Dampak pada Interpretasi Karakteristik lain dari data yang mempengaruhi hasil adalah multikolinearitas antar variabel bebas. Multikolinearitas, diukur dalamtoleransi, menunjukkan bahwa dua atau lebih variabel independen sangat berkorelasi, sehingga satu variabel dapat sangat dijelaskan atau diprediksi oleh variabel lain dan dengan demikian menambahkan sedikit kekuatan penjelas dari seluruh himpunan. Pertimbangan ini menjadi sangat penting ketika prosedur bertahap digunakan. Peneliti dalam menginterpretasikan fungsi diskriminan harus menyadari tingkat multikolinearitas dan



250



Analisis Diskriminan Ganda



ATURAN UMUM 1 Desain Analisis Diskriminan • Variabel terikat harus nonmetrik, mewakili kelompok objek yang diharapkan berbeda pada variabel bebas • Pilih variabel terikat yang: • Terbaik mewakili perbedaan kepentingan kelompok • Mendefinisikan kelompok yang secara substansial berbeda



• Meminimalkan jumlah kategori sambil tetap memenuhi tujuan penelitian • Dalam mengonversi variabel metrik ke skala nonmetrik untuk digunakan sebagai variabel dependen, pertimbangkan untuk menggunakan grup ekstrem untuk memaksimalkan perbedaan grup



• Variabel independen harus mengidentifikasi perbedaan antara setidaknya dua kelompok agar dapat digunakan dalam analisis diskriminan



• Ukuran sampel harus cukup besar untuk: • Memiliki setidaknya satu pengamatan lebih banyak per kelompok daripada jumlah variabel independen, tetapi berusaha untuk setidaknya 20 kasus per kelompok



• Maksimalkan jumlah observasi per variabel, dengan rasio minimal lima observasi per variabel independen • Memiliki sampel yang cukup besar untuk dibagi menjadi sampel estimasi dan sampel ketidaksepakatan, masing-masing memenuhi persyaratan di atas



• Menilai kesetaraan matriks kovarians dengan uji Box's M, tetapi menerapkan tingkat signifikansi konservatif 0,01 dan menjadi lebih konservatif karena analisis menjadi lebih kompleks dengan jumlah kelompok dan/atau variabel independen yang lebih besar • Periksa variabel independen untuk normalitas univariat, karena itu adalah solusi paling langsung untuk memastikan normalitas multivariat dan kesetaraan matriks kovarians



• Multikolinearitas di antara variabel independen dapat secara nyata mengurangi dampak estimasi variabel independen dalam fungsi diskriminan turunan, terutama jika proses estimasi bertahap digunakan



berdampak pada penentuan variabel mana yang masuk ke solusi bertahap.



Seperti halnya teknik multivariat yang menggunakan variabel, asumsi implisit adalah bahwa semua hubungan adalah linier. Hubungan nonlinier tidak tercermin dalam fungsi diskriminan kecuali transformasi variabel tertentu dibuat untuk mewakili efek nonlinier. Akhirnya, outlier dapat memiliki dampak substansial pada akurasi klasifikasi dari setiap hasil analisis diskriminan. Peneliti didorong untuk memeriksa semua hasil untuk keberadaan outlier dan untuk menghilangkan outlier yang benar jika diperlukan.



TAHAP 4: ESTIMASI MODEL DISKRIMINAN DAN MENILAI KESESUAIAN KESELURUHAN Untuk menurunkan fungsi diskriminan, peneliti harus memutuskan metode estimasi dan kemudian menentukan jumlah fungsi yang akan dipertahankan (lihat Gambar 6). Dengan fungsi yang diestimasi, kecocokan model secara keseluruhan dapat dinilai dengan beberapa cara. Pertama,diskriminatif Z skor, juga dikenal sebagai Z skor, dapat dihitung untuk setiap objek. Perbandingan rata-rata grup (centroid) padaZ skor memberikan satu ukuran diskriminasi antar kelompok. Akurasi prediksi dapat diukur sebagai jumlah pengamatan yang diklasifikasikan ke dalam kelompok yang benar, dengan sejumlah kriteria yang tersedia untuk menilai apakah proses klasifikasi mencapai praktik atau



251



Analisis Diskriminan Ganda Dari Panggung



3



Estimasi Fungsi Diskriminan



Tahap 4



Estimasi simultan atau bertahap Signifikansi fungsi diskriminan



Nilai Akurasi Prediktif dengan Matriks Klasifikasi Tentukan skor pemotongan yang optimal Tentukan kriteria untuk menilai rasio hit Signifikansi statistik akurasi prediktif



Tahap 5



Satu



Interpretasi Fungsi Diskriminan Berapa banyak fungsi yang akan diinterpretasikan?



Evaluasi Fungsi Tunggal



Dua atau



Lagi



Evaluasi Fungsi Terpisah



Bobot diskriminan



Bobot diskriminan



Sebagian F nilai-nilai



Sebagian F nilai-nilai



Pemuatan diskriminan



Pemuatan diskriminan



Evaluasi Fungsi Gabungan Rotasi fungsi



indeks potensi



Tampilan grafis centroid grup Tampilan grafis pemuatan



Tahap 6



Validasi Hasil Diskriminan Split-sampel atau validasi silang perbedaan grup Profiling



GAMBAR 6 Tahapan 4–6 dalam Diagram Keputusan Analisis Diskriminan



signifikansi statistik. Akhirnya, diagnostik casewise dapat mengidentifikasi akurasi klasifikasi setiap kasus dan dampak relatifnya pada estimasi model secara keseluruhan.



Memilih Metode Estimasi Tugas pertama dalam menurunkan fungsi diskriminan adalah memilih metode estimasi. Dalam membuat pilihan ini, peneliti harus menyeimbangkan kebutuhan untuk mengontrol proses estimasi versus keinginan untuk hemat dalam fungsi diskriminan. Dua metode yang tersedia adalah metode simultan (langsung) dan metode bertahap, masing-masing dibahas selanjutnya.



252



Analisis Diskriminan Ganda ESTIMASI SIMULTAN Estimasi



simultan melibatkan komputasi fungsi diskriminan sehingga semua variabel independen dianggap bersamaan. Dengan demikian, fungsi diskriminan dihitung berdasarkan seluruh rangkaian variabel independen, terlepas dari daya pembeda masing-masing variabel independen. Metode simultan cocok ketika, untuk alasan teoritis, peneliti ingin memasukkan semua variabel independen dalam analisis dan tidak tertarik untuk melihat hasil antara hanya berdasarkan variabel yang paling diskriminatif.



ESTIMASI LANGKAH Estimasi bertahap merupakan alternatif dari pendekatan simultan. Ini



melibatkan memasukkan variabel independen ke dalam fungsi diskriminan satu per satu berdasarkan daya pembedanya. Pendekatan bertahap mengikuti proses berurutan menambah atau menghapus variabel dengan cara berikut:



1. Pilih satu variabel pembeda terbaik. 2. Pasangkan variabel awal dengan masing-masing variabel independen lainnya, satu per satu, dan pilih variabel yang paling mampu meningkatkan daya pembeda fungsi dalam kombinasi dengan variabel pertama. 3. Pilih variabel tambahan dengan cara yang sama. Perhatikan bahwa sebagai variabel tambahan disertakan, beberapa variabel yang dipilih sebelumnya dapat dihapus jika informasi yang dikandungnya tentang perbedaan kelompok tersedia dalam beberapa kombinasi variabel lain yang disertakan pada tahap selanjutnya.



4. Pertimbangkan proses yang selesai ketika semua variabel independen termasuk dalam fungsi atau variabel yang dikecualikan dinilai tidak berkontribusi signifikan terhadap diskriminasi lebih lanjut. Metode bertahap berguna ketika peneliti ingin mempertimbangkan sejumlah besar variabel bebas untuk dimasukkan ke dalam fungsi. Dengan secara berurutan memilih variabel pembeda terbaik berikutnya pada setiap langkah, variabel yang tidak berguna dalam membedakan antara kelompok dihilangkan dan sekumpulan variabel yang dikurangi diidentifikasi. Himpunan yang direduksi biasanya hampir sama bagusnya dengan—dan terkadang lebih baik dari—kumpulan variabel yang lengkap. Peneliti harus mencatat bahwa estimasi bertahap menjadi kurang stabil dan dapat digeneralisasikan karena rasio ukuran sampel terhadap variabel independen menurun di bawah tingkat yang direkomendasikan yaitu 20 pengamatan per variabel independen. Hal ini sangat penting dalam kasus ini untuk memvalidasi hasil dalam banyak cara mungkin.



Signifikansi Statistik Setelah estimasi fungsi diskriminan, peneliti harus menilai tingkat signifikansi daya diskriminatif kolektif dari fungsi diskriminan serta signifikansi masing-masing fungsi diskriminan yang terpisah. Mengevaluasi signifikansi keseluruhan memberi peneliti informasi yang diperlukan untuk memutuskan apakah akan melanjutkan interpretasi analisis atau jika spesifikasi ulang diperlukan. Jika model keseluruhan signifikan, maka mengevaluasi fungsi individu mengidentifikasi fungsi yang harus dipertahankan dan diinterpretasikan. SIGNIFIKANSI KESELURUHAN Dalam



menilai signifikansi statistik dari model keseluruhan, kriteria statistik yang berbeda berlaku untuk prosedur estimasi simultan versus bertahap. Dalam kedua situasi, uji statistik berhubungan dengan kemampuan fungsi diskriminan untuk menurunkan diskriminanZ skor yang berbeda secara signifikan antara kelompok.



Estimasi simultan. Ketika pendekatan simultan digunakan, ukuran lambda Wilks, jejak Hotelling, dan kriteria Pillai semuanya mengevaluasi signifikansi statistik dari kekuatan diskriminatif fungsi diskriminan. Akar karakteristik terbesar Roy hanya mengevaluasi fungsi diskriminan pertama. Estimasi bertahap. Jika metode bertahap digunakan untuk memperkirakan fungsi diskriminan, Mahalanobis D2 dan Rao V tindakan yang paling tepat. Keduanya adalah ukuran umum



253



Analisis Diskriminan Ganda jarak. MahalanobisD2 prosedur didasarkan pada jarak Euclidean kuadrat umum yang menyesuaikan varians yang tidak sama. Keuntungan utama dari prosedur ini adalah bahwa hal itu dihitung dalam ruang asli dari variabel prediktor daripada sebagai versi runtuh yang digunakan dalam ukuran lain. MahalanobisD2 prosedur menjadi sangat penting karena jumlah variabel prediktor meningkat, karena tidak menghasilkan pengurangan dimensi. Hilangnya dimensi akan menyebabkan hilangnya informasi karena menurunkan variabilitas variabel independen. Secara umum, MahalanobisD2 adalah prosedur yang disukai ketika peneliti tertarik pada penggunaan maksimal dari informasi yang tersedia dalam proses bertahap. SIGNIFIKANSI FUNGSI DISKRIMINAN INDIVIDU Jika jumlah kelompok adalah tiga atau lebih, maka peneliti harus memutuskan tidak hanya apakah diskriminasi antara kelompok secara keseluruhan signifikan secara statistik tetapi juga apakah masing-masing fungsi diskriminan yang diperkirakan signifikan secara statistik. Seperti dibahas sebelumnya, analisis diskriminan memperkirakan satu fungsi yang kurang diskriminan daripada grup. Jika tiga kelompok dianalisis, maka dua fungsi diskriminan akan diestimasi; untuk empat kelompok, tiga fungsi akan diperkirakan; dan seterusnya. Semua program komputer memberikan peneliti informasi yang diperlukan untuk memastikan jumlah fungsi yang diperlukan untuk memperoleh signifikansi statistik, tanpa menyertakan fungsi diskriminan yang tidak meningkatkan daya diskriminatif secara signifikan. Kriteria signifikansi konvensional 0,05 atau lebih sering digunakan, namun beberapa peneliti memperluas tingkat signifikansi yang diperlukan (misalnya, 0,10 atau lebih) berdasarkan pertukaran biaya versus nilai informasi. Jika tingkat risiko yang lebih tinggi untuk memasukkan hasil yang tidak signifikan (misalnya, tingkat signifikansi > .05) dapat diterima, fungsi diskriminan dapat dipertahankan yang signifikan pada tingkat .2 atau bahkan .3.



Jika satu atau lebih fungsi dianggap tidak signifikan secara statistik, model diskriminan harus diestimasi ulang dengan jumlah fungsi yang akan diturunkan terbatas pada jumlah fungsi yang signifikan. Dengan cara ini, penilaian akurasi prediksi dan interpretasi fungsi diskriminan hanya akan didasarkan pada fungsi signifikan. Menilai Kecocokan Model Secara Keseluruhan



Setelah fungsi diskriminan yang signifikan telah diidentifikasi, perhatian beralih ke memastikan kecocokan keseluruhan dari fungsi diskriminan yang dipertahankan. Penilaian ini melibatkan tiga tugas: 1. Menghitung diskriminan Z skor untuk setiap pengamatan



2. Mengevaluasi perbedaan kelompok pada diskriminan Z skor



3. Menilai akurasi prediksi keanggotaan grup



diskriminan Z skor dihitung untuk setiap fungsi diskriminan untuk setiap pengamatan dalam sampel. Skor diskriminan bertindak sebagai representasi ringkas dan sederhana dari setiap fungsi diskriminan, menyederhanakan proses interpretasi dan penilaian kontribusi independen



ATURAN UMUM 2 Estimasi Model dan Model Fit • Meskipun estimasi bertahap mungkin tampak optimal dengan memilih set yang paling pelit dari variabel diskriminatif maksimal, waspadalah terhadap dampak multikolinearitas pada penilaian daya diskriminatif masing-masing variabel



• Kecocokan model keseluruhan menilai signifikansi statistik antara kelompok pada diskriminan Z



skor (s), tetapi tidak menilai akurasi prediksi



• Dengan lebih dari dua kelompok, jangan batasi analisis Anda hanya pada fungsi diskriminan yang signifikan secara statistik, tetapi pertimbangkan apakah fungsi yang tidak signifikan (dengan tingkat signifikansi hingga 0,3) menambah daya penjelas



254



Analisis Diskriminan Ganda variabel. Grup dapat dibedakan berdasarkan skor diskriminannya dan, seperti yang akan kita lihat, skor diskriminan dapat memainkan peran penting dalam memprediksi keanggotaan grup. MENGHITUNG DISKRIMINAN Z SKOR Dengan



mendefinisikan fungsi diskriminan yang dipertahankan, dasar untuk menghitung diskriminan Z skor telah ditetapkan. Seperti yang dibahas sebelumnya, diskriminanZ skor dari setiap fungsi diskriminan dapat dihitung untuk setiap pengamatan dengan rumus berikut:



Zjk = a + W1 x1k + W2 x2k + + Wn xnk di mana



Zjk = diskriminatif Z skor fungsi diskriminan J untuk objek ka = mencegat WSaya = koefisien diskriminan untuk variabel bebas saya Xik = variabel bebas Saya untuk objek k diskriminan Z skor, variabel metrik, menyediakan cara langsung untuk membandingkan pengamatan pada setiap fungsi. Pengamatan dengan sejenisZ skor diasumsikan lebih mirip pada variabel yang membentuk fungsi ini dibandingkan dengan skor yang berbeda. Fungsi diskriminan dapat dinyatakan dengan bobot dan nilai terstandarisasi atau tidak terstandarisasi. Versi standar lebih berguna untuk tujuan interpretasi, tetapi versi tidak standar lebih mudah digunakan dalam menghitung diskriminanZ skor. MENGEVALUASI PERBEDAAN KELOMPOK Sekali pembeda Z skor dihitung, penilaian pertama dari keseluruhan model fit adalah untuk menentukan besarnya perbedaan antara anggota masing-masing kelompok dalam hal diskriminan. Z skor. Ukuran ringkasan perbedaan kelompok adalah perbandingan centroid kelompok, diskriminan rata-rataZ skor untuk semua anggota kelompok. Ukuran keberhasilan analisis diskriminan adalah kemampuannya untuk mendefinisikan fungsi diskriminan yang menghasilkan centroid kelompok yang berbeda secara signifikan. Perbedaan antara centroid diukur dalam hal MahalanobisD2 ukuran, yang tes tersedia untuk menentukan apakah perbedaannya signifikan secara statistik. Peneliti harus memastikan bahwa bahkan dengan fungsi diskriminan yang signifikan, perbedaan yang signifikan terjadi antara masing-masing kelompok.



Centroid grup pada setiap fungsi diskriminan juga dapat diplot untuk menunjukkan hasil dari perspektif grafis. Plot biasanya disiapkan untuk dua atau tiga fungsi diskriminan pertama (dengan asumsi mereka adalah fungsi yang signifikan secara statistik). Nilai untuk setiap grup menunjukkan posisinya dalam ruang diskriminan tereduksi (disebut demikian karena tidak semua fungsi dan dengan demikian tidak semua varians diplot). Peneliti dapat melihat perbedaan antar kelompok pada masing-masing fungsi; namun, inspeksi visual tidak sepenuhnya menjelaskan apa perbedaan ini. Lingkaran dapat digambar dengan melampirkan distribusi pengamatan di sekitar centroid masing-masing untuk memperjelas perbedaan kelompok lebih lanjut, tetapi prosedur ini berada di luar cakupan teks ini (lihat Dillon dan Goldstein [3]).



MENILAI KEAKURATAN PREDIKSI KEANGGOTAAN GRUP Mengingat bahwa variabel terikat nonmetrik, tidak mungkin menggunakan ukuran seperti R2, seperti yang dilakukan dalam regresi berganda, untuk menilai akurasi prediksi. Sebaliknya, setiap pengamatan harus dinilai apakah itu diklasifikasikan dengan benar. Dalam melakukannya, beberapa pertimbangan utama harus ditangani:



• Alasan statistik dan praktis untuk mengembangkan matriks klasifikasi • Mengklasifikasikan kasus individu



• Konstruksi matriks klasifikasi



• Standar untuk menilai akurasi klasifikasi



255



Analisis Diskriminan Ganda Mengapa Matriks Klasifikasi Dikembangkan. Uji statistik untuk menilai signifikansi fungsi diskriminan hanya menilai tingkat perbedaan antara kelompok berdasarkan diskriminan Z skor, tetapi tidak menunjukkan seberapa baik fungsi memprediksi. Uji statistik ini memiliki kelemahan yang sama dengan uji hipotesis klasik. Misalnya, anggaplah kedua kelompok dianggap berbeda secara signifikan di luar level 0,01. Namun dengan ukuran sampel yang cukup besar, rata-rata kelompok (centroid) bisa jadi hampir identik dan masih memiliki signifikansi statistik. Untuk menentukan kemampuan prediksi fungsi diskriminan, peneliti harus membangun matriks klasifikasi. NS matriks klasifikasi prosedur memberikan perspektif tentang signifikansi praktis daripada signifikansi statistik. Dengan analisis diskriminan ganda,persentase diklasifikasikan dengan benar, juga disebut rasio pukulan, mengungkapkan seberapa baik fungsi diskriminan mengklasifikasikan objek. Dengan ukuran sampel yang cukup besar dalam analisis diskriminan, kita dapat memiliki perbedaan yang signifikan secara statistik antara dua (atau lebih) kelompok dan mengklasifikasikan dengan benar hanya 53 persen (ketika peluangnya 50%, dengan ukuran kelompok yang sama) [13]. Dalam kasus seperti itu, uji statistik akan menunjukkan signifikansi statistik, namun rasio hit akan memungkinkan penilaian terpisah dibuat dalam hal signifikansi praktis. Jadi, kita harus menggunakan prosedur matriks klasifikasi untuk menilai akurasi prediksi di luar signifikansi statistik saja. Mengklasifikasikan Pengamatan Individu. Pengembangan matriks klasifikasi mengharuskan setiap



pengamatan diklasifikasikan ke dalam salah satu kelompok variabel dependen berdasarkan fungsi diskriminan. Tujuannya adalah untuk mengkarakterisasi setiap pengamatan pada fungsi-fungsi diskriminan dan kemudian menentukan sejauh mana pengamatan dalam setiap kelompok dapat dideskripsikan secara konsisten oleh fungsi-fungsi diskriminan. Ada dua pendekatan untuk mengklasifikasikan pengamatan, satu menggunakan skor diskriminan secara langsung dan yang lain mengembangkan fungsi khusus untuk klasifikasi. Setiap pendekatan akan dibahas pada bagian berikut serta pentingnya menentukan peran yang dimainkan oleh ukuran sampel untuk setiap kelompok dalam proses klasifikasi.







Perhitungan Skor Pemotongan Dengan menggunakan fungsi diskriminan yang dianggap signifikan, kita dapat mengembangkan matriks klasifikasi dengan menghitung skor pemotongan (juga disebut nilai



Z kritis) untuk setiap fungsi diskriminan. Skor pemotongan adalah kriteria dimana skor diskriminan setiap objek dibandingkan untuk menentukan ke dalam kelompok mana objek harus diklasifikasikan. Skor pemotongan mewakili titik pemisah yang digunakan untuk mengklasifikasikan pengamatan ke dalam kelompok berdasarkan skor fungsi diskriminannya. Perhitungan skor pemotongan antara dua kelompok didasarkan pada dua centroid kelompok (rata-rata kelompok dari skor diskriminan) dan ukuran relatif dari dua kelompok. Centroid grup mudah dihitung dan disediakan pada setiap tahap proses bertahap.







Mengembangkan Fungsi Klasifikasi Seperti disebutkan sebelumnya, menggunakan fungsi diskriminan hanya salah satu dari dua kemungkinan pendekatan untuk klasifikasi. Pendekatan kedua menggunakan



fungsi klasifikasi, juga dikenal sebagai Fungsi diskriminan linier Fisher. Fungsi klasifikasi, satu untuk setiap kelompok, digunakan secara ketat untuk mengklasifikasikan pengamatan. Dalam metode klasifikasi ini, nilai pengamatan untuk variabel bebas dimasukkan ke dalam fungsi klasifikasi dan skor klasifikasi untuk setiap kelompok dihitung untuk pengamatan tersebut. Pengamatan tersebut kemudian diklasifikasikan ke dalam kelompok dengan skor klasifikasi tertinggi. Mendefinisikan Probabilitas Sebelumnya. Dampak dan pentingnya ukuran sampel setiap kelompok



dalam proses klasifikasi seringkali diabaikan, namun sangat penting dalam membuat asumsi yang tepat dalam proses klasifikasi. Apakah ukuran kelompok relatif memberi tahu kita sesuatu tentang kejadian yang diharapkan dari setiap kelompok dalam populasi atau apakah itu hanya artefak dari proses pengumpulan data? Di sini kita prihatin tentang keterwakilan sampel yang berkaitan dengan representasi ukuran relatif kelompok dalam populasi aktual yang sebenarnya, yang dapat dinyatakan sebagai probabilitas sebelumnya (yaitu, proporsi relatif masing-masing kelompok terhadap total sampel). ). Pertanyaan mendasarnya adalah: Apakah ukuran kelompok relatif mewakili ukuran kelompok dalam populasi? Asumsi default untuk sebagian besar program statistik adalah probabilitas sebelumnya yang sama; di dalam



256



Analisis Diskriminan Ganda Dengan kata lain, setiap kelompok diasumsikan memiliki peluang yang sama untuk terjadi meskipun ukuran kelompok dalam sampel tidak sama. Jika peneliti tidak yakin tentang apakah proporsi yang diamati dalam sampel mewakili proporsi populasi, pendekatan konservatif adalah dengan menggunakan probabilitas yang sama. Dalam beberapa kasus perkiraan probabilitas sebelumnya mungkin tersedia, seperti dari penelitian sebelumnya. Di sini asumsi default dari probabilitas sebelumnya yang sama diganti dengan nilai yang ditentukan oleh peneliti. Dalam kedua contoh, ukuran grup aktual diganti berdasarkan probabilitas sebelumnya yang ditentukan. Namun, jika sampel dilakukan secara acak dan peneliti merasa bahwa ukuran kelompok mewakili populasi, maka peneliti dapat menentukan probabilitas sebelumnya berdasarkan sampel estimasi. Dengan demikian, ukuran kelompok yang sebenarnya dianggap representatif dan digunakan secara langsung dalam perhitungan skor pemotongan (lihat pembahasan berikut). Dalam semua kasus, bagaimanapun, peneliti harus menentukan bagaimana probabilitas sebelumnya dihitung, yang mempengaruhi ukuran kelompok yang digunakan dalam perhitungan seperti yang diilustrasikan.



Misalnya, pertimbangkan sampel ketidaksepakatan yang terdiri dari 200 pengamatan, dengan ukuran kelompok 60 dan 140 yang berhubungan dengan probabilitas sebelumnya masing-masing 30 persen dan 70 persen. Jika sampel dianggap representatif, maka ukuran sampel 60 dan 140 digunakan dalam menghitung skor pemotongan. Namun, jika sampel dianggap tidak representatif, peneliti harus menentukan probabilitas sebelumnya. Jika ditentukan sama (50% dan 50%), ukuran sampel 100 dan 100 akan digunakan dalam perhitungan skor pemotongan daripada ukuran sampel sebenarnya. Menentukan nilai lain untuk probabilitas sebelumnya akan menghasilkan ukuran sampel yang berbeda untuk kedua kelompok.



• Menghitung Skor Pemotongan Optimal Pentingnya probabilitas sebelumnya dapat diilustrasikan dalam perhitungan skor pemotongan "optimal", yang memperhitungkan probabilitas sebelumnya melalui penggunaan ukuran kelompok. Rumus dasar untuk menghitung skor pemotongan optimal antara dua kelompok adalah:



Z CS =



NZ AB + nBZA nA + nB



di mana



ZCS = skor pemotongan optimal antara kelompok A dan B



nA = jumlah pengamatan pada kelompok A nB = jumlah pengamatan pada kelompok B ZA = pusat massa untuk grup A ZB = pusat massa untuk grup B



Dengan ukuran grup yang tidak sama, skor pemotongan optimal untuk fungsi diskriminan sekarang menjadi rata-rata tertimbang dari centroid grup. Skor pemotongan dibobot ke kelompok yang lebih kecil, semoga membuat klasifikasi yang lebih baik dari kelompok yang lebih besar. Jika kelompok ditentukan untuk menjadi ukuran yang sama (probabilitas sebelumnya didefinisikan sebagai sama), maka skor pemotongan optimal akan berada di tengah antara dua pusat massa kelompok dan menjadi rata-rata dari dua pusat:



ZCE =



Z A+ ZB



2



di mana



ZCE = nilai skor pemotongan kritis untuk ukuran kelompok yang sama



ZA = pusat massa untuk grup A ZB = pusat massa untuk grup B



257



Analisis Diskriminan Ganda Skor pemotongan = ZCE



grup A



Grup B



ZA



ZB Klasifikasikan sebagai B



(Pembeli)



Klasifikasikan sebagai A



(Bukan pembeli) GAMBAR 7 Skor Pemotongan Optimal dengan Ukuran Sampel yang Sama



Kedua rumus untuk menghitung skor pemotongan optimal mengasumsikan bahwa distribusi normal dan struktur dispersi kelompok diketahui. Konsep skor pemotongan optimal untuk kelompok yang sama dan tidak sama diilustrasikan masing-masing pada Gambar 7 dan 8. Baik skor pemotongan berbobot dan tidak berbobot ditampilkan. Jelas bahwa jika grup A jauh lebih kecil dari grup B, skor pemotongan optimal akan lebih dekat ke centroid grup A daripada centroid grup B. Juga, jika skor pemotongan tidak berbobot digunakan, tidak ada objek di grup A akan salah diklasifikasikan, tetapi sebagian besar dari mereka di grup B akan salah diklasifikasikan. Biaya Kesalahan Klasifikasi. Skor pemotongan yang optimal juga harus mempertimbangkan biaya kesalahan pengklasifikasian suatu objek ke dalam kelompok yang salah. Jika biaya kesalahan klasifikasi kira-kira sama untuk semua kelompok, skor pemotongan optimal akan menjadi salah satu yang akan salah mengklasifikasikan jumlah objek paling sedikit di semua kelompok. Jika biaya kesalahan klasifikasi tidak sama, skor pemotongan optimum akan menjadi salah satu yang meminimalkan biaya kesalahan klasifikasi. Pendekatan yang lebih canggih untuk menentukan skor pemotongan dibahas dalam Dillon dan Goldstein [3] dan Huberty et al. [11]. Pendekatan ini didasarkan pada model statistik Bayesian dan sesuai ketika biaya kesalahan klasifikasi ke dalam kelompok tertentu tinggi, ketika kelompok terlalu



Tertimbang optimal



tidak berbobot



skor pemotongan



skor pemotongan



Grup B



grup A



ZA



ZB



ANGKA 8 Skor Pemotongan Optimal dengan Ukuran Sampel yang Tidak Sama



258



Analisis Diskriminan Ganda ukuran yang berbeda, atau ketika seseorang ingin memanfaatkan sebuah prioritas pengetahuan tentang probabilitas keanggotaan kelompok.



Dalam praktiknya, ketika menghitung skor pemotongan, tidak perlu memasukkan pengukuran variabel mentah untuk setiap individu ke dalam fungsi diskriminan dan untuk mendapatkan skor diskriminan untuk setiap orang untuk digunakan dalam menghitung ZA dan ZB (centroid grup A dan B). Program komputer akan memberikan skor diskriminan serta:ZA dan ZB sebagai keluaran reguler. Ketika peneliti memiliki centroid kelompok dan ukuran sampel, skor pemotongan yang optimal dapat diperoleh hanya dengan mengganti nilai ke dalam formula yang sesuai. Membangun Matriks Klasifikasi. Untuk memvalidasi fungsi diskriminan melalui penggunaan matriks klasifikasi, sampel harus dibagi secara acak menjadi dua kelompok. Salah satu kelompok (sampel analisis) digunakan untuk menghitung fungsi diskriminan. Kelompok lain (contoh ketidaksepakatan atau validasi) dipertahankan untuk digunakan dalam mengembangkan matriks klasifikasi.



Klasifikasi setiap pengamatan dapat dilakukan melalui salah satu pendekatan klasifikasi yang telah dibahas sebelumnya. Untuk pendekatan Fisher, suatu pengamatan diklasifikasikan ke dalam kelompok dengan skor fungsi klasifikasi terbesar. Saat menggunakan skor diskriminan dan skor pemotongan optimal, prosedurnya adalah sebagai berikut: Klasifikasikan seorang individu ke dalam kelompok A jika Zn < Zct



atau Klasifikasikan seorang individu ke dalam kelompok B jika Zn > Zct di mana



Zn = diskriminatif Z skor untuk nindividu ke Zct = nilai skor pemotongan kritis Hasil dari prosedur klasifikasi disajikan dalam bentuk matriks, seperti yang ditunjukkan pada Tabel 4. Entri pada diagonal matriks mewakili jumlah individu yang diklasifikasikan dengan benar. Angkaangka dari diagonal mewakili klasifikasi yang salah. Entri di bawah kolom berlabel "Ukuran Grup Aktual" mewakili jumlah individu sebenarnya di masing-masing dari dua kelompok. Entri di bagian bawah kolom mewakili jumlah individu yang ditetapkan ke grup oleh fungsi diskriminan. Persentase yang diklasifikasikan dengan benar untuk setiap grup ditampilkan di sisi kanan matriks, dan persentase keseluruhan yang diklasifikasikan dengan benar, juga dikenal sebagai rasio hit, ditampilkan di bagian bawah. Dalam contoh kita, jumlah individu yang ditetapkan dengan benar ke grup 1 adalah 22, sedangkan 3 anggota grup 1 salah ditugaskan ke grup 2. Demikian pula, jumlah klasifikasi yang benar untuk



TABEL 4 Matriks Klasifikasi untuk Analisis Diskriminan Dua Kelompok Grup yang Diprediksi Grup Sebenarnya



Persentase dengan Benar



Grup Sebenarnya



1



2



1 2



22 5



3 20



25 25



88 80



27



23



50



84A



Grup yang diprediksi ukuran



APersentase



Ukuran



Rahasia



yang diklasifikasikan dengan benar = (Jumlah yang diklasifikasikan dengan benar/Jumlah total pengamatan) * 100



= [(22 + 20)/50] * 100 = 84%



259



Analisis Diskriminan Ganda kelompok 2 adalah 20, dan jumlah tugas yang salah untuk kelompok 1 adalah 5. Jadi, persentase akurasi klasifikasi dari fungsi diskriminan untuk kelompok 1 dan 2 yang sebenarnya adalah 88 dan 80 persen, masingmasing. Akurasi klasifikasi secara keseluruhan (hit ratio) adalah 84 persen. Satu topik terakhir mengenai prosedur klasifikasi adalah T uji yang tersedia untuk menentukan tingkat signifikansi untuk akurasi klasifikasi. Rumus untuk analisis dua kelompok (ukuran sampel yang sama) adalah



P - .5



t=



. 5(1.0 - .5)



A



n



di mana



p = proporsi diklasifikasikan dengan benar



N = ukuran sampel Rumus ini dapat diadaptasi untuk digunakan dengan lebih banyak kelompok dan ukuran sampel yang tidak sama.



Menetapkan Standar Perbandingan untuk Rasio Hit. Seperti disebutkan sebelumnya, prediksi akurasi fungsi diskriminan diukur dengan rasio hit, yang diperoleh dari matriks klasifikasi. Peneliti mungkin bertanya, Apa yang dianggap sebagai tingkat akurasi prediksi yang dapat diterima untuk fungsi diskriminan? Misalnya, apakah 60 persen merupakan tingkat yang dapat diterima, atau haruskah seseorang berharap mendapatkan akurasi prediksi 80 hingga 90 persen? Untuk menjawab pertanyaan ini, peneliti harus terlebih dahulu menentukan persentase yang dapat diklasifikasikan dengan benar oleh:kesempatan (tanpa bantuan



fungsi diskriminan).



• Standar Perbandingan untuk Rasio Hit untuk Ukuran Grup yang Sama Ketika ukuran



sampel kelompok sama, penentuan klasifikasi peluang agak sederhana; diperoleh dengan membagi 1 dengan banyaknya kelompok. Rumusnya adalah:



CSETARA = 1 , Jumlah grup







Misalnya, untuk fungsi dua grup, peluang peluangnya adalah 0,50; untuk fungsi tiga grup, peluang peluangnya adalah 0,33; Dan seterusnya. Standar Perbandingan untuk Rasio Hit untuk Ukuran Grup yang Tidak Sama Penentuan klasifikasi peluang untuk situasi di mana ukuran kelompok tidak sama agak lebih terlibat. Haruskah kita mempertimbangkan hanya kelompok terbesar, probabilitas gabungan dari semua kelompok ukuran yang berbeda, atau standar lain? Mari kita asumsikan bahwa kita memiliki total sampel 200 pengamatan yang dibagi menjadi sampel ketidaksepakatan dan analisis masing-masing 100 pengamatan. Dalam sampel ketidaksepakatan, 75 subjek milik satu kelompok dan 25 milik yang lain. Kami akan memeriksa kemungkinan cara di mana kami dapat membangun standar untuk perbandingan dan apa yang diwakili masing-masing. • Disebut sebagai kriteria peluang maksimum, kita dapat secara sewenang-wenang menetapkan semua subjek ke grup terbesar. Kriteria peluang maksimum harus digunakan ketika satu-satunya tujuan dari analisis diskriminan adalah untuk memaksimalkan persentase yang diklasifikasikan dengan benar [13]. Ini juga merupakan standar yang paling konservatif karena akan menghasilkan standar perbandingan tertinggi. Namun, situasi di mana kita hanya peduli tentang memaksimalkan persentase yang diklasifikasikan dengan benar jarang terjadi. Biasanya peneliti menggunakan analisis diskriminan untuk mengidentifikasi anggota semua kelompok dengan benar. Dalam kasus di mana ukuran sampel tidak sama dan peneliti ingin mengklasifikasikan anggota semua kelompok, fungsi diskriminan menentang peluang dengan mengklasifikasikan subjek dalam kelompok yang lebih kecil. Kriteria peluang maksimum tidak memperhitungkan fakta ini [13].



260



Analisis Diskriminan Ganda Dalam contoh sederhana kami sampel dengan dua kelompok (75 dan 25 orang masing-masing), menggunakan metode ini akan menetapkan akurasi klasifikasi 75 persen, apa yang akan dicapai dengan mengklasifikasikan setiap orang ke dalam kelompok terbesar tanpa bantuan fungsi diskriminan. Dapat disimpulkan bahwa kecuali fungsi diskriminan mencapai akurasi klasifikasi lebih tinggi dari 75 persen, itu harus diabaikan karena tidak membantu kami meningkatkan akurasi prediksi yang dapat kami capai tanpa menggunakan analisis diskriminan sama sekali. • Ketika ukuran kelompok tidak sama dan peneliti ingin mengidentifikasi dengan benar anggota semua kelompok, bukan hanya kelompok terbesar, kriteria peluang proporsional dianggap oleh banyak orang sebagai yang paling tepat. Rumus untuk kriteria ini adalah



CPRO = P2 + (1 - P)2 di mana



p = proporsi individu dalam kelompok 1 1 - p = proporsi individu dalam kelompok 2 Dengan menggunakan ukuran kelompok dari contoh sebelumnya (75 dan 25), kita melihat bahwa kriteria peluang proporsional adalah 62,5 persen [.752 + (1.0 – .75)2 = 0,625] dibandingkan dengan 75 persen. Oleh karena itu, dalam hal ini, akurasi prediksi aktual sebesar 75 persen dapat diterima karena berada di atas kriteria peluang proporsional 62,5 persen. • Masalah dengan kriteria peluang maksimum atau peluang proporsional adalah ukuran sampel yang digunakan untuk menghitung standar. Apakah Anda menggunakan ukuran kelompok dari sampel keseluruhan, sampel analisis/estimasi, atau sampel validasi/ketidakmampuan? Beberapa saran: • Jika ukuran sampel dari sampel analisis dan estimasi masing-masing dianggap cukup besar (yaitu, total sampel 100 dengan masing-masing kelompok memiliki setidaknya 20 kasus), turunkan standar terpisah untuk setiap sampel.



• Jika sampel terpisah dianggap tidak cukup besar, gunakan ukuran kelompok dari total sampel dalam menghitung standar. • Waspadai perbedaan ukuran kelompok antar sampel saat menggunakan kriteria peluang maksimum, karena bergantung pada ukuran kelompok terbesar. Pedoman ini sangat penting ketika ukuran sampel kecil atau ketika proporsi ukuran kelompok sangat bervariasi dari sampel ke sampel. Ini adalah alasan lain untuk berhati-hati dalam penggunaan kriteria peluang maksimum. • Kriteria model peluang ini hanya berguna jika dihitung dengan sampel yang tidak memiliki (pendekatan sampel terpisah). Jika individu yang digunakan dalam menghitung fungsi diskriminan adalah yang diklasifikasikan, hasilnya akan menjadi bias ke atas dalam akurasi prediksi. Dalam kasus seperti itu, kedua kriteria ini harus disesuaikan ke atas untuk memperhitungkan bias ini. Membandingkan Rasio Hit dengan Standar. Pertanyaan "Seberapa tinggi akurasi klasifikasi harus?" sangat



penting. Jika persentase klasifikasi yang benar secara signifikan lebih besar daripada yang diharapkan secara kebetulan, peneliti dapat melanjutkan dalam menafsirkan fungsi diskriminan dan profil kelompok. Namun, jika akurasi klasifikasi tidak lebih besar dari yang diharapkan secara kebetulan, perbedaan apa pun yang tampak ada sebenarnya hanya membutuhkan sedikit atau tidak ada interpretasi; yaitu, perbedaan dalam profil skor tidak akan memberikan informasi yang berarti untuk mengidentifikasi keanggotaan kelompok.



Pertanyaannya, kemudian, seberapa tinggi akurasi klasifikasi relatif terhadap kebetulan? Misalnya, jika peluangnya adalah 50 persen (dua kelompok, ukuran sampel yang sama), apakah akurasi klasifikasi (prediktif) sebesar 60 persen membenarkan pindah ke tahap interpretasi? Pada akhirnya, keputusan tergantung pada biaya relatif terhadap nilai informasi. Argumen biaya-versus-nilai menawarkan sedikit bantuan kepada peneliti data pemula, tetapi kriteria berikut disarankan:Akurasi klasifikasi harus setidaknya seperempat lebih besar dari yang dicapai secara kebetulan.



261



Analisis Diskriminan Ganda



Misalnya, jika akurasi peluang adalah 50 persen, akurasi klasifikasi harus 62,5 persen (62,5% = 1,25 × 50%). Jika akurasi peluang adalah 30 persen, akurasi klasifikasi seharusnya 37,5 persen (37,5% = 1,25 × 30%). Kriteria ini hanya memberikan perkiraan kasar dari tingkat akurasi prediksi yang dapat diterima. Kriteria ini mudah diterapkan dengan kelompok dengan ukuran yang sama. Dengan kelompok dengan ukuran yang tidak sama, batas atas tercapai ketika model peluang maksimum digunakan untuk menentukan akurasi peluang. Namun, itu tidak menimbulkan masalah yang terlalu besar, karena dalam kebanyakan keadaan, model peluang maksimum tidak akan digunakan dengan ukuran kelompok yang tidak sama. Keseluruhan Rasio Hit Khusus Grup Versus. Untuk titik ini, kami fokus pada evaluasi rasio hit keseluruhan di



semua kelompok dalam menilai akurasi prediksi dari analisis diskriminan. Peneliti juga harus memperhatikan rasio hit (persen diklasifikasikan dengan benar) untuk setiap kelompok yang terpisah. Jika Anda hanya berfokus pada rasio klik keseluruhan, ada kemungkinan bahwa satu atau beberapa grup, terutama grup yang lebih kecil, mungkin memiliki rasio klik yang tidak dapat diterima sedangkan rasio klik keseluruhan dapat diterima. Peneliti harus mengevaluasi rasio hit masing-masing kelompok dan menilai apakah analisis diskriminan memberikan tingkat akurasi prediksi yang memadai baik di tingkat keseluruhan maupun untuk setiap kelompok.



Ukuran Akurasi Klasifikasi Berbasis Statistik Relatif terhadap Peluang. Sebuah statistik menguji kekuatan diskriminatif matriks klasifikasi bila dibandingkan dengan model peluang adalah pers Q statistik. Ukuran sederhana ini membandingkan jumlah klasifikasi yang benar dengan ukuran sampel total dan jumlah kelompok. Nilai yang dihitung kemudian dibandingkan dengan nilai kritis (nilai chi-kuadrat untuk 1 derajat kebebasan pada tingkat kepercayaan yang diinginkan). Jika melebihi nilai kritis ini, maka matriks klasifikasi dapat dianggap lebih baik secara statistik daripada kebetulan. NS



Q statistik dihitung dengan rumus berikut:



[N - (nK)]2



pers Q =



N(K - 1)



di mana



N = ukuran sampel total n = jumlah pengamatan yang diklasifikasikan dengan benar



K = jumlah grup



Misalnya, pada Tabel 4, Q statistik akan didasarkan pada sampel total n = 50, n = 42 pengamatan yang diklasifikasikan dengan benar, dan K = 2 kelompok. Statistik yang dihitung akan menjadi:



pers Q =



[50 - (42 * 2)]2 50(2 - 1)



= 23.12



Nilai kritis pada taraf signifikansi 0,01 adalah 6,63. Jadi, kami akan menyimpulkan bahwa dalam contoh prediksi secara signifikan lebih baik daripada kebetulan, yang akan memiliki tingkat klasifikasi yang benar sebesar 50 persen. Tes sederhana ini sensitif terhadap ukuran sampel; sampel besar lebih cenderung menunjukkan signifikansi daripada ukuran sampel kecil dengan tingkat klasifikasi yang sama.



Misalnya, jika ukuran sampel ditingkatkan menjadi 100 dalam contoh dan tingkat klasifikasi tetap pada 84 persen, Q statistik meningkat menjadi 46,24. Jika ukuran sampel meningkat menjadi 200, tetapi mempertahankan tingkat klasifikasi 84 persen,Q statistik meningkat lagi menjadi 92,48. Tetapi jika ukuran sampel hanya 20 dan tingkat kesalahan klasifikasi masih 84 persen (17 prediksi yang benar),Q statistik hanya akan menjadi 9,8. Dengan demikian, periksaQ statistik mengingat ukuran sampel karena peningkatan ukuran sampel akan meningkatkan Q statistik bahkan untuk tingkat klasifikasi keseluruhan yang sama.



262



Analisis Diskriminan Ganda Seseorang harus berhati-hati dalam menarik kesimpulan hanya berdasarkan statistik ini, karena ketika ukuran sampel menjadi lebih besar, tingkat klasifikasi yang lebih rendah akan tetap dianggap signifikan.



Diagnostik Casewise Cara terakhir untuk menilai kecocokan model adalah memeriksa hasil prediksi berdasarkan kasus per kasus. Serupa dengan analisis residual dalam regresi berganda, tujuannya adalah untuk memahami pengamatan mana (1) yang salah diklasifikasikan dan (2) tidak mewakili anggota kelompok yang tersisa. Meskipun matriks klasifikasi memberikan akurasi klasifikasi secara keseluruhan, matriks ini tidak merinci hasil kasus individual. Juga, bahkan jika kita dapat menunjukkan kasus mana yang diklasifikasikan dengan benar atau salah, kita masih membutuhkan ukuran kesamaan pengamatan dengan sisa kelompok. KESALAHAN KASUS INDIVIDU Saat menganalisis residu dari analisis regresi berganda, keputusan penting melibatkan pengaturan tingkat residu yang dianggap substantif dan layak diperhatikan. Dalam analisis diskriminan, masalah ini agak lebih sederhana karena pengamatan diklasifikasikan dengan benar atau salah. Semua program komputer memberikan informasi yang mengidentifikasi kasus mana yang salah



diklasifikasikan dan kelompok mana yang salah diklasifikasikan. Peneliti dapat mengidentifikasi tidak hanya kasus-kasus dengan kesalahan klasifikasi, tetapi representasi langsung dari jenis kesalahan klasifikasi. MENGANALISIS KASUS YANG TIDAK TERKLASIFIKASI Tujuan mengidentifikasi dan menganalisis pengamatan yang salah



diklasifikasikan adalah untuk mengidentifikasi karakteristik apa pun dari pengamatan ini yang dapat dimasukkan ke dalam analisis diskriminan untuk meningkatkan akurasi prediksi. Analisis ini dapat berupa pembuatan profil kasuskasus yang salah klasifikasi pada variabel bebas atau variabel lain yang tidak termasuk dalam model.



Profil pada Variabel Independen. Meneliti kasus-kasus ini pada variabel independen dapat mengidentifikasi tren nonlinier atau hubungan atau atribut lain yang menyebabkan kesalahan klasifikasi. Beberapa teknik sangat tepat dalam analisis diskriminan: • Representasi grafis dari pengamatan mungkin merupakan pendekatan yang paling sederhana namun efektif untuk memeriksa karakteristik pengamatan, terutama pengamatan yang salah klasifikasi. Pendekatan yang paling umum adalah untuk memplot pengamatan berdasarkan diskriminan merekaZ skor dan menggambarkan tumpang tindih antara kelompok dan kasus-kasus yang salah diklasifikasikan. Jika dua atau lebih fungsi dipertahankan, titik potong optimal juga dapat digambarkan untuk memberikan apa yang dikenal sebagai peta teritorial menggambarkan daerah yang sesuai untuk masing-masing kelompok.



• Memplot pengamatan individu bersama dengan centroid kelompok, seperti yang dibahas sebelumnya, menunjukkan tidak hanya karakteristik umum kelompok yang digambarkan dalam centroid, tetapi juga variasi dalam anggota kelompok. Ini analog dengan area yang didefinisikan dalam contoh tiga grup di awal bab ini, di mana skor pemotongan pada kedua fungsi mendefinisikan area yang sesuai dengan prediksi klasifikasi untuk setiap grup. • Penilaian empiris langsung dari kesamaan pengamatan dengan anggota kelompok lain dapat dilakukan dengan mengevaluasi Mahalanobis D2 jarak pengamatan ke pusat massa kelompok. Berdasarkan himpunan variabel bebas, pengamatan yang lebih dekat ke centroid memiliki Mahalanobis yang lebih kecilD2 dan dianggap lebih mewakili kelompok daripada mereka yang lebih jauh. • Ukuran empiris harus dikombinasikan dengan analisis grafis, karena meskipun Mahalanobis besar D2 nilai memang menunjukkan pengamatan yang cukup berbeda dari kelompok centroid, itu tidak selalu menunjukkan kesalahan klasifikasi. Misalnya, dalam situasi dua kelompok, seorang anggota kelompok A mungkin memiliki Mahalanobis . yang besarD2 jarak, menunjukkan itu kurang mewakili kelompok. Namun, jika jarak tersebut jauh dari centroid grup B, maka sebenarnya akan meningkatkan peluang klasifikasi yang benar, meskipun kurang mewakili grup. Jarak yang lebih kecil yang menempatkan pengamatan antara dua centroid mungkin akan memiliki kemungkinan klasifikasi yang benar lebih rendah, meskipun lebih dekat ke centroid grupnya daripada situasi sebelumnya.



263



Analisis Diskriminan Ganda



ATURAN UMUM 3 Menilai Kecocokan Model dan Akurasi Prediktif • Matriks klasifikasi dan rasio hit menggantikan R2 sebagai ukuran model fit: • Menilai rasio hit baik secara keseluruhan maupun berdasarkan kelompok



• Jika estimasi dan analisis sampel keduanya melebihi 100 kasus dan setiap kelompok melebihi 20 kasus, turunkan standar terpisah untuk setiap sampel; jika tidak, turunkan standar tunggal dari sampel keseluruhan



• Beberapa kriteria digunakan untuk perbandingan rasio hit: • Kriteria peluang maksimum untuk mengevaluasi rasio hit adalah yang paling konservatif, memberikan nilai dasar tertinggi untuk dilampaui • Berhati-hatilah dalam menggunakan kriteria peluang maksimum dalam situasi dengan sampel keseluruhan kurang dari 100 dan/ atau ukuran kelompok di bawah 20 • Kriteria peluang proporsional mempertimbangkan semua kelompok dalam menetapkan standar perbandingan dan merupakan yang paling populer



• Akurasi prediksi aktual (rasio hit) harus melebihi nilai kriteria apa pun setidaknya 25 persen • Menganalisis pengamatan yang salah klasifikasi baik secara grafis (peta teritorial) dan empiris (Mahalanobis D2)



Meskipun tidak ada analisis yang ditentukan sebelumnya, seperti yang ditemukan dalam regresi berganda, peneliti didorong untuk mengevaluasi kasus-kasus yang salah diklasifikasikan ini dari beberapa perspektif dalam mencoba mengungkap fitur unik yang mereka miliki dibandingkan dengan anggota kelompok mereka yang lain.



TAHAP 5: INTERPRETASI HASIL Jika fungsi diskriminan signifikan secara statistik dan akurasi klasifikasi dapat diterima, peneliti harus fokus pada membuat interpretasi substantif dari temuan. Proses ini melibatkan pemeriksaan fungsi diskriminan untuk menentukan kepentingan relatif dari setiap variabel independen dalam membedakan antara kelompok. Tiga metode untuk menentukan kepentingan relatif telah diusulkan:



1. Bobot diskriminan standar 2. Pembebanan diskriminan (korelasi struktur) 3. Sebagian F nilai-nilai



Bobot Diskriminan Pendekatan tradisional untuk menafsirkan fungsi diskriminan memeriksa tanda dan besaran dari standar berat diskriminan (juga disebut sebagai koefisien diskriminan) ditugaskan untuk setiap variabel dalam menghitung fungsi diskriminan. Ketika tanda diabaikan, setiap bobot mewakili kontribusi relatif dari variabel terkaitnya ke fungsi itu. Variabel independen dengan bobot yang relatif lebih besar berkontribusi lebih banyak pada daya pembeda fungsi daripada variabel dengan bobot yang lebih kecil. Tanda hanya menunjukkan bahwa variabel memberikan kontribusi positif atau negatif [3]. Interpretasi bobot diskriminan analog dengan interpretasi bobot beta dalam analisis regresi dan oleh karena itu tunduk pada kritik yang sama. Misalnya, bobot yang kecil dapat menunjukkan bahwa variabel terkaitnya tidak relevan dalam menentukan suatu hubungan atau bahwa variabel tersebut telah dipisahkan dari hubungan karena tingkat multikolinearitas yang tinggi. Masalah lain dengan penggunaan bobot diskriminan adalah bahwa mereka tunduk pada ketidakstabilan yang cukup besar. Masalah-masalah ini menyarankan kehatihatian dalam menggunakan bobot untuk menginterpretasikan hasil analisis diskriminan.



264



Analisis Diskriminan Ganda



Pemuatan Diskriminan Pemuatan diskriminan, kadang-kadang disebut sebagai korelasi struktur, semakin banyak digunakan sebagai dasar interpretasi karena kekurangan dalam memanfaatkan bobot. Mengukur korelasi linier sederhana antara masing-masing variabel independen dan fungsi diskriminan, beban diskriminan mencerminkan varians bahwa variabel independen berbagi dengan fungsi diskriminan. Dalam hal ini mereka dapat diinterpretasikan seperti beban faktor dalam menilai kontribusi relatif dari setiap variabel independen terhadap fungsi diskriminan. Salah satu karakteristik unik dari pembebanan adalah bahwa pembebanan dapat dihitung untuk semua variabel, apakah mereka digunakan dalam estimasi fungsi diskriminan atau tidak. Aspek ini sangat berguna ketika prosedur estimasi bertahap digunakan dan beberapa variabel tidak termasuk dalam fungsi diskriminan. Daripada tidak memiliki cara untuk memahami dampak relatifnya, pembebanan memberikan efek relatif dari setiap variabel pada ukuran umum. Dengan pembebanan, pertanyaan utamanya adalah: Nilai apa yang harus dicapai oleh pembebanan untuk dianggap sebagai pembeda substantif yang patut diperhatikan? Dalam analisis diskriminan simultan atau bertahap, variabel yang menunjukkan pembebanan ;.40 atau lebih tinggi dianggap substantif. Dengan prosedur bertahap, penentuan ini dilengkapi karena teknik ini mencegah variabel yang tidak signifikan memasuki fungsi. Namun, multikolinearitas dan faktor lain dapat menghalangi variabel untuk memasuki persamaan, yang tidak berarti bahwa variabel tersebut tidak memiliki efek yang substansial. Pembebanan diskriminan (seperti bobot) dapat mengalami ketidakstabilan. Pemuatan dianggap relatif lebih valid daripada bobot sebagai sarana untuk menafsirkan daya pembeda variabel bebas karena sifat korelasionalnya. Peneliti masih harus berhati-hati saat menggunakan pembebanan untuk menginterpretasikan fungsi diskriminan.



Sebagian F Nilai Seperti dibahas sebelumnya, dua pendekatan komputasi — simultan dan bertahap — dapat digunakan dalam menurunkan fungsi diskriminan. Ketika metode bertahap dipilih, sarana tambahan untuk menafsirkan daya pembeda relatif dari variabel independen tersedia melalui penggunaan parsialF nilainilai. Hal ini dicapai dengan memeriksa ukuran absolut dari signifikanF nilai-nilai dan peringkat mereka. BesarF nilai menunjukkan kekuatan diskriminatif yang lebih besar. Dalam praktiknya, peringkat menggunakanF pendekatan nilai sama dengan pemeringkatan yang berasal dari penggunaan bobot diskriminan, tetapi F nilai menunjukkan tingkat signifikansi terkait untuk setiap variabel.



Interpretasi Dua atau Lebih Fungsi Dalam kasus dua atau lebih fungsi diskriminan yang signifikan, kita dihadapkan pada masalah interpretasi tambahan. Pertama, dapatkah kita menyederhanakan bobot atau beban diskriminan untuk memfasilitasi pembuatan profil setiap fungsi? Kedua, bagaimana kita merepresentasikan dampak dari setiap variabel di semua fungsi? Masalah-masalah ini ditemukan baik dalam mengukur efek pembeda total di seluruh fungsi dan dalam menilai peran masing-masing variabel dalam membuat profil setiap fungsi secara terpisah. Kami menjawab dua pertanyaan ini dengan memperkenalkan konsep rotasi fungsi, indeks potensi, dan representasi vektor yang diregangkan. ROTASI FUNGSI DISKRIMINAN Setelah



fungsi diskriminan dikembangkan, mereka dapat diputar untuk mendistribusikan kembali varians. Pada dasarnya, rotasi mempertahankan struktur asli dan keandalan solusi diskriminan sambil membuat fungsi lebih mudah untuk ditafsirkan secara substantif. Dalam kebanyakan kasus, rotasi VARIMAX digunakan sebagai dasar untuk rotasi.



265



Analisis Diskriminan Ganda INDEKS POTENSI Sebelumnya, kita telah membahas penggunaan bobot standar atau pembebanan diskriminan sebagai ukuran kontribusi variabel terhadap fungsi diskriminan. Ketika dua atau lebih fungsi diturunkan, bagaimanapun, ukuran gabungan atau ringkasan berguna dalam menggambarkan kontribusi variabel di semua fungsi yang signifikan. NSindeks potensi adalah ukuran relatif di antara semua variabel dan merupakan indikasi daya pembeda setiap variabel [14]. Ini mencakup kontribusi variabel ke fungsi diskriminan (pembebanan diskriminannya) dan kontribusi relatif fungsi terhadap solusi keseluruhan (ukuran relatif di antara fungsi berdasarkan nilai eigen). Komposit hanyalah jumlah dari indeks potensi individu di semua fungsi diskriminan yang signifikan. Interpretasi ukuran komposit dibatasi, bagaimanapun, oleh fakta bahwa itu hanya berguna dalam menggambarkan posisi relatif (seperti urutan peringkat) dari setiap variabel, dan nilai absolut tidak memiliki arti yang sebenarnya. Indeks potensi dihitung dengan proses dua langkah:



Langkah 1: Hitung nilai potensi masing-masing variabel untuk setiap fungsi signifikan. Pada langkah pertama,



daya pembeda variabel, yang diwakili oleh nilai kuadrat dari pembebanan diskriminan yang tidak diputar, "dibobot" oleh kontribusi relatif dari fungsi diskriminan terhadap solusi keseluruhan. Pertama, ukuran nilai eigen relatif untuk setiap fungsi diskriminan signifikan dihitung secara sederhana sebagai:



Nilai eigen relatif Nilai eigen dari fungsi diskriminan J dari diskriminan



fungsi J



=



Jumlah nilai eigen di semua fungsi penting



Nilai potensi masing-masing variabel pada fungsi diskriminan adalah: Nilai potensi dari variabel Saya pada fungsi j =



(Pemuatan diskriminanaku j)2 * Nilai eigen relatif dari fungsi J



Langkah 2: Hitung indeks potensi komposit di semua fungsi yang signifikan. Sekali nilai potensi telah dihitung untuk setiap fungsi, indeks potensi komposit untuk setiap variabel dihitung sebagai:



Potensi komposit dari variabel Saya



Jumlah nilai potensi variabel Saya di semua = fungsi diskriminan yang signifikan



Indeks potensi sekarang mewakili efek pembeda total dari variabel di semua fungsi pembeda yang signifikan. Namun, itu hanya ukuran relatif, dan nilai absolutnya tidak memiliki makna substantif. Contoh penghitungan indeks potensi diberikan dalam contoh tiga kelompok untuk analisis diskriminan. TAMPILAN GRAFIS SKOR DAN PEMUATAN DISKRIMINAN Untuk



menggambarkan perbedaan kelompok



pada variabel prediktor, peneliti dapat menggunakan dua pendekatan yang berbeda untuk tampilan grafis. Peta teritorial memplot kasus individu pada fungsi diskriminan yang signifikan untuk memungkinkan peneliti menilai posisi relatif dari setiap pengamatan berdasarkan skor fungsi diskriminan. Pendekatan kedua adalah memplot pembebanan diskriminan untuk memahami pengelompokan relatif dan besarnya masing-masing pembebanan pada setiap fungsi. Setiap pendekatan akan dibahas secara lebih rinci di bagian berikut. Peta Wilayah. Metode grafis yang paling umum adalah peta teritorial, di mana setiap pengamatan diplot dalam tampilan grafis berdasarkan fungsi diskriminan. Z skor pengamatan. Misalnya, asumsikan bahwa analisis diskriminan tiga kelompok memiliki dua



266



Analisis Diskriminan Ganda fungsi diskriminan. Peta teritorial dibuat dengan memplot diskriminan setiap pengamatanZ skor untuk fungsi diskriminan pertama pada sumbu X dan skor untuk fungsi diskriminan kedua pada sumbu Y. Dengan demikian, ia memberikan beberapa perspektif tentang analisis: • Merencanakan setiap anggota kelompok dengan simbol yang berbeda memungkinkan penggambaran yang mudah tentang kekhasan masing-masing kelompok serta tumpang tindihnya satu sama lain.



• Memplot setiap centroid grup menyediakan cara untuk menilai setiap anggota grup relatif terhadap centroid grupnya. Prosedur ini sangat berguna ketika menilai apakah Mahalanobis besar D2 tindakan menyebabkan kesalahan klasifikasi. • Garis yang mewakili skor pemotongan juga dapat diplot, yang menunjukkan batas yang menggambarkan rentang skor diskriminan yang diprediksi ke dalam setiap kelompok. Setiap anggota kelompok yang berada di luar batas-batas ini salah diklasifikasikan. Menunjukkan kasus yang salah klasifikasi memungkinkan untuk menilai fungsi diskriminan mana yang paling bertanggung jawab atas kesalahan klasifikasi serta sejauh mana kasus salah klasifikasi. Plot Vektor Pemuatan Diskriminan. Pendekatan grafis paling sederhana untuk menggambarkan pembebanan



diskriminan adalah dengan memplot pembebanan berotasi atau tidak berotasi yang sebenarnya pada grafik. Pendekatan yang lebih disukai adalah dengan memplot beban yang diputar. Mirip dengan penggambaran grafis dari beban faktor, metode ini menggambarkan sejauh mana setiap variabel dikaitkan dengan setiap fungsi diskriminan.



Pendekatan yang lebih akurat, bagaimanapun, melibatkan memplot pembebanan serta menggambarkan vektor untuk setiap pembebanan dan kelompok centroid. Avektor hanyalah garis lurus yang ditarik dari asal (pusat) grafik ke koordinat beban diskriminan variabel tertentu atau pusat massa grup. Denganvektor membentang representasi, panjang setiap vektor menjadi indikasi kepentingan relatif dari setiap variabel dalam membedakan antara kelompok. Prosedur plotting berlangsung dalam tiga langkah: 1. Memilih variabel: Semua variabel, apakah termasuk dalam model sebagai signifikan atau tidak, dapat diplot sebagai vektor. Dengan cara ini, pentingnya variabel collinear yang tidak disertakan, seperti dalam solusi bertahap, masih dapat digambarkan. 2. Peregangan vektor: Beban diskriminan masing-masing variabel diregangkan dengan mengalikan beban diskriminan (sebaiknya setelah rotasi) dengan univariat masing-masing F nilai. Kami mencatat bahwa vektor menunjuk ke arah kelompok yang memiliki rata-rata tertinggi pada masing-masing prediktor dan menjauh dari kelompok yang memiliki skor rata-rata terendah.



3. Memplot centroid grup: Centroid grup juga diregangkan dalam prosedur ini dengan mengalikannya dengan perkiraan F nilai yang terkait dengan setiap fungsi diskriminan. Jika beban diregangkan, centroid harus diregangkan juga untuk memplotnya secara akurat pada grafik yang sama. perkiraanF nilai untuk setiap fungsi diskriminan diperoleh dengan rumus berikut:



F nilai Fungsi = Saya nilai eigen Fungsi A



n Contoh Estimasi - NG Saya



NG - 1



B



di mana



n Contoh Estimasi = ukuran sampel sampel estimasi Sebagai contoh, asumsikan bahwa sampel dari 50 pengamatan dibagi menjadi tiga kelompok. Pengganda dari setiap nilai eigen adalah (50 - 3) (3 - 1) = 23,5. Setelah selesai, peneliti memiliki gambaran pengelompokan variabel pada setiap fungsi diskriminan, besarnya kepentingan masing-masing variabel (diwakili oleh panjang masing-masing variabel).



267



Analisis Diskriminan Ganda vektor), dan profil masing-masing kelompok centroid (ditunjukkan oleh kedekatan dengan setiap vektor). Meskipun prosedur ini harus dilakukan secara manual dalam banyak kasus, prosedur ini memberikan gambaran lengkap tentang pembebanan diskriminan dan centroid grup. Untuk detail lebih lanjut tentang prosedur ini, lihat Dillon dan Goldstein [3].



Metode Interpretasi Mana yang Digunakan? Beberapa metode untuk menginterpretasikan sifat fungsi diskriminan telah dibahas, baik untuk solusi fungsi tunggal maupun ganda. Metode mana yang harus digunakan? Pendekatan pembebanan lebih valid daripada penggunaan bobot dan harus digunakan bila memungkinkan. Penggunaan univariat dan parsialF nilai memungkinkan peneliti untuk menggunakan beberapa ukuran dan mencari beberapa konsistensi dalam evaluasi variabel. Jika dua atau lebih fungsi diperkirakan, maka peneliti dapat menggunakan beberapa teknik grafis dan indeks potensi, yang membantu dalam menafsirkan solusi multidimensi. Hal yang paling mendasar adalah bahwa peneliti harus menggunakan semua metode yang tersedia untuk sampai pada interpretasi yang paling akurat.



TAHAP 6: VALIDASI HASIL Tahap akhir dari analisis diskriminan melibatkan validasi hasil diskriminan untuk memberikan jaminan bahwa hasil tersebut memiliki validitas eksternal maupun internal. Dengan kecenderungan analisis diskriminan untuk



meningkatkan rasio hit jika dievaluasi hanya pada sampel analisis, validasi merupakan langkah penting. Selain memvalidasi rasio hit, peneliti harus menggunakan profil kelompok untuk memastikan bahwa rata-rata kelompok adalah indikator yang valid dari model konseptual yang digunakan dalam memilih variabel independen.



Prosedur Validasi Validasi merupakan langkah penting dalam setiap analisis diskriminan karena sering kali, terutama dengan sampel yang lebih kecil, hasilnya dapat kurang dapat digeneralisasikan (validitas eksternal). Pendekatan yang paling umum untuk menetapkan validitas eksternal adalah penilaian rasio hit. Validasi dapat terjadi baik dengan sampel terpisah (holdout sample) atau menggunakan prosedur yang berulang kali memproses sampel estimasi. Validitas eksternal didukung ketika rasio hit dari pendekatan yang dipilih melebihi standar perbandingan yang mewakili akurasi prediksi yang diharapkan secara kebetulan (lihat diskusi sebelumnya). MENGGUNAKAN SAMPEL HOLDOUT Paling sering validasi rasio hit dilakukan dengan membuat sampel



ketidaksepakatan, juga disebut sebagai sampel validasi. Tujuan penggunaan sampel ketidaksepakatan untuk tujuan validasi adalah untuk melihat seberapa baik fungsi diskriminan bekerja pada sampel pengamatan yang tidak digunakan untuk menurunkan fungsi diskriminan. Proses ini melibatkan pengembangan fungsi diskriminan dengan sampel analisis dan kemudian menerapkannya pada sampel ketidaksepakatan. Pembenaran untuk membagi sampel total menjadi dua kelompok adalah bahwa bias ke atas akan terjadi dalam akurasi prediksi fungsi diskriminan jika individu yang digunakan dalam mengembangkan matriks klasifikasi sama dengan yang digunakan dalam menghitung fungsi; yaitu, akurasi klasifikasi akan lebih tinggi daripada valid bila diterapkan pada sampel estimasi. Peneliti lain telah menyarankan bahwa kepercayaan yang lebih besar dapat ditempatkan pada validitas fungsi diskriminan dengan mengikuti prosedur ini beberapa kali [14]. Alih-alih membagi total sampel secara acak ke dalam kelompok analisis dan ketidaksepakatan satu kali, peneliti akan secara acak membagi sampel total menjadi sampel analisis dan sampel beberapa kali, setiap kali menguji validitas fungsi diskriminan melalui pengembangan matriks klasifikasi dan rasio hit . Kemudian beberapa rasio hit akan dirata-ratakan untuk mendapatkan ukuran tunggal.



268



Analisis Diskriminan Ganda VALIDASI SILANG Pendekatan



validasi silang untuk menilai validitas eksternal dilakukan dengan beberapa



himpunan bagian dari total sampel [2, 3]. Pendekatan yang paling banyak digunakan adalah metode jackknife. Validasi silang didasarkan pada prinsip "keluar-satu-keluar". Penggunaan yang paling umum dari metode ini adalah untuk memperkirakank - 1 subsampel, menghilangkan satu pengamatan pada satu waktu dari sampel k



kasus. Fungsi diskriminan dihitung untuk setiap subsampel dan kemudian prediksi keanggotaan kelompok dari pengamatan yang dihilangkan dibuat dengan fungsi diskriminan yang diestimasi pada kasus yang tersisa. Setelah semua prediksi keanggotaan grup dibuat, satu per satu, matriks klasifikasi dibangun dan rasio hit dihitung. Validasi silang cukup sensitif untuk ukuran sampel yang kecil. Pedoman menyarankan bahwa itu digunakan hanya ketika ukuran kelompok terkecil setidaknya tiga kali jumlah variabel prediktor, dan sebagian besar peneliti menyarankan rasio 5:1 [11]. Namun, validasi silang dapat mewakili satu-satunya pendekatan validasi yang mungkin dalam kasus di mana sampel asli terlalu kecil untuk dibagi menjadi sampel analisis dan sampel yang tidak digunakan tetapi masih melebihi pedoman yang telah dibahas. Validasi silang juga menjadi lebih banyak digunakan karena program komputer utama menyediakannya sebagai opsi program.



Memprofilkan Perbedaan Grup Teknik validasi lain adalah untuk membuat profil kelompok pada variabel independen untuk memastikan korespondensi mereka dengan basis konseptual yang digunakan dalam perumusan model asli. Setelah peneliti mengidentifikasi variabel bebas yang memberikan kontribusi terbesar dalam membedakan antar kelompok, langkah selanjutnya adalah membuat profil karakteristik kelompok berdasarkan rata-rata kelompok. Profil ini memungkinkan peneliti untuk memahami karakter masing-masing kelompok sesuai dengan variabel prediktornya. Misalnya, mengacu pada data survei KitchenAid yang disajikan pada Tabel 1, kami melihat bahwa peringkat ratarata pada "daya tahan" untuk kelompok "akan membeli" adalah 7,4, sedangkan peringkat rata-rata yang sebanding pada "daya tahan" untuk "tidak akan membeli" kelompok adalah 3.2. Dengan demikian, profil dari dua kelompok ini menunjukkan bahwa kelompok "akan membeli" menilai daya tahan yang dirasakan dari produk baru secara substansial lebih tinggi daripada kelompok "tidak akan membeli".



Pendekatan lain adalah dengan membuat profil kelompok pada satu set variabel terpisah yang harus mencerminkan perbedaan kelompok yang diamati. Profil terpisah ini memberikan penilaian validitas eksternal dalam kelompok yang bervariasi pada kedua variabel independen dan himpunan variabel terkait.



ATURAN UMUM 4 Menafsirkan dan Memvalidasi Fungsi Diskriminan • Pembebanan diskriminan adalah metode yang lebih disukai untuk menilai kontribusi setiap variabel ke fungsi diskriminan karena:



• Ukuran kepentingan standar (berkisar dari 0 hingga 1)



• Tersedia untuk semua variabel independen baik yang digunakan dalam proses estimasi maupun tidak • Tidak terpengaruh oleh multikolinearitas



• Pembebanan melebihi ±.40 dianggap substantif untuk tujuan interpretasi • Jika terdapat lebih dari satu fungsi diskriminan, pastikan untuk: • Gunakan pemuatan yang diputar



• Menilai kontribusi setiap variabel di semua fungsi dengan indeks potensi • Fungsi diskriminan harus divalidasi baik dengan sampel ketidaksepakatan atau salah satu prosedur "keluar-keluar"



269



Analisis Diskriminan Ganda



CONTOH ILUSTRASI DUA KELOMPOK Untuk mengilustrasikan penerapan analisis diskriminan dua kelompok, kami menggunakan variabel yang diambil dari database penelitian konsumen fiktif untuk sebuah perusahaan bernama HBAT. Contoh ini memeriksa masing-masing dari enam tahap proses pembuatan model untuk masalah penelitian yang sangat cocok untuk analisis diskriminan ganda.



Tahap 1: Tujuan Analisis Diskriminan Salah satu karakteristik pelanggan yang diperoleh HBAT dalam surveinya adalah variabel kategoris (x4) yang menunjukkan wilayah tempat perusahaan berada: AS/ Amerika Utara atau Di Luar Amerika Utara. Tim manajemen HBAT tertarik pada perbedaan persepsi antara pelanggan yang berlokasi dan dilayani oleh tenaga penjualan mereka yang berbasis di AS versus mereka yang berada di luar Amerika Serikat yang sebagian besar dilayani oleh distributor independen. Terlepas dari perbedaan yang ditemukan dalam hal masalah dukungan penjualan karena sifat tenaga penjualan yang melayani setiap wilayah geografis, tim manajemen tertarik untuk melihat apakah area operasi lainnya (lini produk, harga, dll.) dipandang berbeda di antara keduanya. set pelanggan. Permintaan ini mengikuti kebutuhan yang jelas oleh manajemen untuk selalu berusaha untuk lebih memahami pelanggan mereka, dalam hal ini dengan berfokus pada perbedaan yang mungkin terjadi antara wilayah geografis. Untuk melakukannya, analisis diskriminan dipilih untuk mengidentifikasi persepsi HBAT yang paling membedakan perusahaan di setiap wilayah geografis.



Tahap 2: Desain Penelitian untuk Analisis Diskriminan Tahap desain penelitian berfokus pada tiga isu utama: memilih variabel dependen dan independen, menilai kecukupan ukuran sampel untuk analisis yang direncanakan, dan membagi sampel untuk tujuan validasi. PEMILIHAN VARIABEL TERGANTUNG DAN INDEPENDEN Analisis diskriminan membutuhkan ukuran dependen nonmetrik tunggal dan satu atau lebih ukuran independen metrik yang terpengaruh untuk memberikan diferensiasi antara kelompok berdasarkan ukuran dependen.



Karena variabel terikat Daerah (x4) adalah variabel kategoris dua kelompok, diskriminan analisis adalah teknik yang tepat. Survei mengumpulkan persepsi HBAT yang sekarang dapat digunakan untuk membedakan antara dua kelompok perusahaan. Analisis diskriminan menggunakan sebagai variabel independen 13 variabel persepsi dari database (x6 ke x18) untuk membedakan antara perusahaan di setiap wilayah geografis. UKURAN SAMPEL Mengingat ukuran sampel HBAT yang relatif kecil (100 pengamatan), masalah ukuran



sampel sangat penting, terutama pembagian sampel ke dalam sampel analisis dan sampel yang tidak digunakan (lihat diskusi di bagian selanjutnya). Sampel dari 100 pengamatan, ketika dibagi menjadi sampel analisis dan sampel ketidaksepakatan masing-masing 60 dan 40, hampir tidak memenuhi rasio minimum 5:1 yang disarankan dari pengamatan terhadap variabel independen (60 pengamatan untuk 13 variabel independen potensial) dalam sampel analisis. Meskipun rasio ini akan meningkat menjadi hampir 8:1 jika sampel tidak dibagi, namun dianggap lebih penting untuk memvalidasi hasil daripada menambah jumlah pengamatan dalam sampel analisis.



Dua ukuran kelompok 26 dan 34 dalam sampel estimasi juga melebihi ukuran minimum 20 pengamatan per kelompok. Akhirnya, kedua kelompok cukup sebanding dalam ukuran untuk tidak berdampak buruk baik estimasi atau proses klasifikasi. DIVISI SAMPEL Diskusi sebelumnya menekankan perlunya memvalidasi fungsi diskriminan dengan membagi sampel menjadi dua bagian, satu digunakan untuk estimasi dan validasi lainnya. Setiap kali sampel ketidaksepakatan digunakan, peneliti harus memastikan bahwa ukuran sampel yang dihasilkan cukup untuk mendukung jumlah prediktor yang disertakan dalam analisis.



270



Analisis Diskriminan Ganda Basis data HBAT memiliki 100 pengamatan; diputuskan bahwa sampel ketidaksepakatan dari 40 pengamatan akan cukup untuk tujuan validasi. Pemisahan ini masih menyisakan 60 observasi untuk estimasi fungsi diskriminan. Selain itu, ukuran kelompok relatif dalam sampel estimasi (26 dan 34 dalam dua kelompok) akan memungkinkan estimasi tanpa komplikasi karena ukuran kelompok yang sangat berbeda. Penting untuk memastikan keacakan dalam pemilihan sampel ketidaksepakatan sehingga setiap pemesanan pengamatan tidak mempengaruhi proses estimasi dan validasi. Kartu kontrol yang diperlukan untuk pemilihan sampel ketidaksepakatan dan kinerja analisis diskriminan dua kelompok ditampilkan di Web di www.pearsonhighered.com/hair atau www.mvstats.com.



Tahap 3: Asumsi Analisis Diskriminan Asumsi utama yang mendasari analisis diskriminan melibatkan pembentukan fungsi variat atau diskriminan (normalitas, linieritas, dan multikolinearitas) dan estimasi fungsi diskriminan (matriks varians dan kovarians yang sama). Untuk tujuan ilustrasi kami tentang analisis diskriminan, asumsi ini terpenuhi pada tingkat yang dapat diterima. Sebagian besar program statistik memiliki satu atau lebih uji statistik untuk asumsi matriks kovarians atau dispersi yang sama. Tes yang paling umum adalah Box's M.



Dalam contoh dua kelompok ini, signifikansi perbedaan dalam matriks kovarians antara kedua kelompok adalah 0,011. Meskipun signifikansinya kurang dari 0,05 (dalam pengujian ini peneliti mencari nilai di atas tingkat signifikansi yang diinginkan), sensitivitas pengujian terhadap faktor selain perbedaan kovarians (misalnya, normalitas variabel dan peningkatan ukuran sampel) membuat ini tingkat yang dapat diterima. Tidak ada perbaikan tambahan yang diperlukan sebelum estimasi fungsi diskriminan dapat dilakukan.



Tahap 4: Estimasi Model Diskriminan dan Menilai Kecocokan Keseluruhan Peneliti memiliki pilihan dua pendekatan estimasi (simultan versus bertahap) dalam menentukan variabel independen yang termasuk dalam fungsi diskriminan. Setelah pendekatan estimasi dipilih, proses menentukan komposisi fungsi diskriminan yang tunduk pada persyaratan signifikansi statistik yang ditentukan oleh peneliti.



Tujuan utama dari analisis ini adalah untuk mengidentifikasi set variabel independen (persepsi HBAT) yang secara maksimal membedakan antara dua kelompok pelanggan. Jika set variabel persepsi lebih kecil atau tujuannya hanya untuk menentukan kemampuan pembeda dari seluruh rangkaian variabel persepsi, tanpa memperhatikan dampak persepsi individu, maka pendekatan simultan memasukkan semua variabel langsung ke dalam fungsi diskriminan. akan dipekerjakan. Tetapi dalam kasus ini, bahkan dengan pengetahuan tentang multikolinearitas di antara variabelvariabel persepsi yang terlihat dalam melakukan analisis faktor, pendekatan bertahap dianggap paling tepat. Kita harus mencatat, bagaimanapun, MENILAI PERBEDAAN KELOMPOK Mari kita mulai penilaian kita dari analisis diskriminan dua kelompok dengan



memeriksa Tabel 5, yang menunjukkan rata-rata kelompok untuk masing-masing variabel independen, berdasarkan 60 pengamatan yang merupakan sampel analisis. Dalam memprofilkan dua kelompok, pertama-tama kita dapat mengidentifikasi lima variabel dengan perbedaan terbesar dalam rata-rata kelompok (x6, x11, x12, x13, dan x17). Tabel 5 juga menunjukkan lambda Wilks dan ANOVA univariat yang digunakan untuk menilai signifikansi antara rata-rata variabel independen untuk kedua kelompok. Pengujian ini menunjukkan bahwa kelima variabel persepsi juga merupakan satu-satunya variabel dengan perbedaan univariat yang signifikan antara kedua kelompok. Akhirnya, Mahalanobis minimumD2 nilai-nilai



271



Analisis Diskriminan Ganda TABEL 5 Statistik Deskriptif Kelompok dan Uji Kesetaraan untuk Sampel Estimasi dalam Dua Kelompok



Analisis Diskriminan



Variabel tak bebas Grup Berarti:



Uji Kesetaraan



x4 Wilayah



Grup 0: AMERIKA SERIKAT/



Utara



x6 Kualitas produk



x7 Aktivitas E-Commerce x8 Dukungan teknis x9 Penyelesaian Keluhan x10 Periklanan x11 Lini Produk x12 Gambar Tenaga Penjualan



x13 Harga Kompetitif x14 Klaim garansi x15 produk baru x16 Pesanan & Penagihan



x17 Fleksibilitas Harga x18 Kecepatan Pengiriman



Grup 1: Di luar Utara



Amerika



Amerika



8.527 3.388 5.569 5.577 3.727 6.785 4.427 5.600 6.050 4.954 4.231 3.631 3,873



7.297 3.626 5.050 5.253 3.979 5.274 5.238 7.418 5.918 5.276 4.153 4.932 3.794



(n



Variabel independen



26)



Minimum Mahalanobis D2



Kelompok Sarana*



(n



34)



Wilks'



Minimum



Di antara



. 000 . 157 . 211



. 976 . 139 . 108



. 849



. 361



. 058



. 775



. 382



. 053



. 000



1.731



. 003



. 661



. 645



25.500 9.733 31,992



. 000



2.171



. 992



. 453



. 503



. 031



. 990



. 600



. 442



. 041



. 999



. 087



. 769



. 006



. 647



31.699



. 000



2.152



. 997



. 152



. 698



. 010



0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1



lambda



F Nilai



. 801 . 966 . 973



14.387 2.054 1.598



. 986 . 987 . 695 . 856



Makna



D2



Grup



* lambda Wilks (kamu statistik) dan univariat F rasio dengan 1 dan 58 derajat kebebasan.



juga diberikan. Nilai ini penting karena merupakan ukuran yang digunakan untuk memilih variabel untuk masuk dalam proses estimasi bertahap. Karena hanya dua kelompok yang terlibat, yang terbesarD2 nilai juga memiliki perbedaan paling signifikan antar kelompok (perhatikan bahwa hal yang sama tidak harus demikian dengan tiga atau lebih kelompok, di mana perbedaan besar antara dua kelompok mungkin tidak menghasilkan perbedaan keseluruhan terbesar di semua kelompok, seperti yang akan ditunjukkan pada tiga -contoh kelompok).



Meneliti perbedaan kelompok mengarah untuk mengidentifikasi lima variabel persepsi (x6, x11, x12, x13, dan x17) sebagai kumpulan kandidat yang paling logis untuk masuk ke dalam analisis diskriminan. Pengurangan yang ditandai dari kumpulan 13 variabel persepsi yang lebih besar ini memperkuat keputusan untuk menggunakan proses estimasi bertahap. Untuk mengidentifikasi mana dari kelima variabel ini, ditambah yang lain, yang paling baik membedakan antara kelompok, kita harus memperkirakan fungsi diskriminannya.



ESTIMASI FUNGSI DISKRIMINAN Prosedur bertahap dimulai dengan semua variabel



dikeluarkan dari model dan kemudian memilih variabel yang



1. Menunjukkan perbedaan yang signifikan secara statistik di seluruh kelompok (.05 atau kurang diperlukan untuk masuk)



2. Memberikan jarak Mahalanobis terbesar (D2) antar kelompok Proses ini terus memasukkan variabel dalam fungsi diskriminan selama variabel tersebut memberikan diskriminasi tambahan yang signifikan secara statistik antara kelompok di luar perbedaan yang telah diperhitungkan oleh variabel dalam fungsi diskriminan. Pendekatan ini mirip dengan proses bertahap dalam regresi berganda, yang menambahkan variabel dengan peningkatan yang signifikan dalam varians yang dijelaskan dari variabel dependen. Juga, dalam kasus di mana dua atau lebih variabel dimasukkan ke dalam model, variabel yang sudah ada dalam model dievaluasi untuk kemungkinan penghapusan. Suatu variabel dapat dihilangkan jika terdapat multikolinearitas yang tinggi antara variabel tersebut dan variabel independen lain yang disertakan sedemikian rupa sehingga signifikansinya berada di bawah tingkat signifikansi untuk dihilangkan (.10).



272



Analisis Diskriminan Ganda Estimasi Bertahap: Menambahkan Variabel Pertama x13. Dari ulasan kami tentang perbedaan kelompok,



kami melihat itu x13 memiliki perbedaan signifikan terbesar antara kelompok dan Mahalanobis . terbesar D2 (lihat Tabel 5). Dengan demikian,x13 dimasukkan sebagai variabel pertama dalam prosedur bertahap (lihat Tabel 6). Karena hanya satu variabel yang masuk ke dalam model diskriminan saat ini, tingkat signifikansi dan ukuran perbedaan kelompok cocok dengan tes univariat.



Setelah x13 memasuki model, variabel yang tersisa dievaluasi berdasarkan kemampuan pembeda inkrementalnya (perbedaan rata-rata kelompok setelah varians yang terkait dengan x13 adalah



TABEL 6 Hasil dari Langkah 1 Analisis Diskriminan Dua Kelompok Bertahap Model Keseluruhan Cocok



Nilai



F Nilai



Derajat kebebasan



. 645



31,992



1, 58



Lambda Wilks



Makna . 000



Variabel Dimasukkan/Dihapus pada Langkah 1



F Variabel yang Dimasukkan



x13 Harga Kompetitif



Minimum D2



Nilai



2.171



31,992



Di antara



Grup



Makna



0 dan 1



. 000



Catatan: Pada setiap langkah dimasukkan variabel yang memaksimalkan jarak Mahalanobis antara dua kelompok terdekat.



Variabel dalam Analisis Setelah Langkah 1



Variabel



x13 Harga Kompetitif



Toleransi



F untuk menghapus



1.000



31,992



D2



Antar Grup



Variabel Tidak dalam Analisis Setelah Langkah 1



Variabel



x6 Kualitas produk x7 Aktivitas E-Commerce x8 Dukungan teknis x9 Penyelesaian Keluhan x10 Periklanan x11 Lini Produk x12 Gambar Tenaga Penjualan



x14 Klaim garansi x15 produk baru x16 Pesanan & Penagihan



x17 Fleksibilitas Harga x18 Kecepatan Pengiriman



Toleransi . 965 . 917 . 966 . 844 . 992 . 849 . 987 . 918



1.000



. 836



1.000



. 910



Minimum Toleransi . 965 . 917 . 966 . 844 . 992 . 849 . 987 . 918



1.000



. 836



1.000



. 910



Minimum



D2



Di antara



F memasuki



4.926



2.699 2.174 2.175 2.310 2.181 2.822 2.595 2.237 2.220 2.495 4.300 2.300



0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1



. 026 . 033



1.292



. 088



6.076 3.949



. 617 . 455



3.022 19.863 1.196



Grup



Pengujian Signifikansi Perbedaan Kelompok Setelah Langkah 1A



AS/Amerika Utara Di luar Amerika Utara



F Tanda tangan.



A1,



31,992 . 000



58 derajat kebebasan.



273



Analisis Diskriminan Ganda DIHAPUS). Sekali lagi, variabel dengan tingkat signifikansi lebih besar dari 0,05 dihilangkan dari pertimbangan untuk masuk pada langkah berikutnya.



Meneliti perbedaan univariat yang ditunjukkan pada Tabel 5 mengidentifikasi x17 (Fleksibilitas Harga) sebagai variabel dengan perbedaan paling signifikan kedua. Namun proses bertahap tidak menggunakan hasil univariat ini ketika fungsi diskriminan memiliki satu atau lebih variabel dalam fungsi diskriminan. Ini menghitungD2 nilai dan uji signifikansi statistik dari perbedaan kelompok setelah pengaruh variabel dalam model dihilangkan (hanya dalam kasus ini x13 ada di model). Seperti yang ditunjukkan pada bagian terakhir dari Tabel 6, tiga variabel (x6, x11, dan x17) jelas bertemu kriteria tingkat signifikansi 0,05 untuk dipertimbangkan pada tahap selanjutnya. x17 tetap menjadi kandidat terbaik berikutnya untuk masuk model karena memiliki Mahalanobis tertinggi D2 (4.300) dan terbesar F untuk memasukkan nilai. Namun, variabel lain (misalnya,x11) memiliki pengurangan substansial dalam tingkat signifikansi mereka dan Mahalanobis D2 dari yang ditunjukkan pada Tabel 5 karena satu variabel dalam model (x 13).



Estimasi Bertahap: Menambahkan Variabel Kedua x17. Pada langkah 2 (lihat Tabel 7), x17 masuk modelnya sesuai harapan. Model keseluruhan adalah signifikan (F = 31.129) dan peningkatan



diskriminasi antar kelompok yang dibuktikan dengan penurunan lambda Wilks dari 0,645 menjadi 0,478. Selain itu, daya pembeda dari kedua variabel yang termasuk pada poin ini juga signifikan secara statistik ( F nilai 20,113 untuk x13 dan 19.863 untuk x17). Dengan kedua variabel signifikan secara statistik, prosedur bergerak untuk memeriksa variabel-variabel yang tidak ada dalam persamaan untuk calon potensial untuk dimasukkan dalam fungsi diskriminan berdasarkan diskriminasi inkremental mereka antara kelompok. x11 adalah variabel berikutnya yang memenuhi persyaratan untuk dimasukkan, tetapi tingkat signifikansi dan kemampuan membedakannya telah berkurang secara substansial karena multikolinearitas dengan x13 dan x17 sudah dalam fungsi diskriminan. Yang paling terlihat adalah peningkatan yang mencolok dalam MahalanobisD2



dari hasil univariat di mana setiap variabel dianggap terpisah. Dalam kasusx11 minimal D2 nilai meningkat dari 1,731 (lihat Tabel 5) menjadi 5,045 (lihat Tabel 7), menunjukkan penyebaran dan pemisahan kelompok dengan x13 dan x17 sudah dalam fungsi diskriminan. Perhatikan bahwa x18 hampir identik dalam kekuatan diskriminasi yang tersisa, tapi x11 akan masuk pada langkah ketiga karena sedikit keuntungannya.



Estimasi Bertahap: Menambahkan Variabel Ketiga x11. Tabel 8 mengulas hasil yang ketiga langkah dari proses bertahap, di mana x11 masuk ke fungsi diskriminan. Hasil keseluruhan masih signifikan secara statistik dan terus meningkat dalam diskriminasi, sebagaimana dibuktikan dengan penurunan nilai lambda Wilks (dari 0,478 menjadi 0,438). Namun perhatikan bahwa penurunannya jauh lebih kecil daripada yang ditemukan ketika variabel kedua (x17) ditambahkan ke fungsi diskriminan. Denganx13, x17, dan x11 semua signifikan secara statistik, prosedur bergerak untuk mengidentifikasi kandidat yang tersisa untuk dimasukkan. Seperti yang terlihat pada bagian terakhir dari Tabel 8, tidak satu pun dari 10 variabel independen yang tersisa lolos kriteria entri untuk signifikansi statistik 0,05. Setelahx11 dimasukkan dalam persamaan, kedua variabel yang tersisa yang memiliki perbedaan univariat yang signifikan di seluruh kelompok (x6 dan



x12) memiliki daya diskriminasi tambahan yang relatif kecil dan tidak memenuhi kriteria masuk. Dengan demikian, proses estimasi berhenti dengan tiga variabel (x13, x17, dan x11) yang merupakan fungsi diskriminan. Ringkasan Proses Estimasi Bertahap. Tabel 9 memberikan keseluruhan distribusi bertahap hasil analisis criminant setelah semua variabel signifikan dimasukkan ke dalam estimasi fungsi diskriminan. Tabel ringkasan ini menjelaskan tiga variabel (x11, x13, dan x17) yang merupakan pembeda signifikan berdasarkan lambda Wilks dan Mahalanobis . minimum mereka D2 nilai-nilai.



274



Analisis Diskriminan Ganda Sejumlah hasil berbeda diberikan untuk mengatasi kecocokan model secara keseluruhan dan dampak variabel tertentu.



• Ukuran multivariat dari kecocokan model keseluruhan dilaporkan di bawah judul “Fungsi Diskriminan Kanonik”. Perhatikan bahwa fungsi diskriminan sangat signifikan (.000) dan menampilkan korelasi kanonik sebesar 0,749. Kami menafsirkan korelasi ini dengan mengkuadratkannya (.749)2 = 0,561. Jadi, 56,1 persen varians dalam variabel dependen (x4) dapat dipertanggungjawabkan (dijelaskan) oleh model ini, yang hanya mencakup tiga variabel bebas. TABEL 7 Hasil dari Langkah 2 Analisis Diskriminan Dua Kelompok Bertahap Model Keseluruhan Cocok



Lambda Wilks



Nilai



F Nilai



. 478



31.129



Derajat kebebasan



Makna



2, 57



. 000



Variabel Dimasukkan/Dihapus pada Langkah 2



F Variabel yang Dimasukkan



Minimum D2



Nilai



x17 Fleksibilitas Harga



4.300



31.129



Di antara



Grup



Makna



0 dan 1



. 000



Catatan: Pada setiap langkah dimasukkan variabel yang memaksimalkan jarak Mahalanobis antara dua kelompok terdekat.



Variabel dalam Analisis Setelah Langkah 2



Variabel



x13 Harga Kompetitif x17 Fleksibilitas Harga



Toleransi



F untuk menghapus



D2



1.000 1.000



20.113 19.863



2.152 2.171



Antar Grup 0 dan 1 0 dan 1



Variabel Tidak dalam Analisis Setelah Langkah 2



Variabel



x6 Kualitas produk x7 Aktivitas E-Commerce x8 Dukungan teknis x9 Penyelesaian Keluhan x10 Periklanan x11 Lini Produk x12 Gambar Tenaga Penjualan



x14 Klaim garansi x15 produk baru x16 Pesanan & Penagihan x18 Kecepatan Pengiriman



Toleransi



Minimum Toleransi



. 884 . 804 . 966



. 884 . 804 . 966



2.486



. 610



. 610



1.479



. 901



. 901



. 881



. 848



. 848



5.068



. 944 . 916 . 986 . 625 . 519



. 944 . 916 . 986 . 625 . 519



. 849 . 759 . 017 . 245



Minimum



Di antara



4.400 4.665 4.308 4.517 4.429 5.045 4.425 4.411 4.302 4.336 4.927



0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1



F memasuki



. 681



. 052



4.261



D2



Grup



Pengujian Signifikansi Perbedaan Kelompok Setelah Langkah 2A



AS/Amerika Utara Di luar Amerika Utara



F Tanda tangan.



A2,



32.129 . 000



57 derajat kebebasan.



275



Analisis Diskriminan Ganda TABEL 8 Hasil dari Langkah 3 Analisis Diskriminan Dua Kelompok Bertahap Model Keseluruhan Cocok



Lambda Wilks



Nilai



F Nilai



Derajat kebebasan



. 438



23.923



3, 56



Makna . 000



Variabel Dimasukkan/Dihapus pada Langkah 3



F Minimum D2



Nilai



5.045



23.923



x11 Lini Produk



Makna



Antar Grup 0 dan 1



. 000



Catatan: Pada setiap langkah dimasukkan variabel yang memaksimalkan jarak Mahalanobis antara dua kelompok terdekat.



Variabel dalam Analisis Setelah Langkah 3



Variabel



x13 Harga Kompetitif x17 Fleksibilitas Harga



x11 Lini Produk



Toleransi



F untuk menghapus



D2



. 849 . 999 . 848



7.258 18.416 5.068



4.015 2.822 4.300



Antar Grup 0 dan 1 0 dan 1 0 dan 1



Variabel Tidak Dalam Analisis Setelah Langkah 3



Variabel



x6 Kualitas produk x7 Aktivitas E-Commerce x8 Dukungan teknis x9 Penyelesaian Keluhan x10 Periklanan x12 Gambar Tenaga Penjualan



x14 Klaim garansi x15 produk baru x16 Pesanan & Penagihan x18 Kecepatan Pengiriman



Toleransi



Minimum Toleransi



. 802 . 801 . 961 . 233 . 900 . 931 . 836 . 981 . 400 . 031



. 769 . 791 . 832 . 233 . 840 . 829 . 775 . 844 . 400 . 031



F memasuki



. 019



2,672



. 004 . 719 . 636



1.294 2.318



. 076



1.025



. 208



Minimum



Di antara



5.048 5.482 5.046 5.163 5.149 5.257 5.424 5.058 5.213 5.079



0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1 0 dan 1



D2



Grup



Uji Signifikansi Selisih Kelompok Setelah Langkah 3A AS/Amerika Utara Di luar Amerika Utara



F Tanda tangan.



A3,



23.923 . 000



56 derajat kebebasan.



• Koefisien fungsi diskriminan standar disediakan, tetapi kurang disukai untuk tujuan interpretasi daripada beban diskriminan. Koefisien diskriminan yang tidak standar digunakan untuk menghitung diskriminanZ skor yang dapat digunakan dalam klasifikasi. • Pembebanan diskriminan dilaporkan di bawah judul "Matriks Struktur" dan diurutkan dari yang tertinggi ke yang terendah menurut ukuran pemuatan. Pembebanan dibahas kemudian di bawah fase interpretasi (Tahap 5).



• Koefisien fungsi klasifikasi, juga dikenal sebagai fungsi diskriminan linier Fisher, digunakan dalam klasifikasi dan akan dibahas kemudian.



276



Analisis Diskriminan Ganda TABEL 9 Ringkasan Statistik untuk Analisis Diskriminan Dua Kelompok Kesesuaian Model Keseluruhan: Fungsi Diskriminan Canonical



Persentase Varians Fungsi Kumulatif



Resmi Korelasi



%%



Fungsi Nilai Eigen 1 1.282



100 100



. 749



Wilks'



lambda



Chi-Square



df



. 438



46.606



3



Makna . 000



Fungsi Diskriminan dan Koefisien Fungsi Klasifikasi



Fungsi Diskriminan Variabel independen



Tidak standar



x11 Lini Produk x13 Harga Kompetitif



Standar



- . 363 . 398 . 749



x17 Konstanta



- . 417 . 490 . 664



- 3.752



Fleksibilitas Harga



Fungsi Klasifikasi Grup 0: AS/Amerika Utara



Grup 1: Di luar Amerika Utara



7.725 6.456 4.231 - 52.800



6.909 7.349 5.912 - 60,623



Struktur MatriksA



Variabel independen



Fungsi 1



x13 Harga Kompetitif



. 656 . 653



x17 Fleksibilitas Harga



x11 Lini Produk x7 Aktivitas E-Commerce*



- . 586 . 429



x14 Klaim garansi* x10 Periklanan*



- . 418 - . 329 . 238



x12 Gambar Tenaga Penjualan*



- . 181 . 164



x6 Kualitas produk*



x9 Penyelesaian Keluhan*



- . 149 - . 136 - . 060 . 041



x16 Pemesanan & Penagihan*



x8 Dukungan teknis* x18 Kecepatan Pengiriman*



x15 Produk baru*



* Variabel ini tidak digunakan dalam analisis.



Group Means (Centroids) dari Fungsi Diskriminan Fungsi 1



x4 Wilayah



AS/Amerika Utara



- 1.273



Di luar Amerika Utara AKorelasi



. 973



dalam kelompok yang dikumpulkan antara variabel pembeda dan variabel fungsi diskriminan kanonik standar yang diurutkan



berdasarkan ukuran absolut korelasi dalam fungsi.



• Centroid grup juga dilaporkan, dan mewakili rata-rata skor fungsi diskriminan individu untuk setiap grup. Centroid grup memberikan ukuran ringkasan dari posisi relatif setiap grup pada fungsi diskriminan. Dalam hal ini, Tabel 9 menunjukkan bahwa pusat massa grup untuk perusahaan di AS/Amerika Utara (grup 0) adalah –1.273, sedangkan pusat massa grup untuk perusahaan di luar Amerika Utara (grup 1) adalah 0,973. Untuk menunjukkan bahwa rata-rata keseluruhan adalah 0, kalikan bilangan di setiap kelompok dengan pusat massanya dan jumlahkan hasilnya (misalnya, 26× –1,273 + 34 × .973 = 0,0).



277



Analisis Diskriminan Ganda



Hasil model keseluruhan dapat diterima berdasarkan signifikansi statistik dan praktis. Namun, sebelum melanjutkan ke interpretasi hasil, peneliti perlu menilai akurasi klasifikasi dan memeriksa hasil casewise. MENILAI AKURASI KLASIFIKASI Dengan model keseluruhan yang signifikan secara statistik dan



menjelaskan 56 persen variasi antara kelompok (lihat diskusi sebelumnya dan Tabel 9), kami beralih ke penilaian akurasi prediktif dari fungsi diskriminan. Dalam contoh ini, kami akan mengilustrasikan penggunaan skor diskriminan dan skor pemotongan untuk tujuan klasifikasi. Dalam melakukannya, kita harus menyelesaikan tiga tugas:



1. Hitung skor pemotongan, kriteria yang menjadi pembeda setiap pengamatan Z skor dinilai untuk menentukan ke dalam kelompok mana itu harus diklasifikasikan.



2. Klasifikasikan setiap pengamatan dan kembangkan matriks klasifikasi untuk analisis dan sampel yang tidak memiliki.



3. Menilai tingkat akurasi prediksi dari matriks klasifikasi untuk signifikansi statistik dan praktis. Meskipun pemeriksaan sampel holdout dan akurasi prediksinya sebenarnya dilakukan pada tahap validasi, hasilnya dibahas sekarang untuk memudahkan perbandingan antara estimasi dan sampel holdout. Menghitung Skor Pemotongan. Peneliti harus terlebih dahulu menentukan bagaimana probabilitas klasifikasi sebelumnya akan ditentukan, baik berdasarkan ukuran kelompok yang sebenarnya (dengan asumsi mereka mewakili populasi) atau ditentukan oleh peneliti, paling sering ditentukan sebagai konservatif dalam proses klasifikasi. . Dalam sampel analisis 60 observasi ini, kita mengetahui bahwa variabel dependen terdiri dari dua kelompok, 26 perusahaan yang berlokasi di Amerika Serikat dan 34 perusahaan di luar Amerika Serikat. Jika kita tidak yakin apakah proporsi populasi diwakili oleh sampel, maka kita harus menggunakan probabilitas yang sama. Namun, karena sampel perusahaan kami diambil secara acak, kami cukup yakin bahwa sampel ini mencerminkan proporsi populasi. Dengan demikian, analisis diskriminan ini menggunakan proporsi sampel untuk menentukan probabilitas sebelumnya untuk tujuan klasifikasi.



Setelah menentukan probabilitas sebelumnya, skor pemotongan optimal dapat dihitung. Karena dalam situasi ini grup dianggap representatif, perhitungan menjadi rata-rata tertimbang dari dua centroid grup (lihat Tabel 9 untuk nilai centroid grup):



ZCS =



NZ AB + nBZA = nA + nB



(26 * .973) + (34 * -1.273) 26 + 34



= - .2997



Dengan substitusi nilai yang sesuai dalam rumus, kita dapat memperoleh skor pemotongan kritis (dengan asumsi biaya kesalahan klasifikasi yang sama) dari ZCS = –.2997.



Mengklasifikasikan Pengamatan dan Membangun Matriks Klasifikasi. Sekali pemotongan skor telah dihitung, setiap pengamatan dapat diklasifikasikan dengan membandingkan skor diskriminannya dengan skor pemotongan. Prosedur untuk mengklasifikasikan perusahaan dengan skor pemotongan optimal adalah sebagai berikut:



• Mengklasifikasikan perusahaan sebagai kelompok 0 (Amerika Serikat/Amerika Utara) jika skor diskriminannya kurang dari –.2997.



• Mengklasifikasikan perusahaan sebagai kelompok 1 (Di luar Amerika Serikat) jika skor diskriminannya lebih besar dari –.2997.



278



Analisis Diskriminan Ganda Matriks klasifikasi untuk pengamatan dalam analisis dan sampel ketidaksepakatan dihitung, dan hasilnya ditunjukkan pada Tabel 10. Tabel 11 berisi skor diskriminan untuk setiap pengamatan serta nilai keanggotaan kelompok yang sebenarnya dan yang diprediksi. Perhatikan bahwa kasus dengan skor diskriminan kurang dari –.2997 memiliki nilai prediksi keanggotaan kelompok 0, sedangkan kasus dengan skor di atas –.2997 memiliki nilai prediksi 1. Sampel analisis, dengan akurasi prediksi 86,7 persen, sedikit lebih tinggi dari akurasi 85,0 persen dari sampel ketidaksepakatan, seperti yang diantisipasi. Selain itu, sampel yang divalidasi silang mencapai akurasi prediksi 83,3 persen. Mengevaluasi Ketepatan Klasifikasi yang Dicapai. Meskipun semua ukuran klasifikasi akurasi fiksasi yang cukup tinggi, proses evaluasi memerlukan perbandingan akurasi klasifikasi dalam serangkaian tindakan berbasis peluang. Langkah-langkah ini mencerminkan peningkatan model diskriminan bila dibandingkan dengan mengklasifikasikan individu tanpa menggunakan fungsi diskriminan. Mengingat bahwa sampel keseluruhan adalah 100 pengamatan dan ukuran kelompok dalam sampel ketidaksepakatan/validasi kurang dari 20, kami akan menggunakan sampel keseluruhan untuk menetapkan standar perbandingan. Ukuran pertama adalah kriteria peluang proporsional, yang mengasumsikan bahwa biaya kesalahan klasifikasi adalah sama (yaitu, kami ingin mengidentifikasi anggota setiap kelompok dengan sama baiknya). Kriteria peluang proporsional adalah:



CPRO = P2 + (1 - P)2 di mana



CPRO = kriteria peluang proporsional p = proporsi perusahaan dalam kelompok 0 1 - p = proporsi perusahaan dalam kelompok 1



TABEL 10 Hasil Klasifikasi untuk Analisis Diskriminan Dua Kelompok Hasil Klasifikasia, b, c Keanggotaan Grup yang Diprediksi AMERIKA SERIKAT/



Sampel



Contoh Estimasi



Grup Sebenarnya



Amerika Utara



AS/Amerika Utara Di luar Amerika Utara



Divalidasi silangD



AS/Amerika Utara Di luar Amerika Utara



Contoh Penahanan



AS/Amerika Utara Di luar Amerika Utara



25



96,2%



7



20,6%



24 92.3 8 23.5 9 69.2 2 7.4



A86,7%



dari kasus pengelompokan asli yang dipilih (sampel estimasi) diklasifikasikan dengan benar.



B85,0%



kasus pengelompokan asli yang tidak dipilih (sampel validasi) diklasifikasikan dengan benar.



C83,3%



Di luar



Amerika Utara



Total



1 3,8% 27



26



2 7.7 26 76,5 4 30.8 25 92.6



26



79,4%



34



34 13 27



dari kasus-kasus yang dikelompokkan dengan validasi silang yang dipilih diklasifikasikan dengan benar.



DValidasi



silang dilakukan hanya untuk kasus-kasus yang di analisis (estimasi sampel). Dalam validasi silang, setiap kasus diklasifikasikan



berdasarkan fungsi yang diturunkan dari semua kasus selain kasus itu.



279



Analisis Diskriminan Ganda TABEL 11 Prediksi Kelompok untuk Kasus Perorangan dalam Analisis Diskriminan Dua Kelompok Sebenarnya



ID Kasus



Kelompok



Diskriminan



Z Skor



Diprediksi



Sebenarnya



Diskriminan



Z Skor



Diprediksi



Kelompok



ID Kasus



Kelompok



0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0



24 53 32 80 38 60 65 35 1 4 68 44 17 67 33 87 6 46 12 69 86 10 30 15 92 7 20 8 100 48



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1



- . 60937 - . 45623 - . 36094 - . 14687 - . 04489 - . 04447 . 09785 . 84464 . 98896



1.10834 1.12436 1.34768 1.35578 1.35578 1.42147 1.57544 1.58353 1.60411 1.75931 1.82233 1.82233 1,85847 1.90062 1.91724 1.97960 2.09505 2.22839 2.39938 2.62102 2.90178



0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1



0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 1 1 1 1 1



25 18 73 21 90 97 40 77 28 71 19 57 9 41 26 70 66 34 55 39



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1



1.47048 1.60411 1.61002 1.69348 1.69715 1.70398 1.75931 1.86055 1.97494 2.22839 2.28652 2.31456 2.36823 2.53652 2.59447 2.59447 2.90178 2.97632 2.97632 3.21116



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1



Kelompok



Sampel Analisis



72 14 31 54 27 29 16 61 79 36 98 58 45 2 52 50 47 88 11 56 95 81 5 37 63 43 3 94 49 64



0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1



– 2.10690 – 2.03496 – 1.98885 – 1.98885 – 1.76053 – 1.76053 – 1.71859 – 1.71859 – 1,57916 – 1.57108 – 1.57108 – 1.48136 – 1,33840 – 1.29645 – 1.29645 – 1.24651 – 1.20903 – 1.10294 - . 74943 - . 73978 - . 73978 - . 72876 - . 60845 - . 60845 - . 38398 . 23553



– 1.65744 – 1,57916 – 1,04667 - . 67406



Contoh Penahanan



23 93 59 85 83 91 82 76 96 13 89 42 78 22 74 51 62 75 99 84



280



0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1



22.38834 – 2.03496 – 1.20903 – 1.10294 – 1.03619 - . 89292 - . 74943 - . 72876 - . 57335 . 13119 . 51418 . 63440 . 63440



– 2.7303



– 1,04667 . 09785 . 94702 . 98896



1.13130 1.30393



Analisis Diskriminan Ganda Kelompok pelanggan yang berlokasi di Amerika Serikat (grup 0) merupakan 39,0 persen dari sampel analisis (39/100), dengan kelompok kedua yang mewakili pelanggan yang berlokasi di luar Amerika Serikat (grup 1) membentuk 61,0 persen sisanya (61/100 ). Nilai peluang proporsional yang dihitung adalah 0,524 (0,3902 + 0,6102 = 0,524). Kriteria peluang maksimum hanyalah persentase yang diklasifikasikan dengan benar jika semua pengamatan ditempatkan dalam kelompok dengan probabilitas kejadian terbesar. Ini mencerminkan standar kami yang paling konservatif dan mengasumsikan tidak ada perbedaan dalam biaya kesalahan klasifikasi juga.



Karena kelompok 1 (pelanggan di luar Amerika Serikat) adalah kelompok terbesar dengan 61,0 persen sampel, kami akan benar 61,0 persen dari waktu jika kami menetapkan semua pengamatan ke grup ini. Jika kita memilih kriteria peluang maksimum sebagai standar evaluasi, model kita harus mengungguli tingkat akurasi klasifikasi 61,0 persen agar dapat diterima. Untuk mencoba memastikan signifikansi praktis, akurasi klasifikasi yang dicapai harus melebihi standar perbandingan yang dipilih sebesar 25 persen. Dengan demikian, kita harus memilih standar perbandingan, menghitung ambang batas, dan membandingkan rasio hit yang dicapai.



Semua tingkat akurasi klasifikasi (rasio hit) melebihi 85 persen, yang secara substansial lebih tinggi dari kriteria peluang proporsional 52,4 persen dan kriteria peluang maksimum 61,0 persen. Ketiga rasio hit juga melebihi ambang batas yang disarankan dari nilai-nilai ini (standar perbandingan ditambah 25 persen), yang dalam hal ini adalah 65,5 persen (52,4%× 1,25 = 65,5%) untuk peluang proporsional dan 76,3 persen (61,0%) × 1,25 = 76,3%) untuk peluang maksimum. Dalam semua kasus (sampel analisis, sampel ketidaksepakatan, dan validasi silang), tingkat akurasi klasifikasi jauh lebih tinggi daripada nilai ambang batas, yang menunjukkan tingkat akurasi klasifikasi yang dapat diterima. Selain itu, rasio hit untuk kelompok individu juga dianggap memadai. Ukuran akhir dari akurasi klasifikasi adalah Press's Q, yang merupakan ukuran berbasis statistik yang membandingkan akurasi klasifikasi dengan proses acak. Dari pembahasan sebelumnya, perhitungan untuk sampel estimasi adalah



pers Q perkiraan sampel =



[60 - (52 * 2)]2 60(2 - 1)



= 45.07



Dan perhitungan untuk sampel ketidaksepakatan adalah



pers Q sampel ketidaksepakatan =



[40 - (34 * 2)]2 40(2 - 1)



= 19.6



Dalam kedua kasus, nilai yang dihitung melebihi nilai kritis 6,63. Dengan demikian, akurasi klasifikasi untuk analisis dan, yang lebih penting, sampel ketidaksepakatan melebihi pada tingkat yang signifikan secara statistik akurasi klasifikasi yang diharapkan secara kebetulan.



DIAGNOSTIK KASUS Selain



memeriksa hasil keseluruhan, kita dapat memeriksa pengamatan individu untuk akurasi



prediksi mereka dan mengidentifikasi secara khusus kasus yang salah diklasifikasikan. Dengan cara ini, kita dapat menemukan kasus spesifik yang salah diklasifikasikan untuk setiap kelompok pada sampel analisis dan ketidaksepakatan serta melakukan profil analisis tambahan untuk kasus yang salah klasifikasi. Tabel 11 berisi prediksi kelompok untuk sampel analisis dan ketidaksepakatan dan memungkinkan kita untuk mengidentifikasi kasus spesifik untuk setiap jenis kesalahan klasifikasi yang ditabulasikan dalam matriks klasifikasi (lihat Tabel 10). Untuk sampel analisis, tujuh pelanggan yang berlokasi di luar Amerika Serikat salah diklasifikasikan ke dalam kelompok pelanggan di Amerika Serikat dapat diidentifikasi sebagai kasus 3, 94, 49, 64, 24, 53, dan 32. Demikian juga, pelanggan tunggal yang berlokasi di Amerika Serikat tetapi salah klasifikasi diidentifikasi sebagai kasus 43. Pemeriksaan serupa dapat dilakukan untuk sampel ketidaksepakatan. Setelah kasus salah klasifikasi diidentifikasi, analisis lebih lanjut dapat dilakukan untuk memahami alasan kesalahan klasifikasi. Pada Tabel 12, kasus yang salah diklasifikasikan digabungkan dari analisis dan sampel ketidaksepakatan dan kemudian dibandingkan dengan kasus yang diklasifikasikan dengan benar. Upayanya adalah



281



Analisis Diskriminan Ganda TABEL 12 Memprofilkan Observasi yang Diklasifikasikan dengan Benar dan yang Salah Diklasifikasikan dalam Dua Kelompok



Analisis Diskriminan T Tes



Skor Rata-Rata



Bergantung



Grup/Profil Variabel



Variabel: x4 Wilayah



AS/Amerika Utara



Benar Rahasia



salah diklasifikasikan



Perbedaan



Statistik Makna



(n = 34) 8.612 3.382 5.759 5.356 3.597



(n = 5) 9.340 4.380 5.280 6.140 4.700



6.726 4.459 5.609 6.215 5.024 4.188 3.568 3.826 (n = 52) 6.906 3.860 5.085 5.365 4.229 4.954



6.540 5.460 8.060 6.060 4.420 4.540 4.480 4.160 (n = 9) 9.156 3.289 5.544 5.822 3.922 6.833



5.465 7.960



5.467 5.833 6.400 5.778 4.533 3.722



- . 266



x17 Fleksibilitas HargaA



5.867 5.194 4.267 5.458



1.735



. 481 . 000



x18 Kecepatan Pengiriman



3,881



3,899



- . 108



. 714



x6 Kualitas produk x7 Aktivitas E-Commerce x8 Dukungan teknis x9 Penyelesaian Keluhan x10 Periklanan x11 Lini ProdukA



x12 Gambar Tenaga Penjualan



x13 Harga KompetitifA x14 Klaim garansi x15 produk baru x16 Pesanan & Penagihan



x17 Fleksibilitas HargaA x18 Kecepatan Pengiriman



Di luar Amerika Utara



x6 Kualitas produk x7 Aktivitas E-Commerce x8 Dukungan teknis x9 Penyelesaian Keluhan x10 Periklanan x11 Lini ProdukA x12 Gambar Tenaga Penjualan



x13 Harga KompetitifA x14 Klaim garansi x15 produk baru x16 Pesanan & Penagihan



- . 728 - . 998 . 479 - . 784



. 000B . 068B . 487 . 149



– 1.103



. 022



. 186 – 1,001



. 345B . 018



– 2.451



. 000



. 155



. 677



. 604



. 391



- . 352



. 329



- . 912



. 000B



- . 334



. 027B



– 2.250 . 571



. 000



- . 460



. 159B . 423



- . 457



. 322



. 307 – 1,879



. 470 . 000



- . 002



. 998 . 000



- . 533



. 007B . 291



2.126 - . 584



Catatan: Kasus dari sampel analisis dan validasi dimasukkan untuk total sampel 100. AVariabel termasuk dalam fungsi diskriminan. BT uji dilakukan dengan estimasi varians terpisah daripada estimasi gabungan karena uji Levene mendeteksi perbedaan yang signifikan dalam variasi antara kedua kelompok.



mengidentifikasi perbedaan spesifik pada variabel independen yang mungkin mengidentifikasi variabel baru yang akan ditambahkan atau karakteristik umum yang harus dipertimbangkan. Lima kasus (baik analisis dan sampel ketidaksepakatan) salah diklasifikasikan di antara pelanggan Amerika Serikat (kelompok 0) menunjukkan perbedaan yang signifikan pada dua dari tiga variabel independen dalam fungsi diskriminan (x13 dan x17) serta satu variabel yang tidak termasuk dalam fungsi diskriminan (x6). Untuk variabel yang tidak berada dalam fungsi diskriminan, profil kasus yang salah diklasifikasikan tidak sama dengan grup yang benar; dengan demikian, tidak ada gunanya dalam klasifikasi. Demikian juga, sembilan kasus yang salah klasifikasi dari kelompok 1 (di luar Amerika Serikat) menunjukkan empat perbedaan yang signifikan (x6, x11, x13, dan x17), tapi hanya x6 tidak dalam fungsi diskriminan. Kita bisa melihatnya di sinix6 bekerja melawan akurasi klasifikasi karena kasus yang salah diklasifikasikan lebih mirip dengan kelompok yang salah daripada kelompok yang benar.



282



Analisis Diskriminan Ganda Temuan menunjukkan bahwa kasus yang salah diklasifikasikan mungkin mewakili kelompok ketiga yang berbeda, karena mereka memiliki profil yang sangat mirip di seluruh variabel ini lebih daripada yang mereka lakukan dengan dua kelompok yang ada. Manajemen dapat menganalisis kelompok ini pada variabel tambahan atau menilai apakah pola geografis di antara kasuskasus yang salah diklasifikasikan ini membenarkan kelompok baru.



Peneliti harus memeriksa pola pada kedua kelompok dengan tujuan memahami karakteristik umum mereka dalam upaya mendefinisikan alasan kesalahan klasifikasi.



Tahap 5: Interpretasi Hasil Setelah menaksir fungsi diskriminan, tugas selanjutnya adalah interpretasi. Tahap ini melibatkan pemeriksaan fungsi untuk menentukan kepentingan relatif dari masing-masing variabel bebas dalam membedakan antara kelompok, menafsirkan fungsi diskriminan berdasarkan beban diskriminan, dan kemudian membuat profil setiap kelompok pada pola nilai rata-rata untuk variabel yang diidentifikasi sebagai variabel pembeda penting. MENGIDENTIFIKASI VARIABEL DISKRIMINASI PENTING Seperti



yang dibahas sebelumnya, diskriminan



pembebanan dianggap sebagai ukuran kekuatan diskriminatif yang lebih tepat, tetapi kami juga akan mempertimbangkan bobot diskriminan untuk tujuan perbandingan. Bobot diskriminan, baik dalam bentuk tidak standar atau standar, mewakili kontribusi masing-masing variabel untuk fungsi diskriminan. Namun, seperti yang akan kita bahas, multikolinearitas di antara variabel independen dapat mempengaruhi interpretasi hanya dengan menggunakan bobot. Pembebanan diskriminan dihitung untuk setiap variabel independen, bahkan untuk variabel yang tidak termasuk dalam fungsi diskriminan. Dengan demikian, bobot diskriminan mewakili dampak unik dari setiap variabel independen dan tidak terbatas hanya pada dampak bersama karena multikolinearitas. Selain itu, karena mereka relatif tidak terpengaruh oleh multikolinearitas, mereka lebih akurat mewakili hubungan masingmasing variabel dengan skor diskriminan.



Tabel 13 berisi seluruh rangkaian ukuran interpretatif, termasuk bobot diskriminan yang tidak terstandarisasi dan terstandar, pembebanan untuk fungsi diskriminan, lambda Wilks, dan univariat F perbandingan. 13 variabel independen asli disaring dengan prosedur bertahap, dan tiga (x11, x13, dan x17) cukup signifikan untuk dimasukkan ke dalam fungsi. Untuk tujuan interpretasi, kami memberi peringkat variabel independen dalam hal pemuatan dan univariatnyaF nilai kedua indikator daya pembeda masing-masing variabel. Tanda-tanda bobot atau beban tidak mempengaruhi peringkat; mereka hanya menunjukkan hubungan positif atau negatif dengan variabel dependen. Menganalisis Lambda dan Univariat Wilks F. Lambda dan univariat Wilks F nilai mewakili efek terpisah



atau univariat dari masing-masing variabel, tidak mempertimbangkan multikolinearitas di antara variabel independen. Analog dengan korelasi bivariat regresi berganda, mereka menunjukkan kemampuan masingmasing variabel untuk membedakan antara kelompok, tetapi hanya secara terpisah. Untuk menginterpretasikan kombinasi dari dua atau lebih variabel independen memerlukan analisis bobot diskriminan atau beban diskriminan seperti yang dijelaskan pada bagian berikut.



Tabel 13 menunjukkan bahwa variabel (x11, x13, dan x17) dengan tiga tertinggi F nilai (dan nilai lambda Wilks terendah) juga merupakan variabel yang dimasukkan ke dalam fungsi diskriminan. Dua variabel lainnya (x6 dan x12) juga memiliki efek pembeda yang signifikan (yaitu, perbedaan kelompok yang signifikan), tetapi tidak dimasukkan oleh proses bertahap dalam fungsi diskriminan. Hal ini disebabkan adanya multikolinearitas antara kedua variabel tersebut dengan ketiga variabel yang termasuk dalam fungsi diskriminan. Kedua variabel ini tidak menambahkan daya pembeda tambahan di luar variabel yang sudah ada dalam fungsi diskriminan. Semua variabel yang tersisa tidak signifikanF nilai dan nilai lambda Wilks yang tinggi.



283



Analisis Diskriminan Ganda TABEL 13 Ringkasan Tindakan Interpretasi untuk Analisis Diskriminan Dua Kelompok



Diskriminan Koefisien Mandiri Variabel



Tidak standar



x6 Kualitas produk x7 Aktivitas E-Commerce x8 Dukungan teknis x9 Penyelesaian Keluhan x10 Periklanan x11 Lini Produk



NI NI NI NI NI - . 363



x12 Gambar Tenaga Penjualan



NI



x16 Pesanan & Penagihan



NI NI NI



x13 Harga Kompetitif x14 Klaim garansi x15 produk baru x17 Fleksibilitas Harga x18 Kecepatan Pengiriman



- . 398



NI



. 749



Diskriminan Pemuatan



Standar



Memuat



NI NI NI NI NI



- . 418 . 429 - . 136 - . 181 . 238



- . 417



NI



NI NI NI NI



. 490



- . 586 . 164 . 656 - . 329 . 041



. 664



- . 149 . 653 - . 060



Pangkat



5 4 11 8 7 3 9 1 6 13 10 2 12



Wilks' lambda



Univariat F Perbandingan



Nilai



F Nilai



. 801 . 966 . 973 . 986 . 987 . 695 . 856 . 645 . 992 . 990 . 999 . 647 . 997



14.387 2.054 1.598 . 849 . 775



25.500 9.733 31,992



. 453 . 600 . 087



31.699



. 152



Tanda tangan. Pangkat



. 000 . 157 . 211 . 361 . 382 . 000 . 003 . 000 . 503 . 442 . 769 . 000 . 698



4 6 7 8 9 3 5 1 11 10 13 2 12



NI = Tidak termasuk dalam fungsi diskriminan yang diestimasi.



Menganalisis Bobot Diskriminan. Bobot diskriminan tersedia dalam bentuk tidak standar dan standar. Bobot tidak standar (ditambah konstanta) digunakan untuk menghitung skor diskriminan, tetapi dapat dipengaruhi oleh skala variabel independen (seperti bobot regresi berganda). Dengan demikian, bobot terstandarisasi lebih benar-benar mencerminkan dampak setiap variabel pada fungsi diskriminan dan lebih sesuai daripada bobot tak terstandarisasi bila digunakan untuk tujuan interpretasi. Jika estimasi simultan digunakan, multikolinearitas di antara salah satu variabel independen akan mempengaruhi bobot estimasi. Namun, dampak multikolinearitas bisa lebih besar untuk prosedur bertahap, karena multikolinearitas tidak hanya mempengaruhi bobot tetapi juga dapat mencegah variabel masuk ke persamaan. Tabel 13 memberikan bobot standar (koefisien) untuk tiga variabel yang termasuk dalam fungsi diskriminan. Pengaruh multikolinearitas terhadap bobot dapat dilihat pada pengujian



x13 dan x17. Kedua variabel ini pada dasarnya memiliki daya pembeda yang setara jika dilihat pada lambda dan univariat WilksF tes. Bobot diskriminan mereka, bagaimanapun, mencerminkan dampak yang jauh lebih besar untukx17 dibandingkan x13, yang berdasarkan bobot sekarang lebih sebanding dengan x11. Perubahan dalam kepentingan relatif ini disebabkan oleh kolinearitas antarax13 dan x11, yang mengurangi efek unik dari x13, sehingga mengurangi bobot diskriminan juga.



MENAFSIRKAN FUNGSI DISKRIMINAN BERDASARKAN BEBAN DISKRIMINAN NS pembebanan diskriminan, berbeda dengan bobot diskriminan, kurang terpengaruh oleh multikolinearitas dan dengan demikian lebih berguna untuk tujuan interpretasi. Juga, karena beban dihitung untuk semua variabel, mereka memberikan ukuran interpretatif bahkan untuk variabel yang tidak termasuk dalam fungsi diskriminan. Aturan praktis sebelumnya menunjukkan beban di atas ± 0,40 harus digunakan untuk mengidentifikasi variabel pembeda substantif.



Pembebanan ketiga variabel yang dimasukkan dalam fungsi diskriminan (lihat Tabel 13) adalah tiga yang tertinggi dan semuanya melebihi ± 0,40, sehingga menjamin inklusi untuk tujuan interpretasi. Dua variabel tambahan (x6 dan x7), namun, juga memiliki beban di atas ambang batas ±.40. Dimasukkannyax6 tidak terduga, karena merupakan variabel keempat dengan efek diskriminasi univariat yang signifikan, tetapi tidak termasuk dalam fungsi diskriminan karena multikolinearitas.



284



Analisis Diskriminan Ganda



x7, bagaimanapun, menyajikan situasi lain; itu tidak memiliki efek univariat yang signifikan. Kombinasi dari tiga variabel dalam fungsi diskriminan menciptakan efek yang terkait denganx7, tetapi x7 tidak menambah daya pembeda tambahan. Dalam kasus ini,x7 dapat digunakan untuk menggambarkan fungsi diskriminan untuk tujuan profil meskipun tidak masuk ke dalam estimasi fungsi diskriminan. Menafsirkan fungsi diskriminan dan diskriminasi antara dua kelompok ini mengharuskan peneliti mempertimbangkan kelima variabel ini. Sejauh mereka mencirikan atau menggambarkan fungsi diskriminan, mereka semua mewakili beberapa komponen fungsi. Tiga efek terkuat dalam fungsi diskriminan, yang semuanya umumnya sebanding berdasarkan nilai pemuatan, adalah x13 (Harga Kompetitif), x17 (Fleksibilitas Harga), dan x11 (Lini Produk). x7 (Kegiatan E-Commerce) dan efek dari x6 (Kualitas Produk) dapat ditambahkan ketika menafsirkan fungsi diskriminan. Jelas beberapa faktor yang berbeda sedang digabungkan untuk membedakan antara kelompok, sehingga membutuhkan lebih banyak profil kelompok untuk memahami perbedaan. Dengan teridentifikasinya variabel-variabel pembeda dan fungsi pembeda yang dijelaskan dalam istilah variabelvariabel dengan beban yang cukup tinggi, peneliti kemudian melanjutkan untuk membuat profil setiap kelompok pada variabel-variabel ini untuk memahami perbedaan di antara mereka.



PROFIL VARIABEL YANG DISKRIMINASI Peneliti tertarik pada interpretasi variabel individu yang memiliki signifikansi statistik dan praktis. Interpretasi tersebut dicapai dengan terlebih dahulu mengidentifikasi variabel dengan kekuatan diskriminatif substantif (lihat diskusi sebelumnya) dan kemudian memahami apa arti kelompok yang berbeda pada setiap variabel yang ditunjukkan. Skor yang lebih tinggi pada variabel independen menunjukkan persepsi yang lebih baik tentang HBAT pada atribut tersebut (kecuali untuk x13, di mana skor yang lebih rendah lebih disukai). Mengacu kembali ke Tabel 5, kita melihat profil yang bervariasi antara kedua kelompok pada lima variabel ini.



• Kelompok 0 (pelanggan di AS/Amerika Utara) memiliki persepsi yang lebih tinggi pada tiga variabel: x6



(Kualitas produk), x13 (Harga Kompetitif), dan x11 (Lini Produk).



• Kelompok 1 (pelanggan di luar Amerika Utara) memiliki persepsi yang lebih tinggi pada dua variabel yang tersisa: x7 (Kegiatan E-Commerce) dan x17 (Fleksibilitas Harga). Dalam melihat dua profil ini, kita dapat melihat bahwa pelanggan AS/Amerika Utara memiliki persepsi yang jauh lebih baik tentang produk HBAT, sedangkan pelanggan di luar Amerika Utara merasa lebih baik tentang masalah harga dan e-commerce. Perhatikan bahwax6 dan x13, keduanya memiliki persepsi yang lebih tinggi di antara pelanggan AS/Amerika Utara, membentuk Nilai Produk faktor. Manajemen harus menggunakan hasil ini untuk mengembangkan strategi yang menonjolkan kekuatan ini dan mengembangkan kekuatan tambahan untuk melengkapinya. Profil rata-rata juga menggambarkan interpretasi tanda (positif atau negatif) pada bobot dan beban diskriminan. Tanda-tanda tersebut mencerminkan profil rata-rata relatif dari kedua kelompok. Tanda-tanda positif, dalam contoh ini, diasosiasikan dengan variabel-variabel yang memiliki skor lebih tinggi untuk kelompok 1. Bobot dan beban negatif adalah untuk variabel-variabel dengan pola yang berlawanan (yaitu, nilai-nilai yang lebih tinggi pada kelompok 0). Dengan demikian, tanda-tanda menunjukkan pola antar kelompok.



Tahap 6: Validasi Hasil Tahap terakhir membahas validitas internal dan eksternal dari fungsi diskriminan. Cara utama validasi adalah melalui penggunaan sampel ketidaksepakatan dan penilaian akurasi prediksinya. Dengan cara ini, validitas ditetapkan jika fungsi diskriminan bekerja pada tingkat yang dapat diterima dalam mengklasifikasikan pengamatan yang tidak digunakan dalam proses estimasi. Jika sampel ketidaksepakatan terbentuk dari sampel asli, maka pendekatan ini menetapkan validitas internal dan



285



Analisis Diskriminan Ganda indikasi awal validitas eksternal. Jika sampel terpisah lainnya, mungkin dari populasi atau segmen populasi lain, membentuk sampel ketidaksepakatan, maka ini membahas lebih lengkap validitas eksternal dari hasil diskriminan. Dalam contoh kami, sampel ketidaksepakatan berasal dari sampel asli. Seperti dibahas sebelumnya, akurasi klasifikasi (rasio hit) baik untuk sampel ketidaksepakatan dan sampel yang divalidasi silang secara nyata di atas ambang batas pada semua ukuran akurasi prediksi. Dengan demikian, analisis tersebut menetapkan validitas internal. Untuk tujuan validitas eksternal, sampel tambahan harus diambil dari populasi yang relevan dan akurasi klasifikasi dinilai dalam sebanyak mungkin situasi. Peneliti didorong untuk memperluas proses validasi melalui perluasan profil kelompok dan kemungkinan penggunaan sampel tambahan untuk menetapkan validitas eksternal. Wawasan tambahan dari analisis kasus yang salah diklasifikasikan mungkin menyarankan variabel tambahan yang dapat lebih meningkatkan model diskriminan.



Tinjauan Manajerial Analisis diskriminan pelanggan HBAT berdasarkan lokasi geografis (terletak di Amerika Utara atau di luar) mengidentifikasi satu set perbedaan persepsi yang dapat memberikan perbedaan yang agak ringkas dan kuat antara kedua kelompok. Beberapa temuan kunci antara lain sebagai berikut: • Perbedaan ditemukan dalam subset dari hanya lima persepsi, memungkinkan untuk fokus pada variabel kunci dan tidak harus berurusan dengan seluruh set. Variabel yang diidentifikasi sebagai pembeda antar kelompok (terdaftar dalam urutan kepentingan) adalah:x13 (Harga Kompetitif), x17 (Fleksibilitas Harga), x11 (Lini Produk), x7 (Kegiatan E-Commerce), dan x6 (Kualitas produk). • Hasil juga menunjukkan bahwa perusahaan yang berlokasi di Amerika Serikat memiliki persepsi yang lebih baik tentang HBAT daripada rekan internasional mereka dalam hal nilai produk dan lini produk, sedangkan pelanggan non-Amerika Utara memiliki persepsi yang lebih baik tentang fleksibilitas harga dan aktivitas ecommerce . Persepsi ini mungkin dihasilkan dari kecocokan yang lebih baik antara pembeli AS/Amerika Utara, sedangkan pelanggan internasional menganggap kebijakan penetapan harga kondusif untuk kebutuhan mereka. • Hasilnya, yang sangat signifikan, memberikan peneliti kemampuan untuk mengidentifikasi dengan benar strategi pembelian yang digunakan berdasarkan persepsi ini sebanyak 85 persen. Tingkat konsistensi mereka yang tinggi memberikan keyakinan dalam pengembangan strategi berdasarkan hasil ini. • Analisis perusahaan yang salah diklasifikasikan mengungkapkan sejumlah kecil perusahaan yang tampaknya tidak pada tempatnya. Mengidentifikasi perusahaan-perusahaan ini dapat mengidentifikasi asosiasi yang tidak ditangani oleh lokasi geografis (misalnya, pasar yang dilayani daripada hanya lokasi fisik) atau perusahaan lain atau karakteristik pasar yang terkait dengan lokasi geografis.



Dengan demikian, mengetahui lokasi geografis perusahaan memberikan wawasan kunci ke dalam persepsi mereka tentang HBAT dan, yang lebih penting, bagaimana kedua kelompok pelanggan berbeda sehingga manajemen dapat menggunakan strategi untuk menonjolkan persepsi positif dalam berurusan dengan pelanggan ini dan lebih memperkuat posisi mereka. .



CONTOH ILUSTRASI TIGA KELOMPOK Untuk mengilustrasikan penerapan analisis diskriminan tiga kelompok, kami sekali lagi menggunakan database HBAT. Pada contoh sebelumnya, kami hanya berfokus pada pembedaan antara dua kelompok, sehingga kami dapat mengembangkan fungsi diskriminan tunggal dan skor pemotongan untuk membagi dua kelompok. Dalam contoh tiga kelompok, perlu untuk mengembangkan dua fungsi diskriminan yang terpisah untuk membedakan di antara tiga kelompok. Fungsi pertama memisahkan satu grup dari



286



Analisis Diskriminan Ganda dua lainnya, dan yang kedua memisahkan dua kelompok yang tersisa. Seperti contoh sebelumnya, enam tahap proses pembuatan model dibahas.



Tahap 1: Tujuan Analisis Diskriminan Tujuan HBAT dalam penelitian ini adalah untuk menentukan hubungan antara persepsi perusahaan terhadap HBAT dan lamanya perusahaan menjadi pelanggan HBAT. Salah satu paradigma yang muncul dalam pemasaran adalah konsep hubungan pelanggan, yang didasarkan pada pembentukan kemitraan timbal balik antara perusahaan melalui transaksi berulang. Proses mengembangkan hubungan memerlukan pembentukan tujuan dan nilai bersama, yang harus sejalan dengan peningkatan persepsi HBAT. Dengan demikian, keberhasilan pembentukan suatu hubungan harus dilihat dengan peningkatan persepsi HBAT dari waktu ke waktu. Dalam analisis ini, perusahaan dikelompokkan berdasarkan masa jabatan mereka sebagai pelanggan HBAT. Harapannya, jika HBAT telah berhasil menjalin hubungan dengan pelanggannya, maka persepsi terhadap HBAT akan meningkat seiring dengan masa kerja sebagai pelanggan HBAT.



Tahap 2: Desain Penelitian untuk Analisis Diskriminan Untuk menguji hubungan ini, analisis diskriminan dilakukan untuk menetapkan apakah ada perbedaan persepsi antara kelompok pelanggan berdasarkan lamanya hubungan pelanggan. Jika demikian, HBAT kemudian tertarik untuk melihat apakah profil yang membedakan mendukung proposisi bahwa HBAT telah berhasil meningkatkan persepsi di antara pelanggan mapan, langkah yang diperlukan dalam pembentukan hubungan pelanggan. PEMILIHAN VARIABEL TERGANTUNG DAN INDEPENDEN Selain nonmetrik



(kategoris) variabel dependen mendefinisikan kelompok kepentingan, analisis diskriminan juga memerlukan satu set variabel independen metrik yang diasumsikan memberikan dasar untuk diskriminasi atau diferensiasi antara kelompok. Analisis diskriminan tiga kelompok dilakukan dengan menggunakan x1 (Tipe Pelanggan) sebagai variabel dependen dan persepsi HBAT oleh perusahaan-perusahaan ini (x6 ke x18) sebagai variabel bebas. Perhatikan bahwax1 berbeda dari variabel dependen dalam contoh dua kelompok yang memiliki tiga kategori untuk mengklasifikasikan lama waktu perusahaan menjadi pelanggan HBAT (1 = kurang dari 1 tahun, 2 = 1 hingga 5 tahun, dan 3 = lebih dari 5 tahun). UKURAN SAMPEL DAN PEMBAGIAN SAMPEL Isu mengenai ukuran sampel sangat penting dengan analisis



diskriminan karena fokus tidak hanya pada ukuran sampel secara keseluruhan, tetapi juga pada ukuran sampel per kelompok. Ditambah dengan kebutuhan akan pembagian sampel untuk menyediakan sampel validasi, peneliti harus hati-hati mempertimbangkan dampak pembagian sampel pada kedua sampel dalam hal ukuran sampel keseluruhan dan ukuran masing-masing kelompok. Basis data HBAT memiliki ukuran sampel 100, yang sekali lagi akan dibagi menjadi sampel analisis dan sampel ketidaksepakatan masing-masing 60 dan 40 kasus. Dalam sampel analisis, rasio kasus terhadap variabel independen hampir 5:1, ambang batas bawah yang direkomendasikan. Lebih penting lagi, dalam sampel analisis, hanya satu kelompok, dengan 13 pengamatan, yang berada di bawah tingkat yang direkomendasikan yaitu 20 kasus per kelompok. Meskipun ukuran kelompok akan melebihi 20 jika seluruh sampel digunakan dalam tahap analisis, kebutuhan untuk validasi mendikte pembuatan sampel ketidaksepakatan. Ketiga kelompok memiliki ukuran yang relatif sama (22, 13, dan 25), sehingga menghindari kebutuhan untuk menyamakan ukuran kelompok. Analisis dilanjutkan dengan perhatian yang diberikan pada klasifikasi dan interpretasi kelompok kecil yang terdiri dari 13 pengamatan ini.



Tahap 3: Asumsi Analisis Diskriminan Seperti yang terjadi pada contoh dua kelompok, asumsi normalitas, linieritas, dan kolinearitas dari variabel bebas tidak akan dibahas panjang lebar di sini. Analisis menunjukkan bahwa variabel independen memenuhi asumsi ini pada tingkat yang memadai



287



Analisis Diskriminan Ganda tingkat untuk memungkinkan analisis untuk melanjutkan tanpa solusi tambahan. Kami selanjutnya akan mengasumsikan kesetaraan varians / kovarians atau matriks dispersi.



Uji Box's M menilai kesamaan matriks dispersi variabel independen antara tiga kelompok (kategori). Statistik uji menunjukkan perbedaan pada tingkat signifikansi 0,09. Dalam hal ini, perbedaan antar kelompok tidak signifikan dan tidak diperlukan tindakan perbaikan. Selain itu, tidak ada dampak yang diharapkan pada proses estimasi atau klasifikasi.



Tahap 4: Estimasi Model Diskriminan dan Menilai Kecocokan Keseluruhan Seperti pada contoh sebelumnya, kami memulai analisis kami dengan meninjau rata-rata grup dan deviasi standar untuk melihat apakah grup berbeda secara signifikan pada variabel tunggal apa pun. Dengan mengingat perbedaan tersebut, kami kemudian menggunakan prosedur estimasi bertahap untuk menurunkan fungsi diskriminan dan menyelesaikan proses dengan menilai akurasi klasifikasi baik secara keseluruhan maupun dengan diagnostik casewise. MENILAI PERBEDAAN KELOMPOK Mengidentifikasi



variabel yang paling diskriminatif dengan tiga atau lebih kelompok lebih bermasalah daripada dalam situasi dua kelompok. Untuk tiga atau lebih kelompok, ukuran khas signifikansi untuk perbedaan antar kelompok (yaitu, lambda Wilks danF tes) hanya menilai perbedaan secara keseluruhan dan tidak menjamin bahwa setiap kelompok signifikan dari yang lain. Jadi, ketika memeriksa variabel untuk perbedaan keseluruhan antara kelompok, pastikan juga untuk mengatasi perbedaan kelompok individu. Tabel 14 memberikan mean grup, lambda Wilks, univariat F rasio (ANOVA sederhana), dan Mahalanobis . minimum D2 untuk setiap variabel bebas. Tinjauan terhadap langkah-langkah diskriminasi ini mengungkapkan hal-hal berikut: • Pada basis univariat, sekitar setengah (7 dari 13) variabel menunjukkan perbedaan yang signifikan antara rata-rata kelompok. Variabel yang memiliki perbedaan signifikan antara lainx6, x9, x11, x13,



x16, x17, dan x18.



• Meskipun signifikansi statistik yang lebih besar sesuai dengan diskriminasi keseluruhan yang lebih tinggi (yaitu, variabel yang paling signifikan memiliki nilai lambda Wilks terendah), itu tidak selalu sesuai dengan diskriminasi terbesar antara semua kelompok. • Inspeksi visual kelompok berarti mengungkapkan bahwa empat variabel dengan perbedaan yang signifikan (x 13,



x16, x17, dan x18) hanya membedakan satu kelompok dengan dua kelompok lainnya [misalnya,



x18 memiliki perbedaan yang signifikan hanya dalam rata-rata antara kelompok 1 (3,059) versus kelompok 2 (4,246) dan 3 (4,288)]. Variabel-variabel ini memainkan peran terbatas dalam analisis diskriminan karena mereka memberikan diskriminasi hanya di antara sebagian kelompok.



• Tiga variabel (x6, x9, dan x11) memberikan beberapa diskriminasi, dalam berbagai tingkat, antara ketiga kelompok secara bersamaan. Satu atau lebih variabel ini dapat digunakan dalam kombinasi dengan empat variabel sebelumnya untuk membuat variasi dengan diskriminasi maksimum.



• Mahalanobis D2 nilai memberikan ukuran derajat diskriminasi antar kelompok. Untuk setiap variabel, Mahalanobis . minimumD2 adalah jarak antara dua kelompok terdekat. Sebagai contoh,x11 memiliki tertinggi D2 nilai, dan itu adalah variabel dengan perbedaan terbesar antara ketiga kelompok. Juga,x18, sebuah variabel dengan sedikit perbedaan antara dua kelompok, memiliki kecil D2 nilai. Dengan tiga grup atau lebih, Mahalanobis minimumD2 penting dalam mengidentifikasi variabel yang memberikan perbedaan terbesar antara dua kelompok yang paling mirip. Semua ukuran ini digabungkan untuk membantu mengidentifikasi himpunan variabel yang membentuk fungsi diskriminan seperti yang dijelaskan di bagian berikutnya. Ketika lebih dari satu fungsi dibuat, setiap fungsi memberikan diskriminasi antara kumpulan grup. Dalam contoh sederhana dari awal bab ini, satu variabel membedakan antara kelompok 1 versus 2 dan 3, sedangkan yang lain membedakan antara kelompok 2 versus 3 dan 1. Ini adalah salah satu manfaat utama yang timbul dari penggunaan analisis diskriminan.



288



Analisis Diskriminan Ganda TABEL 14 Statistik Deskriptif Kelompok dan Uji Kesetaraan untuk Sampel Estimasi dalam Analisis Diskriminan Tiga Kelompok



Grup Variabel Dependen Berarti: x1 Tipe pelanggan Grup 1: Kurang dari



Mandiri Variabel



1 tahun



(n



x6 Kualitas produk



22)



Grup 2: 1 sampai 5 Bertahun-tahun



(n



13)



Grup 3: Lebih dari 5 tahun



(n



25)



Uji Kesetaraan dari Kelompok SaranaA



Wilks'



F



lambda



Nilai



Makna



Minimum Mahalanobis D2



Minimum



Di antara



D2



Grup



7.118



6.785



9.000



. 469



32.311



. 000



. 121



1 dan 2



3.514 4.959



3.754 5.615



3.412 5.376



. 959 . 973



1.221



. 303 . 462



. 025 . 023



1 dan 3 2 dan 3



4.064 3.745 4.855 4.673 7.345 5.705 4.986 3.291 4.018 3.059



5.900 4.277 5.577 5.346 7.123 6.246 5.092 4.715 5.508 4.246



6.300 3.768 7.056 4.836 5.744 6.072 5.292 4.700 4.084 4.288



. 414 . 961 . 467



40.292 1.147 32.583 1.708 9.432 2.619



. 000 . 325 . 000



. 205 . 000 . 579



. 190 . 000 . 082 . 807 . 000 . 000 . 000



. 024 . 027 . 057 . 004 . 000 . 005 . 007



2 dan 3 1 dan 3 1 dan 2 1 dan 3 1 dan 2 2 dan 3 1 dan 2 2 dan 3 1 dan 3 2 dan 3



x7 Perdagangan elektronik



Kegiatan



x8 Dukungan teknis x9 Keluhan Resolusi x10 Periklanan x11 Lini Produk x12 Gambar Tenaga Penjualan



x13 Harga Kompetitif x14 Klaim garansi x15 produk baru x16 Pesanan & Penagihan



x17 Fleksibilitas Harga x18 Kecepatan Pengiriman Alambda



. 943 . 751 . 916 . 992 . 532 . 694 . 415



. 782



. 216



25.048 12.551 40.176



Wilks (kamu statistik) dan univariat F rasio dengan 2 dan 57 derajat kebebasan.



ESTIMASI FUNGSI DISKRIMINAN Prosedur



bertahap dilakukan dengan cara yang sama seperti pada contoh dua kelompok, dengan semua variabel awalnya dikeluarkan dari model. Seperti disebutkan sebelumnya, jarak Mahalanobis harus digunakan dengan prosedur bertahap untuk memilih variabel yang memiliki perbedaan yang signifikan secara statistik di seluruh kelompok sambil memaksimalkan jarak Mahalanobis (D2) antara dua kelompok terdekat. Dengan cara ini, variabel yang signifikan secara statistik dipilih yang memaksimalkan diskriminasi antara kelompok yang paling mirip pada setiap tahap. Proses ini berlanjut selama variabel tambahan memberikan diskriminasi yang signifikan secara statistik di luar perbedaan yang telah diperhitungkan oleh variabel dalam fungsi diskriminan. Sebuah variabel dapat dihilangkan jika multikolinearitas tinggi dengan variabel independen dalam fungsi diskriminan menyebabkan signifikansinya turun di bawah tingkat signifikansi untuk dihilangkan (.10). Estimasi Bertahap: Menambahkan Variabel Pertama, x11. Data pada Tabel 14 menunjukkan bahwa



variabel pertama yang masuk ke model stepwise menggunakan jarak Mahalanobis adalah x11 (Lini Produk) karena memenuhi kriteria perbedaan yang signifikan secara statistik di seluruh grup dan memiliki nilai minimum terbesar D2 nilai (artinya memiliki pemisahan terbesar antara kelompok yang paling mirip). Hasil menambahkan x11 sebagai variabel pertama dalam proses bertahap ditunjukkan pada Tabel 15. Keseluruhan model fit signifikan dan masing-masing kelompok berbeda secara signifikan, meskipun kelompok 1 (kurang dari 1 tahun) dan 2 (1 sampai 5 tahun) memiliki perbedaan terkecil di antara mereka (lihat bagian bawah yang merinci perbedaan kelompok). Dengan perbedaan terkecil antara kelompok 1 dan 2, prosedur diskriminan sekarang akan memilih variabel yang memaksimalkan perbedaan itu sambil setidaknya mempertahankan perbedaan lainnya. Jika kita merujuk kembali ke Tabel 14, kita melihat bahwa empat variabel (x9, x16, x17, dan x18) semua memiliki perbedaan yang signifikan, dengan perbedaan substansial antara kelompok 1 dan 2. Melihat pada Tabel 15, kita melihat bahwa keempat variabel ini memiliki minimum tertinggi D2 nilai, dan dalam setiap kasus itu adalah untuk perbedaan antara kelompok 2 dan 3 (artinya kelompok 1 dan 2 tidak paling mirip setelah menambahkan itu



289



Analisis Diskriminan Ganda variabel). Jadi, menambahkan salah satu dari variabel ini akan paling mempengaruhi perbedaan antara kelompok 1 dan 2, pasangan yang paling mirip setelahx11 ditambahkan pada langkah pertama. Prosedur akan memilih



x17 karena akan membuat jarak terjauh antara kelompok 2 dan 3.



Estimasi Bertahap: Menambahkan Variabel Kedua, x17. Tabel 16 merinci langkah kedua dari



prosedur bertahap: menambahkan x17 (Fleksibilitas Harga) ke fungsi diskriminan. NS TABEL 15 Hasil dari Langkah 1 Analisis Diskriminan Tiga Kelompok Bertahap Model Keseluruhan Cocok



Nilai



F Nilai



. 467



32.583



Lambda Wilks



Derajat kebebasan



Makna



2,57



. 000



Variabel Dimasukkan/Dihapus pada Langkah 1



F Variabel yang Dimasukkan



Nilai



Minimum D2



x11 Lini Produk



Makna



4.729



. 579



Antar Grup



. 000



Kurang dari 1 tahun dan 1 sampai 5 tahun



Catatan: Pada setiap langkah dimasukkan variabel yang memaksimalkan jarak Mahalanobis antara dua kelompok terdekat.



Variabel dalam Analisis Setelah Langkah 1



Variabel



Toleransi



F untuk menghapus



D2



1.000



32.583



tidak



x11 Lini Produk



Antar Grup tidak



NA = Tidak berlaku. Variabel Tidak dalam Analisis Setelah Langkah 1



Variabel



x6 Kualitas produk x7 Aktivitas E-Commerce x8 Dukungan teknis



Toleransi



Minimum Toleransi



1.000



1.000



. 950 . 959 . 847 . 998 . 932 . 849 . 882 . 993 . 943 . 807 . 773



. 950 . 959 . 847 . 998 . 932 . 849 . 882 . 993 . 943 . 807 . 773



x9 Penyelesaian Keluhan x10 Periklanan x12 Gambar Tenaga Penjualan



x13 Harga Kompetitif x14 Klaim garansi x15 produk baru x16 Pesanan & Penagihan



x17 Fleksibilitas Harga x18 Kecepatan Pengiriman



F ke Memasuki



17.426 1.171 . 733



15.446 1.113 3.076 . 647



2.299



. 415



12.176 17.300 19.020



Minimum



D2



. 698



Kurang dari 1 tahun dan 1 sampai 5 tahun



. 892 . 649



Kurang dari 1 tahun dan 1 sampai 5 tahun 1



1 sampai 5 tahun



Kurang dari 1 tahun



F Tanda tangan.



Lebih dari 5 tahun



F



sampai 5 tahun dan lebih dari 5 tahun Kurang



. 850



dari 1 tahun dan 1 sampai 5 tahun Kurang dari



1.328 . 599 . 839 . 596



2.590 3.322 2.988



Tanda tangan.



A1,



290



57 derajat kebebasan.



1 sampai 5 Tahun



4.729 . 034



Kurang dari 1 tahun dan 1 sampai 5 tahun



2.455



Pengujian Signifikansi Perbedaan Kelompok Setelah Langkah 1A



x1 - Tipe pelanggan



Antar Grup



62.893



20.749



. 000



. 000



1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun 1 sampai 5 tahun dan lebih dari 5 tahun 1 sampai 5 tahun dan lebih dari 5 tahun 1 sampai 5 tahun dan lebih dari 5 tahun



Analisis Diskriminan Ganda diskriminasi antar kelompok meningkat, sebagaimana tercermin dalam nilai lambda Wilks yang lebih rendah dan peningkatan minimum D2 (0,467 hingga 0,288). Perbedaan kelompok, secara keseluruhan dan individu, masih signifikan secara statistik. Tambahan darix17 meningkatkan perbedaan antara kelompok 1 dan 2 secara substansial, sehingga sekarang dua kelompok yang paling mirip adalah 2 dan 3. Dari variabel yang tidak ada dalam persamaan, hanya x6 (Kualitas Produk) memenuhi tingkat signifikansi yang diperlukan untuk dipertimbangkan. Jika ditambahkan, minimumD2 sekarang akan berada di antara kelompok 1 dan 2.



TABEL 16 Hasil dari Langkah 2 Analisis Diskriminan Tiga Kelompok Bertahap Model Keseluruhan Cocok



Lambda Wilks



Nilai



F Nilai



Derajat kebebasan



. 288



24.139



4, 112



Makna . 000



Variabel Dimasukkan/Dihapus pada Langkah 2



F Variabel yang Dimasukkan



Minimum D2



Nilai



Makna



x17 Fleksibilitas Harga



3.322



13,958



Antar Grup



. 000



1 sampai 5 tahun dan lebih dari 5 tahun



Catatan: Pada setiap langkah dimasukkan variabel yang memaksimalkan jarak Mahalanobis antara dua kelompok terdekat.



Variabel dalam Analisis Setelah Langkah 2



Variabel



Toleransi



F untuk menghapus



D2



Antar Grup



. 807 . 807



39.405 17.300



. 005 . 579



Kurang dari 1 tahun dan 1 hingga 5 tahun



x11 Lini Produk x17 Fleksibilitas Harga



Kurang dari 1 tahun dan lebih dari 5 tahun



Variabel Tidak dalam Analisis Setelah Langkah 2



Variabel



Toleransi



Minimum Toleransi



. 730 . 880 . 949 . 520 . 935 . 884 . 794 . 868 . 963 . 754 . 067



. 589 . 747 . 791 . 475 . 756 . 765 . 750 . 750 . 782 . 645 . 067



x6 Kualitas produk x7 Aktivitas E-Commerce x8 Dukungan teknis x9 Penyelesaian Keluhan x10 Periklanan x12 Gambar Tenaga Penjualan



x13 Harga Kompetitif x14 Klaim garansi x15 produk baru x16 Pesanan & Penagihan x18 Kecepatan Pengiriman



F ke



Minimum



D2



Memasuki



24.444 . 014



1.023 3.932



. 102 . 662 . 989



2,733



. 504



2.456 3.255



6.071 3.327 3.655 3.608 3.348 3.342 3.372 4.225 3.505 3.323 3.598



Antar Grup Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun



Pengujian Signifikansi Perbedaan Kelompok Setelah Langkah 2A



x1 Tipe pelanggan 1 sampai 5 tahun



Kurang dari 1 tahun



F Tanda tangan.



Lebih dari 5 tahun



F Tanda tangan.



A2,



1 sampai 5 Tahun



21,054 . 000



39.360



13,958



. 000



. 000



56 derajat kebebasan.



291



Analisis Diskriminan Ganda Estimasi Bertahap: Menambahkan Variabel Ketiga dan Keempat, x6 dan x18. Seperti dicatat sebelumnya dengan sungguh-sungguh, x6 menjadi variabel ketiga yang ditambahkan ke fungsi diskriminan. Setelahx6 ditambahkan, hanya x18



menunjukkan signifikansi statistik di seluruh kelompok (Catatan: Detail penambahan x6 pada langkah 3 tidak ditampilkan untuk pertimbangan ruang). Variabel terakhir yang ditambahkan pada langkah 4 adalah x18 (lihat Tabel 17), dengan fungsi diskriminan sekarang termasuk empat variabel (x11, x17, x6, dan x18). Model keseluruhan adalah signifikan, dengan Wilks '



TABEL 17 Hasil dari Langkah 4 Analisis Diskriminan Tiga Kelompok Bertahap Model Keseluruhan Cocok



Nilai



F Nilai



Derajat kebebasan



. 127



24.340



8, 108



Lambda Wilks



Makna . 000



Variabel Dimasukkan/Dihapus pada Langkah 4



F Variabel yang Dimasukkan



Minimum D2



Nilai



x18 Kecepatan Pengiriman



6.920



13,393



Makna



Antar Grup



. 000



Kurang dari 1 tahun dan 1 sampai 5 tahun



Catatan: Pada setiap langkah dimasukkan variabel yang memaksimalkan jarak Mahalanobis antara dua kelompok terdekat.



Variabel dalam Analisis Setelah Langkah 4



Variabel



Toleransi



F untuk menghapus



. 075 . 070 . 680 . 063



1.735 27.701 5.387



x11 Lini Produk x17 Fleksibilitas Harga



x6 Kualitas produk x18 Kecepatan Pengiriman



D2



Antar Grup



6.830 6.916 3.598 6.071



. 918



Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun 1 sampai 5 tahun dan lebih dari 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun



Variabel Tidak Dalam Analisis Setelah Langkah 4



Variabel



x7 Aktivitas E-Commerce x8 Dukungan teknis x9 Penyelesaian Keluhan x10 Periklanan x12 Gambar Tenaga Penjualan



x13 Harga Kompetitif x14 Klaim garansi x15 produk baru x16 Pesanan & Penagihan



Toleransi



Minimum Toleransi



. 870 . 940 . 453 . 932 . 843 . 790 . 843 . 927 . 671



. 063 . 063 . 058 . 063 . 061 . 063 . 063 . 062 . 062



F ke Memasuki



. 226 . 793 . 292 . 006 . 315 . 924



2.023



. 227



1.478



Minimum



D2



6.931 7.164 7.019 6.921 7.031 7.193 7.696 7.028 7.210



Pengujian Signifikansi Perbedaan Kelompok Setelah Langkah 4A



x1 Tipe pelanggan 1 sampai 5 tahun



Kurang dari 1 tahun



F Tanda tangan.



Lebih dari 5 tahun



F



Tanda tangan.



A4,



292



54 derajat kebebasan.



1 sampai 5 Tahun



13,393 . 000



56.164



18.477



. 000



. 000



Antar Grup Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun



Analisis Diskriminan Ganda



lambda menurun ke 0,127. Selain itu, ada perbedaan yang signifikan antara semua kelompok individu. Dengan keempat variabel ini dalam fungsi diskriminan, tidak ada variabel lain yang menunjukkan signifikansi statistik yang diperlukan untuk dimasukkan dan prosedur bertahap diselesaikan dalam hal penambahan variabel. Prosedur, bagaimanapun, juga mencakup pemeriksaan signifikansi setiap variabel untuk dipertahankan dalam fungsi diskriminan. Dalam hal ini, “F untuk Menghapus” untuk keduanya x11 dan x17 tidak signifikan (masing-masing 0,918 dan 1,735), menunjukkan bahwa salah satu atau keduanya adalah kandidat untuk dihilangkan dari fungsi diskriminan.



Estimasi Bertahap: Penghapusan x17 dan x11. Kapan x18 ditambahkan ke model di langkah keempat (lihat diskusi sebelumnya), x11 memiliki yang terendah”F to Remove” (.918), menyebabkan prosedur bertahap untuk menghilangkan variabel tersebut dari fungsi diskriminan pada langkah 5 (detail langkah 5 ini dihilangkan untuk pertimbangan ruang). Dengan sekarang tiga variabel dalam fungsi diskriminan (



x11, x6, dan x18), kecocokan model keseluruhan masih signifikan secara statistik dan lambda Wilks hanya meningkat sedikit menjadi ,135. Semua kelompok berbeda secara signifikan. Tidak ada variabel yang mencapai tingkat signifikansi statistik yang diperlukan untuk ditambahkan ke fungsi diskriminan, dan satu variabel lagi (x 11)



memiliki “F to Remove” nilai 2,552, yang menunjukkan bahwa itu juga dapat dihapus dari fungsi.



Tabel 18 berisi rincian langkah 6 dari prosedur bertahap dimana: x11 juga dihapus dari fungsi diskriminan, dengan hanya x6 dan x18 sebagai dua variabel yang tersisa. Bahkan dengan penghapusan variabel kedua (x11), model keseluruhan masih signifikan dan lambda Wilks cukup kecil (0,148). Kita harus mencatat bahwa model dua variabel darix6 dan x18 adalah peningkatan dari model dua variabel pertama dari x11 dan x17 terbentuk pada langkah 2 (lamda Wilks adalah 0,148 versus nilai model pertama 0,288 dan semua perbedaan kelompok individu jauh lebih besar). Dengan tidak ada variabel yang mencapai tingkat signifikansi yang diperlukan untuk penambahan atau penghapusan, prosedur bertahap berakhir.



Ringkasan Proses Estimasi Bertahap. Estimasi fungsi diskriminan adalah komposit linier mirip dengan garis regresi (yaitu, mereka adalah kombinasi linier dari variabel). Sama seperti garis regresi adalah upaya untuk menjelaskan jumlah maksimum variasi dalam variabel dependennya, komposit linier ini mencoba untuk menjelaskan variasi atau perbedaan dalam variabel kategoris dependen. Fungsi diskriminan pertama dikembangkan untuk menjelaskan (menjelaskan) jumlah terbesar variasi (perbedaan) dalam kelompok diskriminan. Fungsi diskriminan kedua, yang ortogonal dan independen dari yang pertama, menjelaskan persentase terbesar dari varians (sisa) yang tersisa setelah varians untuk fungsi pertama dihilangkan. Informasi yang diberikan pada Tabel 19 merangkum langkah-langkah analisis diskriminan tiga kelompok, dengan hasil sebagai berikut:



• Variabel x6 dan x18 adalah dua variabel dalam fungsi diskriminan akhir, meskipun x11 dan x17 ditambahkan dalam dua langkah pertama dan kemudian dihapus setelah x6 dan x18 ditambahkan. Koefisien fungsi diskriminan (bobot) yang tidak standar dan terstandarisasi dan matriks struktur dari beban diskriminan, tidak diputar dan diputar, juga disediakan. Rotasi beban diskriminan memfasilitasi interpretasi dengan cara yang sama bahwa faktor disederhanakan untuk interpretasi dengan rotasi. Kami memeriksa pembebanan yang tidak diputar dan yang diputar lebih lengkap pada langkah 5.



• Diskriminasi meningkat dengan penambahan setiap variabel (dibuktikan dengan penurunan lambda Wilks) meskipun hanya dua variabel yang tersisa dalam model akhir. Dengan membandingkan lambda Wilks akhir untuk analisis diskriminan (0,148) dengan lambda Wilks (0,414) untuk hasil terbaik dari satu variabel,x9, kita melihat bahwa peningkatan yang nyata dibuat hanya dengan menggunakan dua variabel dalam fungsi diskriminan daripada satu variabel.



• Kecocokan keseluruhan untuk model diskriminan signifikan secara statistik dan kedua fungsi juga signifikan secara statistik. Fungsi pertama menyumbang 91,5 persen dari



293



Analisis Diskriminan Ganda varians dijelaskan oleh dua fungsi, dengan varians yang tersisa (8,5%) karena fungsi kedua. Jumlah total varians yang dijelaskan oleh fungsi pertama adalah 0,8932, atau 79,7 persen. Fungsi selanjutnya menjelaskan .5172, atau 26,7 persen, dari varians yang tersisa (20,3%). Oleh karena itu, total varians yang dijelaskan oleh kedua fungsi adalah 85,1 persen [79,7% + (26,7%× .203)] dari total variasi variabel terikat.



TABEL 18 Hasil dari Langkah 6 Analisis Diskriminan Tiga Kelompok Bertahap Model Keseluruhan Cocok



Lambda Wilks



Nilai



F Nilai



Derajat kebebasan



. 148



44.774



4, 112



Makna . 000



Variabel Dimasukkan/Dihapus pada Langkah 6



F Variabel Dihapus



Minimum D2



Nilai



6.388



25,642



x11 Lini Produk



Makna



Antar Grup



. 000



Kurang dari 1 tahun dan 1 sampai 5 tahun



Catatan: Pada setiap langkah dimasukkan variabel yang memaksimalkan jarak Mahalanobis antara dua kelompok terdekat.



Variabel dalam Analisis Setelah Langkah 6



Variabel



x6 Kualitas produk x18 Kecepatan Pengiriman



Toleransi



F untuk menghapus



D2



. 754 . 754



50,494 60.646



. 007 . 121



Antar Grup 1 sampai 5 tahun dan lebih dari 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun



Variabel Tidak dalam Analisis Setelah Langkah 6



Variabel



x7 Aktivitas E-Commerce x8 Dukungan teknis x9 Penyelesaian Keluhan x10 Periklanan x11 Lini Produk x12 Gambar Tenaga Penjualan



x13 Harga Kompetitif x14 Klaim garansi x15 produk baru x16 Pesanan & Penagihan



x17 Fleksibilitas Harga



Toleransi



Minimum Toleransi



. 954 . 999 . 453 . 954 . 701 . 957 . 994 . 991 . 984 . 682 . 652



. 728 . 753 . 349 . 742 . 529 . 730 . 749 . 751 . 744 . 514 . 628



F ke



Minimum



D2



Memasuki



6.474 6.495 6.490 6.402 6.916 6.697 6.408 6.694 6.428 6.750 6.830



. 177 . 269 . 376 . 128



2.552



. 641



1.440



. 657 . 151



2.397 3.431



Pengujian Signifikansi Perbedaan Kelompok Setelah Langkah 6A



x1 Tipe pelanggan 1 sampai 5 tahun



Kurang dari 1 tahun



F Tanda tangan.



Lebih dari 5 tahun



F



Tanda tangan.



A6,



294



52 derajat kebebasan.



1 sampai 5 Tahun



25,642 . 000



110.261



30.756



. 000



. 000



Antar Grup Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun Kurang dari 1 tahun dan 1 sampai 5 tahun



Analisis Diskriminan Ganda TABEL 19 Ringkasan Statistik untuk Analisis Diskriminan Tiga Kelompok Kesesuaian Model Keseluruhan: Fungsi Diskriminan Canonical



Persentase Varians Fungsi



Nilai Eigen



1 2



Fungsi Kumulatif



Resmi Korelasi



%%



91.5 8.5



3.950 . 365



Chi-



Wilks'



lambda



Persegi



df 4 1



91.5



. 893



. 148



107.932



100.0



. 517



. 733



17.569



Makna . 000 . 000



Fungsi Diskriminan dan Koefisien Fungsi Klasifikasi FUNGSI DISKRIMINAN



Tidak standar Fungsi Diskriminan Mandiri Variabel



Standar Fungsi Diskriminan



Klasifikasi Fungsi Kurang dari



Fungsi 1



x6 Kualitas produk x18 Kecepatan Pengiriman (Konstan)



Fungsi 2 1.159



. 308



2.200 - 10.832



. 584



- 11.313



Fungsi 1



Fungsi 2



. 969



. 622



1.021



- . 533



1 sampai 5



1 tahun



14,382 25.487 - 91.174



Bertahun-tahun



15.510 31.185 - 120.351



Lebih dari 5 Bertahun-tahun



18.753 34.401 - 159.022



Struktur Matriks



Diputar



Tidak diputar



Pemuatan DiskriminanA



Variabel independen



Fungsi 1



Fungsi 2



Pemuatan DiskriminanB



Fungsi 1



Fungsi 2



x9 Penyelesaian Keluhan*



. 572



- . 470



. 739



. 039



x16 Pesanan & Penagihan



. 499 . 483 . 125 . 030 . 463 . 540 . 106 . 028



- . 263 - . 256 - . 005 - . 017 . 886



. 546 . 529 . 096 . 033



. 143 . 137 . 080 . 008 . 967



x11 Lini Produk* x15 Produk baru* x8 Dukungan teknis* x6 Kualitas produk* x18 Kecepatan Pengiriman



x17 Fleksibilitas Harga*



x10 Periklanan* x7 Aktivitas E-Commerce* x12 Gambar Tenaga Penjualan*



x14 Klaim garansi* x13 Harga Kompetitif* AKorelasi



- . 842 - . 580 - . 213 - . 193 - . 188 - . 088 - . 059



- . 095 - . 088 . 030 - . 055



- . 257 . 967 . 470 . 165 . 061 . 061 . 081



- . 257 - . 356 - . 138 - . 207 - . 198 . 044



- . 001



- . 080



dalam kelompok yang dikumpulkan antara variabel pembeda dan variabel fungsi diskriminan kanonik standar yang diurutkan



berdasarkan ukuran absolut korelasi dalam fungsi. BKorelasi



dalam kelompok yang dikumpulkan antara variabel pembeda dan fungsi diskriminan kanonik standar yang diputar.



* Variabel ini tidak digunakan dalam analisis.



Group Means (Centroids) dari Fungsi DiskriminanC x1 Tipe pelanggan Kurang dari 1 tahun 1 sampai 5 tahun



Lebih dari 5 tahun CFungsi



Fungsi 1



Fungsi 1



- 1.911



- 1.274



. 597



1.371



- . 968



1.625



diskriminan kanonik tidak standar dievaluasi pada rata-rata grup.



295



Analisis Diskriminan Ganda Meskipun kedua fungsi diskriminan signifikan secara statistik, peneliti harus selalu memastikan bahwa fungsi diskriminan memberikan perbedaan di antara semua kelompok. Dimungkinkan untuk memiliki fungsi yang signifikan secara statistik, tetapi memiliki setidaknya satu pasangan kelompok yang tidak berbeda secara statistik (yaitu, tidak dibedakan). Masalah ini menjadi sangat umum ketika jumlah kelompok bertambah atau sejumlah kelompok kecil dimasukkan dalam analisis. Bagian terakhir dari Tabel 18 memberikan uji signifikansi untuk perbedaan kelompok antara setiap pasangan kelompok (misalnya, kelompok 1 versus kelompok 2, kelompok 1 versus kelompok 3, dll). Semua pasangan kelompok menunjukkan perbedaan yang signifikan secara statistik, yang menunjukkan bahwa fungsi diskriminan menciptakan pemisahan tidak hanya dalam arti keseluruhan, tetapi juga untuk setiap kelompok. Kami juga memeriksa centroid grup secara grafis di bagian selanjutnya.



MENILAI AKURASI KLASIFIKASI Karena



merupakan model analisis diskriminan tiga kelompok, dua fungsi diskriminan dihitung untuk membedakan antara tiga kelompok. Nilai untuk setiap kasus dimasukkan ke dalam model diskriminan dan komposit linier (diskriminanZ skor) dihitung. Fungsi diskriminan hanya didasarkan pada variabel yang termasuk dalam model diskriminan. Tabel 19 memberikan bobot diskriminan dari kedua variabel (x6 dan x18) dan grup berarti dari setiap grup pada kedua fungsi (bagian bawah tabel). Seperti yang dapat kita lihat dengan memeriksa ratarata kelompok, fungsi pertama terutama membedakan kelompok 1 (Kurang dari 1 tahun) dari dua kelompok lainnya (walaupun perbedaan mencolok juga terjadi antara kelompok 2 dan 3), sedangkan fungsi kedua terutama memisahkan kelompok. 3 (Lebih dari 5 tahun) dari dua kelompok lainnya. Oleh karena itu, fungsi pertama memberikan pemisahan paling banyak di antara ketiga kelompok, tetapi dilengkapi dengan fungsi kedua, yang mendiskriminasi terbaik (1 dan 2 versus 3) di mana fungsi pertama paling lemah. Menilai Ketepatan Prediksi Keanggotaan Grup. Langkah terakhir untuk menilai secara keseluruhan model fit adalah untuk menentukan tingkat akurasi prediktif dari fungsi diskriminan. Penentuan ini dilakukan dengan cara yang sama seperti dengan model diskriminan dua kelompok, dengan memeriksa matriks klasifikasi dan persentase yang diklasifikasikan dengan benar (rasio hit) di setiap sampel. Klasifikasi kasus individu dapat dilakukan baik dengan metode cutoff yang dijelaskan dalam kasus dua kelompok atau dengan menggunakan fungsi klasifikasi (lihat Tabel 19) di mana setiap kasus diberi skor pada setiap fungsi klasifikasi dan diklasifikasikan ke kelompok dengan skor tertinggi.



Tabel 20 menunjukkan bahwa dua fungsi diskriminan dalam kombinasi mencapai tingkat akurasi klasifikasi yang tinggi. Rasio hit untuk sampel analisis adalah 86,7 persen. Namun, rasio hit untuk sampel ketidaksepakatan turun menjadi 55,0 persen. Hasil ini menunjukkan bias ke atas yang mungkin terjadi bila diterapkan hanya pada sampel analisis dan tidak juga pada sampel ketidaksepakatan. Kedua rasio hit harus dibandingkan dengan peluang maksimum dan kriteria peluang proporsional untuk menilai keefektifannya yang sebenarnya. Prosedur validasi silang dibahas pada langkah 6.



• Kriteria peluang maksimum hanyalah rasio hit yang diperoleh jika kita menetapkan semua pengamatan ke grup dengan probabilitas kemunculan tertinggi. Dalam sampel 100 pengamatan ini, 32 berada di grup 1, 35 di grup 2, dan 33 di grup 3. Dari informasi ini, kita dapat melihat bahwa probabilitas tertinggi adalah 35 persen (grup 2). Nilai ambang untuk peluang maksimum (35%× 1,25) adalah 43,74 persen. • Kriteria peluang proporsional dihitung dengan mengkuadratkan proporsi tiap kelompok, dengan nilai hitung 33,36 persen (0,32 persen).2 + 0,352 + 0,332 = 0,334) dan nilai ambang



41,7 persen (33,4% × 1,25 = 41,7%).



Rasio hit untuk sampel analisis dan ketidaksepakatan (masing-masing 86,7% dan 55,0%) melebihi nilai ambang batas 43,74 dan 41,7 persen. Dalam sampel estimasi, semua kelompok individu melampaui kedua nilai ambang batas. Namun, dalam sampel ketidaksepakatan, grup 2 memiliki rasio hit hanya 40,9 persen, dan meningkat menjadi hanya 53,8 persen dalam sampel analisis. Hasil ini menunjukkan bahwa kelompok 2 harus menjadi fokus perbaikan klasifikasi, mungkin dengan penambahan variabel independen atau review klasifikasi perusahaan dalam kelompok ini untuk mengidentifikasi karakteristik kelompok ini tidak terwakili dalam fungsi diskriminan.



296



Analisis Diskriminan Ganda TABEL 20 Hasil Klasifikasi untuk Analisis Diskriminan Tiga Kelompok Hasil Klasifikasia, b, c Keanggotaan Grup yang Diprediksi



Lebih dari



Kurang dari Grup Sebenarnya



Perkiraan



kurang dari 1 tahun



Sampel 1 sampai 5 tahun



Lebih dari 5 tahun Menyeberang-



kurang dari 1 tahun



divalidasi 1 sampai 5 tahun



Lebih dari 5 tahun



Tahan



kurang dari 1 tahun



Sampel 1 sampai 5 tahun



Lebih dari 5 tahun



1 tahun



1 sampai 5 Tahun



5 tahun



Total



21 95.5 2 15.4 0 0,0 21 95.5 2 15.4 0 0,0 5 50.0 1 4,5 0 0,0



1 4,5 7 53.8 1 4.0 1 4,5 7 53.8 1 4.0 3 30.0 9 40.9 0 0,0



0 0,0 4 30.8 24 96.0 0 0,0



22



A86,7%



dari kasus pengelompokan asli yang dipilih diklasifikasikan dengan benar.



B55,0%



dari kasus pengelompokan asli yang tidak dipilih diklasifikasikan dengan benar.



C86,7%



4 30.8 24 96.0 2 20.0 12 54.5 8



13 25 22 13 25 10 22



100.0



8



dari kasus pengelompokan yang divalidasi silang yang dipilih diklasifikasikan dengan benar.



Ukuran akhir dari akurasi klasifikasi adalah Press's Q, dihitung untuk kedua analisis dan sampel ketidaksepakatan. Ini menguji signifikansi statistik bahwa akurasi klasifikasi lebih baik daripada kebetulan.



[60 - (52 * 3)]2



pers Q Contoh Estimasi =



60(3 - 1)



= 76.8



Dan perhitungan untuk sampel ketidaksepakatan adalah



pers Q Contoh Penahanan =



[40 - (22 * 3)]2 40(3 - 1)



= 8.45



Karena nilai kritis pada tingkat signifikansi 0,01 adalah 6,63, analisis diskriminan dapat digambarkan sebagai memprediksi keanggotaan kelompok lebih baik daripada kebetulan. Setelah selesai, kita dapat menyimpulkan bahwa model diskriminan valid dan memiliki tingkat signifikansi statistik dan praktis yang memadai untuk semua kelompok. Nilai yang jauh lebih rendah untuk sampel ketidaksepakatan pada semua standar perbandingan, bagaimanapun, mendukung kekhawatiran yang dikemukakan sebelumnya tentang rasio hit keseluruhan dan grup-spesifik.



DIAGNOSTIK KASUS Selain tabel klasifikasi yang menunjukkan hasil agregat, informasi



khusus kasus juga tersedia yang merinci klasifikasi setiap pengamatan. Informasi ini dapat merinci secara spesifik proses klasifikasi atau mewakili klasifikasi melalui peta teritorial.



297



Analisis Diskriminan Ganda Informasi Klasifikasi Khusus Kasus. Serangkaian tindakan khusus kasus tersedia untuk mengidentifikasi



kasus yang salah klasifikasi serta mendiagnosis sejauh mana setiap kesalahan klasifikasi. Dengan menggunakan informasi ini, pola di antara kesalahan klasifikasi dapat diidentifikasi.



Tabel 21 berisi data klasifikasi tambahan untuk setiap kasus individu yang salah diklasifikasikan (informasi serupa juga tersedia untuk semua kasus lain, tetapi dihilangkan untuk pertimbangan ruang). Jenis dasar informasi klasifikasi meliputi:







Keanggotaan grup. Baik kelompok aktual maupun yang diprediksi ditunjukkan untuk mengidentifikasi setiap jenis kesalahan klasifikasi (misalnya, keanggotaan aktual dalam grup 1, tetapi diprediksi dalam grup 2). Dalam contoh ini, kita melihat 8 kasus salah diklasifikasikan dalam sampel analisis (verifikasi dengan menambahkan nilai off-diagonal pada Tabel 20) dan 18 kasus salah diklasifikasikan dalam sampel ketidaksepakatan.



TABEL 21 Prediksi Salah Klasifikasi untuk Kasus Perorangan dalam Analisis Diskriminan Tiga Kelompok



SKOR DISKRIMINAN



KEANGGOTAAN GRUP



(X1) ID Kasus Sebenarnya



Diprediksi



Mahalanobis Jarak ke pusatA



Fungsi 1



Fungsi 2



KLASIFIKASI PROBABILITAS



Grup 1



Grup 2



Grup 3



Sampel Analisis/Estimasi



10 8 100 1 5 37 88 58



1 2 2 2 2 2 2 3



2 1 1 3 3 3 3 2



. 175



. 81755



1.747 2.820 2.947 3.217 3.217 2.390



- . 78395 - . 70077 - . 07613 - . 36224 - . 36224



. 727



. 99763 . 30687



1.723 . 813



- 1.32387 - 1.96454



. 04173



. 93645



. 02182



- . 16637



. 75064 . 54280 . 06527 . 05471 . 05471 . 00841 . 07879



. 24904 . 39170 . 28958 . 13646 . 13646 . 46212 . 70022



. 00032 . 06550 . 64515 . 80884 . 80884 . 52947 . 22099



- . 18552



- 2.02118



. 40554



. 59341



. 00104



. 08688



- . 22477 - . 57343



. 13933 . 42296 . 00000 . 09917 . 89141 . 00399 . 00712 . 00028 . 02733 . 00006 . 00712 . 00000 . 17066 . 06527 . 00006 . 00841 . 00119



. 70042 . 54291 . 00184 . 27855 . 08200 . 10959 . 31048 . 08306 . 30246 . 00665 . 31048 . 04641 . 38259 . 28958 . 00665 . 46212 . 03255



. 16025 . 03412 . 99816 . 62228 . 02659 . 88641 . 68240 . 91667 . 67021 . 99330 . 68240 . 95359 . 44675 . 64515 . 99330 . 52947 . 96625



- . 11060 . 70175



1.16458 1.16458 . 12476



Contoh Holdout/Validasi



25 77 97 13 96 83 23 34 39 41 42 55 57 62 75 78 85 89 AJarak



298



1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2



2 2 2 3 3 1 3 3 3 3 3 3 3 3 3 3 3 3



Mahalanobis ke centroid grup yang diprediksi.



1.180



. 576



3.428 2.940



. 972



1.717



- . 41466



1.77156



- . 26535



- 1,58531 . 61462 . 86996



2.26982 . 75928 . 40887 . 99288 . 41413 . 82119 . 58670



. 694



1.59148



. 210



1.08081



1.97869



. 86996



. 41413 . 47780 . 52743 . 70175



2.220 1.717 6.041 4.088 2.947



. 30230



3.54521 - . 32690 - . 07613



. 210



1.08081



1.97869



. 689



. 99763 . 54850



1.51411



2.390



. 12476



Analisis Diskriminan Ganda







Jarak Mahalanobis ke centroid grup yang diprediksi. Menunjukkan kedekatan kasus yang salah diklasifikasikan ini dengan kelompok yang diprediksi. Beberapa pengamatan, seperti kasus 10, jelas mirip dengan pengamatan kelompok yang diprediksi daripada kelompok sebenarnya. Pengamatan lain, seperti kasus 57 (jarak Mahalanobis 6,041), kemungkinan besar merupakan outlier dalam kelompok prediksi maupun kelompok sebenarnya. Peta teritorial yang dibahas pada bagian berikutnya secara grafis menggambarkan posisi setiap pengamatan dan membantu dalam interpretasi ukuran jarak.



• Skor diskriminan. diskriminan Z skor untuk setiap kasus pada setiap fungsi diskriminan •



menyediakan sarana perbandingan langsung antara kasus serta posisi relatif versus sarana kelompok. Kemungkinan klasifikasi. Berasal dari penggunaan fungsi klasifikasi diskriminan, probabilitas keanggotaan untuk setiap kelompok diberikan. Nilai probabilitas memungkinkan peneliti untuk menilai tingkat kesalahan klasifikasi. Misalnya, dua kasus, 85 dan 89, adalah jenis kesalahan klasifikasi yang sama (kelompok aktual 2, kelompok prediksi 3), tetapi sangat berbeda dalam kesalahan klasifikasi ketika probabilitas klasifikasi dilihat. Kasus 85 mewakili kesalahan klasifikasi marginal, karena probabilitas prediksi untuk grup 2 yang sebenarnya adalah 0,462 dan prediksi grup 3 yang salah hanya sedikit lebih tinggi (0,529). Kesalahan klasifikasi ini berbeda dengan kasus 89, di mana probabilitas kelompok yang sebenarnya adalah 0,032 dan probabilitas yang diprediksi untuk kelompok 3 (kelompok yang salah klasifikasi) adalah 0,966. Dalam kedua situasi kesalahan klasifikasi, tingkat atau besarnya sangat bervariasi.



Peneliti harus mengevaluasi tingkat kesalahan klasifikasi untuk setiap kasus. Kasus-kasus yang jelas-jelas salah klasifikasi harus dipilih untuk analisis tambahan (pembuatan profil, pemeriksaan variabel tambahan, dll.) yang dibahas dalam analisis dua kelompok.



Peta Wilayah. Analisis kasus yang salah diklasifikasikan dapat dilengkapi dengan pemeriksaan grafis dari pengamatan individu dengan memplotnya berdasarkan diskriminannya. Z



skor.



Gambar 9 memplot setiap pengamatan berdasarkan dua diskriminan yang diputar Z skor dengan hamparan peta teritorial yang mewakili batas skor pemotongan untuk setiap fungsi. Dalam melihat dispersi masing-masing kelompok di sekitar pusat massa kelompok, kita dapat mengamati beberapa temuan: • Kelompok 3 (Lebih dari 5 tahun) paling terkonsentrasi, dengan sedikit tumpang tindih dengan dua kelompok lainnya seperti yang ditunjukkan pada matriks klasifikasi di mana hanya satu pengamatan yang salah klasifikasi (lihat Tabel 20). • Grup 1 (Kurang dari 1 tahun) adalah yang paling tidak kompak, tetapi cakupan kasusnya tidak terlalu tumpang tindih dengan grup lain, sehingga membuat prediksi jauh lebih baik daripada yang diharapkan untuk grup yang beragam. Satu-satunya kasus salah klasifikasi yang secara substansial berbeda adalah kasus 10, yang dekat dengan pusat massa untuk grup 2, dan kasus 13, yang dekat dengan pusat massa grup 3. Kedua kasus ini perlu diselidiki lebih lanjut untuk kesamaan mereka dengan yang lain. kelompok. • Kedua kelompok ini berbeda dengan kelompok 2 (1 sampai 5 tahun), yang terlihat memiliki tumpang tindih substansial dengan kelompok 3 dan pada tingkat yang lebih rendah dengan kelompok 1 (Kurang dari 1 tahun). Tumpang tindih ini menghasilkan tingkat akurasi klasifikasi terendah baik dalam analisis maupun sampel ketidaksepakatan.



• Tumpang tindih yang terjadi antara kelompok 2 dan 3 di tengah dan kanan grafik menunjukkan kemungkinan adanya kelompok keempat. Analisis dapat dilakukan untuk menentukan lamanya waktu pelanggan yang sebenarnya, mungkin dengan pelanggan lebih dari 1 tahun dibagi menjadi tiga kelompok, bukan dua. Penggambaran grafis berguna tidak hanya untuk mengidentifikasi kasus-kasus yang salah diklasifikasikan yang dapat membentuk kelompok baru, tetapi juga dalam mengidentifikasi outlier. Diskusi sebelumnya mengidentifikasi opsi yang memungkinkan untuk mengidentifikasi outlier (kasus 57) serta kemungkinan redefinisi grup antara grup 2 dan 3.



299



300



Fungsi 1



GAMBAR 9



–4 –6



–3



–2



–1



0



1



2



3



4



0



A. Peta Wilayah



Fungsi 1



–2



12 12 12 12 12 12 12 12 2



4



2222



2222223333



222222333333



12222223333333



1233333



1 2 3



1 2 3



Kelompok



Lebih dari 5 tahun



sampai 5 tahun



Kurang dari 1 tahun 1



Label



Simbol yang digunakan dalam peta wilayah



Simbol



Peta Wilayah dan Plot Kasus Individu pada Fungsi Diskriminan



–4



1133



133



113



133



113



133



113



Fungsi 2



–4 –6



–3



–2



–1



0



1



2



3



4



Fungsi 1



–2



0



2



B. Nilai Pengamatan pada Fungsi Diskriminan Kanonik



–4



kurang dari 1 tahun



1 sampai 5 tahun



Lebih dari 5 tahun



4



kurang dari 1 tahun



1 sampai 5 tahun



Lebih dari 5 tahun



Centroid grup



x1 - Tipe pelanggan



Analisis Diskriminan Ganda



Tahap 5: Interpretasi Hasil Analisis Diskriminan Tiga Kelompok Tahap selanjutnya dari analisis diskriminan melibatkan serangkaian langkah dalam interpretasi fungsi diskriminan.



• Hitung pembebanan untuk setiap fungsi dan tinjau rotasi fungsi untuk menyederhanakan interpretasi.



• Periksa kontribusi variabel prediktor: (a) untuk setiap fungsi secara terpisah (yaitu, beban diskriminan), (b) kumulatif di beberapa fungsi diskriminan dengan indeks potensi, dan (c) grafis dalam solusi dua dimensi untuk memahami posisi relatif masingmasing kelompok dan interpretasi variabel yang relevan dalam menentukan posisi ini.



BEBAN DISKRIMINAN DAN ROTASINYA Setelah



fungsi diskriminan dihitung, mereka dikorelasikan dengan semua variabel independen, bahkan yang tidak digunakan dalam fungsi diskriminan, untuk mengembangkan matriks struktur (pembebanan). Prosedur ini memungkinkan kita untuk melihat di mana diskriminasi akan terjadi jika semua variabel independen dimasukkan dalam model (yaitu, jika tidak ada yang dikeluarkan oleh multikolinearitas atau kurangnya signifikansi statistik). Pemuatan Diskriminan. Pembebanan yang tidak dirotasi mewakili asosiasi setiap variabel independen dengan setiap fungsi, bahkan jika tidak termasuk dalam fungsi diskriminan. Pembebanan diskriminan, mirip dengan pembebanan faktor, adalah korelasi antara masing-masing variabel independen dan skor diskriminan.



Tabel 19 berisi matriks struktur pembebanan diskriminan yang tidak diputar untuk kedua fungsi diskriminan. Memilih variabel dengan beban 0,40 atau lebih sebagai deskriptif fungsi, kita melihat bahwa fungsi 1 memiliki lima variabel melebihi 0,40 (x9, x18, x16, x11, dan x6), dan empat variabel deskriptif fungsi 2 (x6, x18, x17, dan x9). Meskipun kita dapat menggunakan variabel-variabel ini untuk menggambarkan setiap fungsi, kita dihadapkan pada masalah bahwa tiga variabel (x9, x6, dan x18) memiliki pemuatan ganda (variabel dipilih sebagai deskriptif dari kedua fungsi). Jika kita melanjutkan dengan pemuatan yang tidak diputar, setiap fungsi akan berbagi lebih banyak variabel dengan yang lain daripada yang unik. Kurangnya perbedaan pembebanan dengan masing-masing variabel deskriptif dari fungsi tunggal dapat diatasi dengan rotasi matriks struktur, seperti yang dilakukan dengan pembebanan faktor. Rotasi. Setelah beban fungsi diskriminan dihitung, mereka dapat diputar untuk mendistribusikan kembali varians (mirip dengan rotasi faktor). Pada dasarnya, rotasi mempertahankan struktur asli dan keandalan model diskriminan sambil membuatnya lebih mudah untuk diinterpretasikan secara substantif. Rotasi fungsi diskriminan, bagaimanapun, adalah pilihan di banyak program perangkat lunak. Dalam SPSS, misalnya, koefisien fungsi diskriminan yang diputar hanya dapat diperoleh melalui penggunaan sintaks perintah daripada menu "pull down". Contoh penggunaan sintaks perintah dalam SPSS dan sintaks khusus yang digunakan untuk analisis diskriminan tersedia di Web di www.pearsonhighered.com/hair atau www.mvstats.com. Dalam aplikasi ini kami memilih prosedur rotasi VARIMAX yang paling banyak digunakan. Rotasi mempengaruhi koefisien fungsi dan beban diskriminan, serta perhitungan diskriminanZ skor dan kelompok centroid (lihat Tabel 19). Memeriksa koefisien atau pembebanan yang diputar versus yang tidak diputar mengungkapkan serangkaian hasil yang agak lebih disederhanakan (yaitu, pembebanan cenderung terpisah menjadi nilai tinggi versus nilai rendah alih-alih menjadi kisaran menengah). Pemuatan yang diputar memungkinkan interpretasi yang jauh lebih berbeda dari setiap fungsi:



• Fungsi 1 sekarang dijelaskan oleh tiga variabel (x18, x9, dan x16) yang terdiri dari Layanan Pelanggan purnajual faktor selama analisis faktor,



301



Analisis Diskriminan Ganda plus x11 dan x17. Dengan demikian, layanan pelanggan, ditambah lini produk dan fleksibilitas harga, adalah deskripsi fungsi 1. • Fungsi 2 hanya menampilkan satu variabel, x6 (Kualitas Produk), yang memiliki pemuatan di atas 0,40 untuk fungsi kedua. Meskipunx17 memiliki nilai tepat di bawah ambang batas (-.356), variabel ini memiliki beban yang lebih tinggi pada fungsi pertama, yang menjadikannya sebagai deskriptor dari fungsi tersebut. Dengan demikian, fungsi kedua dapat dijelaskan oleh variabel tunggal Kualitas Produk.



Dengan dua atau lebih fungsi yang diperkirakan, rotasi dapat menjadi alat yang ampuh yang harus selalu dipertimbangkan untuk meningkatkan interpretasi hasil. Dalam contoh kita, masing-masing variabel yang dimasukkan ke dalam proses bertahap adalah deskriptif dari salah satu fungsi diskriminan. Apa yang harus kita lakukan sekarang adalah menilai dampak dari setiap variabel dalam hal analisis diskriminan secara keseluruhan (yaitu, di kedua fungsi).



MENILAI KONTRIBUSI VARIABEL PREDIKTOR Setelah menggambarkan diskriminan fungsi dalam hal variabel independen—baik yang digunakan dalam fungsi diskriminan maupun yang tidak termasuk dalam fungsi—kita mengalihkan perhatian kita untuk mendapatkan pemahaman yang lebih baik tentang dampak fungsi itu sendiri dan kemudian variabel individual. Dampak Fungsi Individu. Tugas pertama adalah untuk memeriksa fungsi diskriminan dalam hal bagaimana mereka membedakan antara kelompok. Kita mulai dengan memeriksa centroid grup pada dua fungsi seperti yang ditunjukkan pada Tabel 19. Pendekatan yang lebih mudah adalah dengan melihat peta teritorial (Gambar 9):



• Meneliti centroid grup dan distribusi kasus di setiap grup, kita melihat bahwa fungsi 1 terutama membedakan antara grup 1 versus grup 2 dan 3, sedangkan fungsi 2 membedakan antara grup 3 versus grup 1 dan 2. • Tumpang tindih dan kesalahan klasifikasi kasus kelompok 2 dan 3 dapat diatasi dengan memeriksa kekuatan fungsi diskriminan dan kelompok yang dibedakan oleh masing-masing. Melihat kembali ke Tabel 19, fungsi 1 sejauh ini merupakan diskriminator yang paling kuat, dan terutama memisahkan kelompok 1 dari kelompok lainnya. fungsi 2, yang memisahkan kelompok 3 dari yang lain, jauh lebih lemah dalam hal daya pembeda. Tidak mengherankan bahwa tumpang tindih dan kesalahan klasifikasi terbesar akan terjadi antara kelompok 2 dan 3, yang dibedakan terutama oleh fungsi 2.



Pendekatan grafis ini menggambarkan perbedaan dalam kelompok karena fungsi diskriminan tetapi tidak memberikan dasar untuk menjelaskan perbedaan ini dalam hal variabel independen. Untuk menilai kontribusi masing-masing variabel, peneliti memiliki sejumlah ukuran untuk digunakan—pembebanan diskriminan, univariat F rasio, dan indeks potensi. Teknik yang terlibat dalam penggunaan pembebanan diskriminan dan univariatF rasio dibahas dalam contoh dua kelompok. Kami akan memeriksa secara lebih rinci indeks potensi, sebuah metode untuk menilai kontribusi variabel di beberapa fungsi diskriminan. Indeks Potensi. Indeks potensi adalah teknik interpretasi tambahan yang cukup berguna dalam situasi dengan lebih dari satu fungsi diskriminan. Meskipun harus dihitung "dengan tangan", ini sangat berguna dalam menggambarkan kontribusi setiap variabel individu di semua fungsi diskriminan.



Indeks potensi mencerminkan beban masing-masing variabel dan daya pembeda relatif dari masing-masing fungsi. Pembebanan yang diputar mewakili korelasi antara variabel independen dan diskriminanZ skor. Dengan demikian, pembebanan kuadrat adalah varians dalam variabel independen yang terkait dengan fungsi diskriminan. Dengan menimbang varians yang dijelaskan dari masing-masing



302



Analisis Diskriminan Ganda



fungsi dengan kekuatan diskriminatif relatif dari fungsi dan menjumlahkan seluruh fungsi, indeks potensi mewakili efek diskriminatif total dari setiap variabel di semua fungsi diskriminan. Tabel 22 memberikan rincian penghitungan indeks potensi untuk masing-masing variabel bebas. Membandingkan variabel pada indeks potensi mereka mengungkapkan hal berikut:



• x18 (Kecepatan Pengiriman) adalah variabel independen yang memberikan diskriminasi terbesar antara tiga jenis kelompok pelanggan.



• Diikuti dampak oleh empat variabel yang tidak termasuk dalam fungsi diskriminan (x9, x16,



x11, dan x17).



• Variabel kedua dalam fungsi diskriminan (x6) hanya memiliki nilai potensi tertinggi keenam. Kenapa x6hanya memiliki nilai potensi tertinggi keenam meskipun itu adalah salah satu dari dua variabel yang termasuk dalam fungsi diskriminan? • Pertama, ingat bahwa multikolinearitas mempengaruhi solusi bertahap karena redundansi di antara variabel yang sangat multikolinear. x9 dan x16 adalah dua variabel yang sangat terkait dengan



x18 (membentuk faktor Customer Service), sehingga dampaknya dalam arti univariat, tercermin dalam indeks potensi, tidak diperlukan dalam fungsi diskriminan karena adanya x18. • Dua variabel lainnya, x11 dan x17, memang masuk melalui prosedur bertahap, tetapi dihapus sekali x6 ditambahkan, sekali lagi karena multikolinearitas. Dengan demikian, daya pembeda mereka yang lebih besar tercermin dalam nilai potensi mereka meskipun mereka juga tidak diperlukan dalam fungsi diskriminan sekali.x6 telah ditambahkan dengan x18 dalam fungsi diskriminan. • Akhirnya, x6, variabel kedua dalam fungsi diskriminan, memiliki nilai potensi yang rendah karena dikaitkan dengan fungsi diskriminan kedua, yang memiliki dampak diskriminan yang relatif kecil jika dibandingkan dengan fungsi pertama. Jadi, meskipunx6 adalah elemen yang diperlukan dalam membedakan antara tiga kelompok, dampak keseluruhannya kurang dari variabel-variabel yang terkait dengan fungsi pertama.



Ingat bahwa nilai potensi dapat dihitung untuk semua variabel bebas, bahkan jika tidak dalam fungsi diskriminan, karena mereka didasarkan pada beban diskriminan. Maksud dari indeks potensi adalah untuk menyediakan interpretasi hanya dalam kasus di mana multikolinearitas atau faktor lain mungkin telah mencegah variabel dari yang termasuk dalam fungsi diskriminan. Tinjauan Ukuran Empiris dari Dampak. Seperti yang terlihat dalam diskusi sebelumnya, kekuatan diskriminatif variabel dalam analisis diskriminan tercermin dalam banyak ukuran yang berbeda, masing-masing memberikan peran unik dalam interpretasi hasil diskriminan. Dengan menggabungkan semua ukuran ini dalam evaluasi variabel kami, kami dapat mencapai perspektif menyeluruh tentang bagaimana setiap variabel cocok dengan hasil diskriminan. Tabel 23 menyajikan tiga ukuran interpretasi yang lebih disukai (pembebanan yang diputar, univariat



F rasio, dan indeks potensi) untuk masing-masing variabel bebas. Hasil mendukung analisis bertahap, meskipun beberapa kasus menggambarkan dampak multikolinearitas pada prosedur dan hasil. • Dua variabel (x9 dan x18) memiliki dampak individu terbesar sebagaimana dibuktikan oleh univariatnya F nilai-nilai. Namun, karena keduanya juga sangat terkait (dibuktikan dengan penyertaannya pada faktor Layanan Pelanggan), hanya satu yang akan disertakan dalam solusi bertahap. Meskipunx9 memiliki univariat yang sedikit lebih tinggi F nilai, kemampuan x18 untuk memberikan diskriminasi yang lebih baik antara semua kelompok (sebagaimana dibuktikan dengan Mahalanobis . minimum yang lebih besar) D2 nilai yang dijelaskan sebelumnya) menjadikannya kandidat yang lebih baik untuk dimasukkan. Dengan demikian,x9, pada



303



304 - . 001 . 081 . 096 . 546 . 470 . 967



. 033 . 739 . 165 . 529 . 061



- . 257 . 061



Memuat



. 915 . 915 . 915 . 915 . 915 . 915 . 915 . 915 . 915 . 915 . 915



. 915



. 001 . 546 . 027 . 280 . 004 . 000 . 007 . 009 . 298 . 221 . 935



. 915



. 004



Relatif Nilai Eigen



. 066



Memuat



kuadrat



. 001 . 500 . 025 . 256 . 004 . 000 . 006 . 008 . 273 . 202 . 855



. 056



. 060



Potensi Nilai



- . 356 - . 257



- . 198 - . 080 . 044 . 080 . 143



- . 138 . 137



- . 207 . 008 . 039



. 967



Memuat



. 000 . 002 . 019 . 019 . 039 . 006 . 002 . 006 . 020 . 127 . 066



. 043



. 935



Memuat



kuadrat



. 085 . 085 . 085 . 085 . 085 . 085 . 085 . 085 . 085 . 085 . 085



. 085



. 085



Relatif Nilai Eigen



Fungsi Diskriminan 2



. 000 . 000 . 002 . 002 . 003 . 001 . 000 . 001 . 002 . 011 . 006



. 004



. 079



Potensi Nilai



diskriminan I dan II) dibagi dengan total nilai eigen (3.950 + .365 = 4.315).



Catatan: Nilai eigen relatif dari setiap fungsi diskriminan dihitung sebagai nilai eigen dari masing-masing fungsi (ditunjukkan pada Tabel 19 masing-masing sebagai 3.950 dan .365 untuk fungsi



x18 Kecepatan Pengiriman



x17 Fleksibilitas Harga



x16 Pesanan & Penagihan



x13 Harga Kompetitif x14 Klaim garansi x15 produk baru



x12 Gambar Tenaga Penjualan



x9 Penyelesaian Keluhan x10 Periklanan x11 Lini Produk



x6 Kualitas produk x7 Aktivitas E-Commerce x8 Dukungan teknis



Mandiri Variabel



Fungsi Diskriminan 1



TABEL 22 Perhitungan Indeks Potensi untuk Analisis Diskriminan Tiga Kelompok



. 001 . 500 . 027 . 258 . 007 . 001 . 006 . 009 . 275 . 213 . 861



. 060



. 139



Indeks



Potensi



Analisis Diskriminan Ganda TABEL 23 Ringkasan Tindakan Interpretasi untuk Analisis Diskriminan Tiga Kelompok



Diskriminan Berputar Pemuatan Fungsi



x6 Kualitas produk x7 Aktivitas E-Commerce x8 Dukungan teknis x9 Penyelesaian Keluhan x10 Periklanan x11 Lini Produk x12 Gambar Tenaga Penjualan



x13 Harga Kompetitif x14 Klaim garansi x15 produk baru x16 Pesanan & Penagihan



x17 Fleksibilitas Harga x18 Kecepatan Pengiriman



Fungsi 1



Fungsi 2



- . 257 . 061 . 033 . 739 . 165 . 529 . 061 - . 001 . 081 . 096 . 546 . 470 . 967



. 967 - . 207 . 008 . 039 - . 138 . 137 - . 198 - . 080 . 044 . 080 . 143 - . 356 - . 257



Univariat F Perbandingan



32.311 1.221 . 782



40.292 1.147 32.583 1.708 9.432 2.619



. 216



25.048 12.551 40.176



Indeks Potensi . 139 . 060 . 001 . 500 . 027 . 258 . 007 . 001 . 006 . 009 . 275 . 213 . 861



secara individual, memiliki kekuatan pembeda yang sebanding, tetapi x18 akan terlihat bekerja lebih baik dalam kombinasi dengan variabel lain. • Tiga variabel tambahan (x6, x11, dan x16) adalah dampak tertinggi berikutnya, tetapi hanya satu, x6, dipertahankan dalam fungsi diskriminan. Perhatikan bahwax16 sangat berkorelasi dengan x18 (keduanya merupakan bagian dari faktor Customer Service) dan tidak termasuk dalam fungsi diskriminan, sedangkan x11 memang memasuki fungsi diskriminan, tetapi merupakan salah satu variabel yang dihapus setelah x6 telah ditambahkan.



• Akhirnya, dua variabel (x17 dan x13) memiliki efek univariat yang hampir sama, tetapi hanya x17 memiliki hubungan substansial dengan salah satu fungsi diskriminan (pembebanan 0,470 pada fungsi pertama). Hasilnya adalah meskipunx17 dapat dianggap deskriptif fungsi pertama dan dianggap berdampak diskriminasi berdasarkan fungsi tersebut, x13 tidak memiliki dampak apapun, baik terkait dengan kedua fungsi tersebut atau sebagai tambahan setelah fungsi-fungsi tersebut diperhitungkan. • Semua variabel yang tersisa memiliki univariat yang rendah F nilai dan nilai potensi rendah, menunjukkan sedikit atau tidak ada dampak baik dalam arti univariat dan multivariat.



Catatan khusus adalah interpretasi dari dua dimensi diskriminasi. Interpretasi ini dapat dilakukan semata-mata melalui pemeriksaan pembebanan, tetapi dilengkapi dengan tampilan grafis dari pembebanan diskriminan, seperti yang dijelaskan pada bagian berikut. Tampilan Grafis dari Pemuatan Diskriminan. Untuk menggambarkan perbedaan dalam hal pravariabel dictor, pembebanan dan centroid grup dapat diplot dalam ruang diskriminan tereduksi. Seperti disebutkan sebelumnya, representasi yang paling valid adalah penggunaan vektor atribut yang diregangkan dan centroid grup.



Tabel 24 menunjukkan perhitungan untuk meregangkan beban diskriminan (digunakan untuk vektor atribut) dan kelompok centroid. Proses ploting selalu melibatkan semua variabel yang termasuk dalam model dengan prosedur bertahap (dalam contoh kita,x6 dan x18). Namun, kami juga akan memplot variabel yang tidak termasuk dalam fungsi diskriminan jika masing-masing univariatF rasionya signifikan, yang menambahkan x9, x11, dan x16 ke ruang diskriminan tereduksi. Prosedur ini



305



Analisis Diskriminan Ganda TABEL 24 Perhitungan Vektor Atribut Peregangan dan Centroid Grup di Reduced Ruang Diskriminan



Diskriminan Berputar Pemuatan Fungsi Variabel independen x6 Kualitas produk x7 Aktivitas E-CommerceA x8 Dukungan teknisA x9 Penyelesaian Keluhan x10 PeriklananA x11 Lini Produk



Fungsi 1



Fungsi 2



Ruang Berkurang



Koordinat



Univariat F Perbandingan



32.311 1.221



- . 257



. 967



. 061



- . 207



. 033



. 008



. 782



. 739



. 039



. 165



- . 138



40.292 1.147 32.583 1.708 9.432 2.619



Fungsi 1



Fungsi 2



– 8.303



31.244



29.776



1.571



17.236



4.464



. 529



. 137



. 061



- . 198



- . 001



- . 080



. 081



. 044



. 096



. 080



. 216



. 143 - . 356



25.048 12.551



13.676



3.581



x17 Fleksibilitas HargaA



. 546 . 470



x18 Kecepatan Pengiriman



. 967



- . 257



40.176



38.850



– 10.325



x12 Gambar Tenaga PenjualanA



x13 Harga KompetitifA x14 Klaim garansiA x15 produk baruA x16 Pesanan & Penagihan



AVariabel



dengan ransum univariat tidak signifikan tidak diplot dalam ruang tereduksi.



Centroid Grup Fungsi 1 Fungsi 2 Grup 1: Kurang dari 1 tahun



Grup 2: 1 ke 5 tahun



Grup 3: Lainnya



dari 5 tahun



Perkiraan F Nilai Fungsi 1 Fungsi 2



Ruang Berkurang



Koordinat



Fungsi 1 Fungsi 2



– 1.911



– 1.274



66.011



56.954



– 126.147



– 72.559



. 597



- . 968



66.011



56.954



39.408



– 55.131



1.371



1.625



66.011



56.954



90.501



92.550



menunjukkan pentingnya variabel collinear yang tidak termasuk dalam model bertahap akhir, mirip dengan indeks potensi. Plot vektor atribut yang diregangkan untuk pembebanan diskriminan yang diputar ditunjukkan pada Gambar 10, yang didasarkan pada koordinat ruang tereduksi untuk kelima variabel yang digunakan untuk menggambarkan fungsi diskriminan dan masing-masing grup (lihat Tabel 24). Vektor-vektor yang diplot menggunakan prosedur ini menunjuk ke kelompok-kelompok yang memiliki rata-rata tertinggi pada masing-masing variabel bebas dan menjauh dari kelompok-kelompok yang memiliki skor rata-rata terendah. Dengan demikian, interpretasi plot pada Gambar 10 menunjukkan sebagai berikut:



• Sebagaimana dicatat dalam peta teritorial dan analisis centroid grup, fungsi diskriminan pertama membedakan antara grup 1 versus grup 2 dan 3, sedangkan fungsi diskriminan kedua memisahkan grup 3 dari grup 1 dan 2. • Korespondensi dari x11, x16, x9, dan x18 dengan x sumbu mencerminkan hubungan mereka dengan fungsi diskriminan pertama, tetapi kita melihat bahwa hanya x6 dikaitkan dengan fungsi diskriminan kedua. Gambar tersebut secara grafis mengilustrasikan pembebanan yang diputar untuk setiap fungsi dan membedakan deskriptif variabel dari setiap fungsi.



306



Analisis Diskriminan Ganda 100



Grup 3



50 x6



x7 x16 x11x9 – 150



– 100



– 50



0



– 50



Grup 1



x18



50



100



Fungsi 1



150



Grup 2



– 100



Fungsi 2



GAMBAR 10 Plot Atribut Meregangkan (Variabel) dalam Diskriminan Tereduksi



Spasi



Tahap 6: Validasi Hasil Diskriminan Rasio hit untuk klasifikasi silang dan matriks ketidaksepakatan dapat digunakan untuk menilai validitas internal dan eksternal, masing-masing, dari analisis diskriminan. Jika rasio hit melebihi nilai ambang batas pada standar perbandingan, maka validitas ditetapkan. Seperti dijelaskan sebelumnya, nilai ambang batas adalah 41,7 persen untuk kriteria peluang proporsional dan 43,7 persen untuk kriteria peluang maksimum. Hasil klasifikasi yang ditunjukkan pada Tabel 20 memberikan dukungan validitas berikut: Validitas internal dinilai dengan pendekatan klasifikasi silang, dimana model diskriminan diestimasi dengan menghilangkan satu kasus dan kemudian memprediksi kasus tersebut dengan model yang diestimasi. Proses ini dilakukan secara bergiliran untuk setiap pengamatan, sehingga suatu pengamatan tidak pernah mempengaruhi model diskriminan yang memprediksi klasifikasi kelompoknya.



Seperti terlihat pada Tabel 20, rasio hit keseluruhan untuk pendekatan klasifikasi silang sebesar 86,7 secara substansial melebihi kedua standar, baik secara keseluruhan maupun untuk setiap kelompok. Namun, meskipun ketiga grup juga memiliki rasio hit individu di atas standar, rasio hit grup 2 (53,8) secara substansial lebih rendah daripada dua grup lainnya. Validitas eksternal ditangani melalui sampel ketidaksepakatan, yang merupakan sampel yang benarbenar terpisah yang menggunakan fungsi diskriminan yang diestimasi dengan sampel analisis untuk prediksi kelompok. Dalam contoh kami, sampel ketidaksepakatan memiliki rasio hit keseluruhan 55,0 persen, yang melebihi kedua nilai ambang batas, meskipun tidak sejauh yang ditemukan dalam pendekatan klasifikasi silang. Kelompok 2, bagaimanapun, tidak melebihi nilai ambang batas. Ketika kesalahan klasifikasi dianalisis, kita melihat bahwa lebih banyak kasus yang salah diklasifikasikan ke dalam grup 3 daripada yang diklasifikasikan dengan benar ke dalam grup 2, yang menunjukkan bahwa kasus yang salah diklasifikasikan ini diperiksa untuk kemungkinan pendefinisian ulang grup 2 dan 3 untuk membuat grup baru.



Peneliti juga didorong untuk memperluas proses validasi melalui pembuatan profil kelompok pada set variabel tambahan atau menerapkan fungsi diskriminan ke sampel lain yang mewakili keseluruhan populasi atau segmen dalam populasi. Selain itu, analisis kasus yang salah diklasifikasikan akan membantu menentukan apakah ada variabel tambahan yang diperlukan atau apakah klasifikasi kelompok dependen perlu direvisi.



307



Analisis Diskriminan Ganda



Tinjauan Manajerial Analisis diskriminan bertujuan untuk memahami perbedaan persepsi pelanggan berdasarkan lamanya menjadi pelanggan HBAT. Mudah-mudahan, memeriksa perbedaan persepsi HBAT berdasarkan masa kerja sebagai pelanggan akan mengidentifikasi persepsi yang penting untuk pengembangan hubungan pelanggan, yang dicirikan oleh pelanggan lama. Tiga kelompok pelanggan dibentuk-kurang dari 1 tahun, 1 sampai 5 tahun, dan lebih dari 5 tahun-dan persepsi HBAT diukur pada 13 variabel. Analisis tersebut menghasilkan beberapa temuan utama, baik dari segi jenis variabel yang membedakan antara kelompok dan pola perubahan dari waktu ke waktu: • Pertama, ada dua dimensi diskriminasi antara ketiga kelompok pelanggan. Dimensi pertama ditandai dengan persepsi yang lebih tinggi tentang layanan pelanggan (Resolusi Keluhan, Kecepatan Pengiriman, dan Pemesanan & Penagihan), bersama dengan Lini Produk dan Fleksibilitas Harga. Sebaliknya, dimensi kedua dicirikan semata-mata dalam hal Kualitas Produk. • Profil tiga kelompok pada dua dimensi dan variabel yang terkait dengan masing-masing dimensi memungkinkan manajemen untuk memahami perbedaan persepsi di antara mereka. • Kelompok 1, pelanggan kurang dari 1 tahun, umumnya memiliki persepsi HBAT paling rendah. Untuk ketiga variabel layanan pelanggan (Resolusi Keluhan, Pemesanan & Penagihan, dan Kecepatan Pengiriman) pelanggan ini lebih rendah daripada kelompok lainnya. Untuk Kualitas Produk, Lini Produk, dan Harga Kompetitif, kelompok ini sebanding dengan kelompok 2 (pelanggan 1 sampai 5 tahun), tetapi masih memiliki persepsi yang lebih rendah daripada pelanggan lebih dari 5 tahun. Hanya untuk Fleksibilitas Harga, kelompok ini sebanding dengan pelanggan tertua, dan keduanya memiliki nilai lebih rendah dari pelanggan 1 hingga 5 tahun. Secara keseluruhan, persepsi pelanggan terbaru ini mengikuti pola yang diharapkan, yaitu lebih rendah dari pelanggan lain, tetapi mudah-mudahan membaik karena mereka tetap menjadi pelanggan dari waktu ke waktu.



• Grup 2, pelanggan antara 1 dan 5 tahun, memiliki kesamaan dengan pelanggan terbaru dan terlama. Pada ketiga variabel layanan pelanggan, mereka sebanding dengan kelompok 3 (pelanggan lebih dari 5 tahun). Untuk Kualitas Produk, Lini Produk, dan Harga Kompetitif, persepsi mereka lebih sebanding dengan pelanggan baru (dan lebih rendah dari pelanggan lama). Mereka memegang persepsi tertinggi dari ketiga kelompok tentang Fleksibilitas Harga. • Grup 3, yang mewakili pelanggan 5 tahun atau lebih, memiliki persepsi yang paling baik tentang HBAT seperti yang diharapkan. Meskipun mereka sebanding dengan pelanggan kelompok 2 pada tiga variabel layanan pelanggan (dengan kedua kelompok lebih besar dari kelompok 1), mereka secara signifikan lebih tinggi daripada pelanggan di dua kelompok lainnya dalam hal Kualitas Produk, Lini Produk, dan Harga Kompetitif. Dengan demikian, kelompok ini mewakili pelanggan yang memiliki persepsi positif dan telah berkembang dalam membangun hubungan pelanggan melalui kekuatan persepsi mereka. • Menggunakan tiga kelompok pelanggan sebagai indikator dalam pengembangan hubungan pelanggan, kita dapat mengidentifikasi dua tahap di mana persepsi HBAT berubah dalam proses pengembangan ini:







Tahap 1. Persepsi pertama yang berubah adalah yang terkait dengan layanan pelanggan (terlihat pada perbedaan antara kelompok 1 dan 2). Tahap ini mencerminkan kemampuan HBAT untuk secara positif







mempengaruhi persepsi dengan operasi terkait layanan.



Tahap 2. Pengembangan jangka panjang diperlukan untuk mendorong perbaikan di lebih banyak elemen inti (Kualitas Produk, Lini Produk, dan Harga Kompetitif). Ketika perubahan ini terjadi, pelanggan diharapkan menjadi lebih berkomitmen pada hubungan tersebut, sebagaimana dibuktikan dengan masa kerja yang panjang dengan HBAT.



308



Analisis Diskriminan Ganda • Perlu dicatat bahwa ada bukti bahwa banyak pelanggan melakukan transisi melalui tahap 2 lebih cepat daripada 5 tahun seperti yang ditunjukkan oleh sejumlah besar pelanggan yang telah menjadi pelanggan antara 1 dan 5 tahun, namun memiliki persepsi yang sama dengan mereka yang lama pelanggan waktu. Dengan demikian, HBAT dapat mengharapkan bahwa pelanggan tertentu dapat bergerak melalui proses ini dengan cukup cepat, dan analisis lebih lanjut pada pelanggan ini dapat mengidentifikasi karakteristik yang memfasilitasi pengembangan hubungan pelanggan.



Dengan demikian, manajemen disajikan masukan manajerial untuk perencanaan strategis dan taktis dari tidak hanya hasil langsung dari analisis diskriminan, tetapi juga dari kesalahan klasifikasi.



Ringkasan Sifat, konsep, dan pendekatan yang mendasari analisis diskriminan ganda telah disajikan. Pedoman dasar untuk penerapan dan interpretasinya dimasukkan untuk memperjelas konsep metodologi lebih lanjut. Bab ini membantu Anda melakukan hal berikut:



Nyatakan keadaan di mana analisis diskriminan linier harus digunakan daripada regresi berganda.Dalam memilih teknik analisis yang tepat, terkadang kita menghadapi masalah yang melibatkan variabel dependen kategoris dan beberapa variabel independen metrik. Ingatlah bahwa variabel dependen tunggal dalam regresi diukur secara metrik. Analisis diskriminan berganda adalah salah satu teknik statistik yang tepat ketika masalah penelitian melibatkan satu variabel terikat kategoris dan beberapa variabel bebas metrik. Dalam banyak kasus, variabel terikat terdiri dari dua kelompok atau klasifikasi, misalnya, laki-laki versus perempuan, tinggi versus rendah, atau baik versus buruk. Dalam kasus lain, lebih dari dua kelompok yang terlibat, seperti klasifikasi rendah, sedang, dan tinggi. Analisis diskriminan mampu menangani dua kelompok atau beberapa (tiga atau lebih) kelompok.



Identifikasi masalah utama yang berkaitan dengan jenis variabel yang digunakan dan ukuran sampel yang diperlukan dalam penerapan analisis diskriminan. Untuk menerapkan analisis diskriminan, peneliti terlebih dahulu harus menentukan variabel mana yang menjadi ukuran independen dan variabel mana yang menjadi ukuran dependen. Peneliti harus fokus pada variabel dependen terlebih dahulu. Jumlah kelompok variabel terikat (kategori) dapat dua atau lebih, tetapi kelompok-kelompok ini harus saling eksklusif dan lengkap. Setelah keputusan dibuat pada variabel dependen, peneliti harus memutuskan



variabel bebas mana yang akan dimasukkan dalam analisis. Variabel bebas dipilih dengan dua cara: (1) dengan mengidentifikasi variabel baik dari penelitian sebelumnya atau dari model teoritis yang mendasari pertanyaan penelitian, dan (2) dengan memanfaatkan pengetahuan dan intuisi peneliti untuk memilih variabel yang tidak ada penelitian atau teori sebelumnya. tetapi itu secara logis mungkin terkait dengan memprediksi kelompok variabel dependen.



Analisis diskriminan, seperti teknik multivariat lainnya, dipengaruhi oleh ukuran sampel yang dianalisis. Direkomendasikan rasio 20 observasi untuk setiap variabel prediktor. Karena hasilnya menjadi tidak stabil karena ukuran sampel berkurang relatif terhadap jumlah variabel bebas, ukuran minimum yang direkomendasikan adalah lima pengamatan per variabel bebas. Ukuran sampel setiap kelompok juga harus dipertimbangkan. Minimal, ukuran kelompok terkecil dari suatu kategori harus melebihi jumlah variabel bebas. Sebagai pedoman praktis, setiap kategori harus memiliki setidaknya 20 pengamatan. Bahkan jika semua kategori melebihi 20 pengamatan, peneliti juga harus mempertimbangkan ukuran relatif dari kelompok.



Memahami asumsi yang mendasari analisis diskriminan dalam menilai kesesuaiannya untuk masalah tertentu. Asumsi untuk analisis diskriminan berhubungan dengan proses statistik yang terlibat dalam prosedur estimasi dan klasifikasi dan masalah yang mempengaruhi interpretasi hasil. Asumsi kunci untuk menurunkan fungsi diskriminan adalah normalitas multivariat dari variabel independen dan struktur dispersi dan kovarians (matriks) yang tidak diketahui (tetapi sama) untuk grup seperti yang didefinisikan oleh variabel dependen. Jika asumsi dilanggar, peneliti



309



Analisis Diskriminan Ganda harus memahami dampak pada hasil yang dapat diharapkan



jumlah individu yang diklasifikasikan dengan benar. Angka-



dan mempertimbangkan metode alternatif untuk analisis



angka dari diagonal mewakili klasifikasi yang salah. Persentase



(misalnya, regresi logistik).



yang diklasifikasikan dengan benar, juga disebutrasio pukulan,



Jelaskan dua pendekatan komputasi untuk analisis diskriminan dan metode untuk menilai kecocokan model secara keseluruhan. Dua pendekatan untuk analisis diskriminan adalah metode simultan (langsung) dan metode bertahap. Estimasi simultan melibatkan komputasi fungsi diskriminan dengan mempertimbangkan semua variabel independen pada waktu yang sama. Dengan demikian, fungsi diskriminan dihitung berdasarkan seluruh rangkaian variabel independen, terlepas dari daya pembeda masingmasing variabel independen. Estimasi bertahap merupakan alternatif dari pendekatan simultan. Ini melibatkan memasukkan variabel independen ke dalam fungsi diskriminan satu per satu berdasarkan daya pembedanya. Pendekatan bertahap mengikuti proses sekuensial menambah atau menghapus variabel ke fungsi diskriminan. Setelah fungsi diskriminan diestimasi, peneliti harus mengevaluasi signifikansi atau kecocokan fungsi diskriminan. Ketika pendekatan simultan digunakan, lambda Wilks, jejak Hotelling, dan kriteria Pillai semuanya mengevaluasi signifikansi statistik dari kekuatan diskriminatif dari fungsi diskriminan. Jika metode bertahap digunakan untuk memperkirakan fungsi diskriminan, MahalanobisD2 dan Rao V tindakan yang paling tepat untuk menilai kecocokan.



Jelaskan apa itu matriks klasifikasi dan bagaimana mengembangkannya, dan jelaskan cara mengevaluasi akurasi prediksi fungsi diskriminan.



Uji statistik untuk menilai signifikansi fungsi diskriminan hanya menilai tingkat perbedaan antara kelompok berdasarkan diskriminan Z



skor, tetapi tidak menunjukkan seberapa baik fungsi memprediksi. Untuk menentukan kemampuan prediksi fungsi diskriminan, peneliti harus membangun matriks klasifikasi. Prosedur matriks klasifikasi memberikan perspektif tentang signifikansi praktis daripada signifikansi statistik. Sebelum matriks klasifikasi dapat dibangun, bagaimanapun, peneliti harus menentukan skor pemotongan untuk setiap fungsi diskriminan. Skor pemotongan merupakan titik pemisah yang digunakan untuk mengklasifikasikan pengamatan ke dalam masingmasing kelompok berdasarkan skor fungsi diskriminan. Perhitungan skor pemotongan antara dua kelompok didasarkan pada dua centroid kelompok (rata-rata kelompok dari skor diskriminan) dan ukuran relatif dari dua kelompok. Hasil dari prosedur klasifikasi disajikan dalam bentuk matriks.



310



mengungkapkan seberapa baik fungsi diskriminan memprediksi objek. Jika biaya kesalahan klasifikasi kira-kira sama untuk semua kelompok, skor pemotongan optimal akan menjadi salah satu yang akan salah mengklasifikasikan jumlah objek paling sedikit di semua kelompok. Jika biaya kesalahan klasifikasi tidak sama, skor pemotongan optimum akan menjadi salah satu yang meminimalkan biaya kesalahan klasifikasi. Untuk mengevaluasi rasio hit, kita harus melihat klasifikasi peluang. Ketika ukuran kelompok sama, penentuan klasifikasi peluang didasarkan pada jumlah kelompok. Ketika ukuran kelompok tidak sama, penghitungan klasifikasi peluang dapat dilakukan dengan dua cara: peluang maksimum dan peluang proporsional.



Ceritakan bagaimana mengidentifikasi variabel independen dengan daya diskriminatif. Jika fungsi diskriminan signifikan secara statistik dan akurasi klasifikasi (hit ratio) dapat diterima, peneliti harus fokus membuat interpretasi substantif dari temuan. Proses ini melibatkan penentuan kepentingan relatif dari setiap variabel independen dalam membedakan antara kelompok. Tiga metode untuk menentukan kepentingan relatif telah diusulkan: (1) bobot diskriminan standar, (2) pembebanan diskriminan (korelasi struktur), dan (3) parsialF nilai-nilai. Pendekatan tradisional untuk menafsirkan fungsi diskriminan memeriksa tanda dan besarnya bobot diskriminan standar yang ditetapkan untuk setiap variabel dalam menghitung fungsi diskriminan. Variabel independen dengan bobot yang relatif lebih besar berkontribusi lebih banyak pada daya pembeda fungsi daripada variabel dengan bobot yang lebih kecil. Tanda menunjukkan apakah variabel memberikan kontribusi positif atau negatif. Pembebanan diskriminan semakin banyak digunakan sebagai dasar interpretasi karena kekurangan dalam memanfaatkan bobot. Mengukur korelasi linier sederhana antara masing-masing variabel independen dan fungsi diskriminan, beban diskriminan mencerminkan varians bahwa variabel independen berbagi dengan fungsi diskriminan. Mereka dapat diinterpretasikan seperti beban faktor dalam menilai kontribusi relatif dari setiap variabel independen terhadap fungsi diskriminan. Ketika metode estimasi bertahap digunakan, sarana tambahan untuk menafsirkan daya pembeda relatif dari variabel independen adalah melalui penggunaan parsialF nilai, yang dicapai dengan memeriksa ukuran absolut dari signifikan F nilainilai dan peringkat mereka. BesarF nilai menunjukkan kekuatan diskriminatif yang lebih besar.



Analisis Diskriminan Ganda Membenarkan penggunaan pendekatan sampel terpisah



tujuan validasi adalah untuk melihat seberapa baik fungsi



untuk validasi. Tahap akhir dari analisis diskriminan melibatkan



diskriminan bekerja pada sampel pengamatan yang tidak



validasi hasil diskriminan untuk memberikan jaminan bahwa



digunakan untuk menurunkan fungsi diskriminan. Penilaian ini



hasil tersebut memiliki validitas eksternal maupun internal.



melibatkan pengembangan fungsi diskriminan dengan sampel



Selain memvalidasi rasio hit, peneliti harus menggunakan profil



analisis dan kemudian menerapkannya pada sampel



kelompok untuk memastikan bahwa rata-rata kelompok adalah



ketidaksepakatan.



indikator yang valid dari model konseptual yang digunakan



Analisis diskriminan ganda membantu kita untuk memahami dan menjelaskan masalah penelitian yang melibatkan satu variabel dependen kategoris dan beberapa variabel independen metrik. Teknik ini dapat digunakan untuk memprofilkan karakteristik antarkelompok subjek dan menempatkan mereka ke dalam kelompok yang sesuai. Aplikasi potensial untuk masalah bisnis dan nonbisnis sangat banyak.



dalam memilih variabel independen. Validasi dapat terjadi baik dengan sampel terpisah (holdout sample) atau menggunakan prosedur yang berulang kali memproses sampel estimasi. Validasi rasio hit paling sering dilakukan dengan membuat sampel ketidaksepakatan, juga disebut sebagai sampel validasi. Tujuan menggunakan sampel ketidaksepakatan untuk



Pertanyaan 1. Bagaimana Anda membedakan antara analisis diskriminan berganda, analisis regresi, analisis regresi logistik, dan analisis varians? 2. Kriteria apa yang dapat Anda gunakan dalam memutuskan apakah akan menghentikan analisis diskriminan setelah memperkirakan fungsi diskriminan? Setelah tahap interpretasi? 3. Prosedur apa yang akan Anda ikuti dalam membagi sampel Anda ke dalam kelompok analisis dan ketidaksepakatan? Bagaimana Anda akan mengubah prosedur ini jika sampel Anda terdiri dari kurang dari 100 individu atau objek?



4. Bagaimana Anda menentukan skor pemotongan yang optimal?



5. Bagaimana Anda menentukan apakah akurasi klasifikasi fungsi diskriminan cukup tinggi dibandingkan dengan klasifikasi kebetulan? 6. Bagaimana analisis diskriminan dua kelompok berbeda dari analisis tiga kelompok? 7. Mengapa seorang peneliti harus meregangkan beban dan data centroid dalam merencanakan solusi analisis diskriminan?



8. Bagaimana analisis diskriminan menangani hubungan variabel dependen dan independen?



Bacaan yang Disarankan Daftar bacaan yang disarankan yang mengilustrasikan masalah dan aplikasi analisis diskriminan tersedia di Web di www.pearsonhighered.com/hair atau www.mvstats.com.



Referensi 1. Cohen, J. 1988. Analisis Kekuatan Statistik untuk Ilmu Perilaku, edisi ke-2 Hillsdale, NJ: Lawrence Erlbaum Associates. 2. Crask, M., dan W. Perreault. 1977. Validasi Analisis Diskriminan dalam Riset Pemasaran.Jurnal Riset Pemasaran 14 (Februari): 60–68. 3. Dillon, WR, dan M. Goldstein. 1984.Analisis Multivariat: Metode dan Aplikasi. New York: Wiley. 4. Frank, RE, WE Massey, dan DG Morrison. 1965. Bias dalam Analisis Diskriminan Berganda.Jurnal Riset Pemasaran 2(3): 250–58.



5. Gessner, Guy, NK Maholtra, WA Kamakura, and



SAYA Zmijewski. 1988. Model Pendugaan dengan Variabel Dependen Biner: Beberapa Teoritis dan Empiris



Pengamatan. Jurnal Riset Bisnis 16(1): 49–65. 6. Hijau, PE, D. Tull, dan G. Albaum. 1988.Penelitian untuk Keputusan Pemasaran. Upper Saddle River, NJ: Prentice Hall. 7. Hijau, PE 1978. Menganalisis Data Multivariat. Hinsdale, IL: Holt, Rinehart dan Winston.



8. Hijau, PE, dan JD Carroll. 1978.Alat Matematika untuk Analisis Multivariat Terapan. New York: Pers Akademik. 9. Haris, RJ 2001. Primer Statistik Multivariat, edisi ke-3 Hillsdale, NJ: Lawrence Erlbaum Associates. 10. Huberty, CJ 1984. Isu dalam Penggunaan dan Interpretasi Analisis Diskriminan. Buletin Psikologis 95: 156–71.



311



Analisis Diskriminan Ganda 11. Huberty, CJ, JW Wisenbaker, dan JC Smith. 1987. Menilai Akurasi Prediktif dalam Analisis Diskriminan. Penelitian Perilaku Multivariat 22 (Juli): 307–29. 12. Johnson, N., dan D. Wichern. 2002.Analisis Statistik Multivariat Terapan, edisi ke-5. Upper Saddle River, NJ: Prentice Hall.



312



13. Morrison, DG 1969. Tentang Interpretasi Analisis Diskriminan. Jurnal Riset Pemasaran 6(2): 156–63. 14. Perreault, WD, DN Behrman, dan GM Armstrong.



1979. Pendekatan Alternatif untuk Interpretasi Analisis Diskriminan Berganda dalam Riset Pemasaran.



Jurnal Riset Bisnis 7: 151–73.