Tugas MTV Bab 1 [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

Nama : Poetri Marissa Yulhar NIM : 20081032



Tugas Chapter 1 Overview of Multivariate Methods hal 41 1 . Dengan kata-kata Anda sendiri, tentukan analisis multivariat ? Jawab : Analisis multivariate adalah suatu studi tentang beberapa variabel random dependent secara simultan. Analisis ini merupakan pengembangan dari analisis univariat dam analisis bivariat. Analisis multivariate merupakan metode statistik yang melihat hubungan antara dua set variabel dalam waktu bersamaan. Dimana dua set variabel tersebut yaitu satu set variabel akibat ( dependent variabel) dan satu set penyebab (independent variabel). Adapun klasifikasi metode data analysis yaitu Dependence dan Interdependence.



2 Sebutkan faktor-faktor yang paling penting yang berkontribusi pada peningkatan penerapan teknik untuk analisis data multivariat dalam dekade terakhir ? Jawab : Dekade terakhir yang menjadi sering diperbincangkan, berkembang dan dengan sangat menarik berkaitan dengan analisis, baik dalam bidang



akademis atau di dunia



pengambilan keputusan organisasi. Meskipun ada banyak bidang yang dapat diidentifikasi sebagai topik "hangat" atau istilah yang menarik perhatian (misalnya, data scientist sebagai pekerjaan terseksi di abad 21), bahwa tiga topik pantas didiskusikan saat muncul mengubah secara drastis apa yang kami anggap sebagai analitik dalam waktu dekat. Topik-topik ini tidak hanya berfokus pada bidang akademis atau organisasi, karena dibidang lainnya juga bertemu. Sebaliknya mereka mewakili perubahan mendasar dalam masukan, proses / teknik, dan keluaran dari apa yang kami sebut analitik yaitu : rise of big data, statistical versus data mining models dan causal inference.



3. Apa implikasi munculnya Big Data bagi para peneliti ? Jawab : Tidak ada diskusi tentang analitik Big Data yang lengkap tanpa membahas masalah yang meningkat dengan masalah seperti privasi, keamanan, gangguan politik, strategi komersial invasif, dan stratifikasi sosial. Semua masalah ini meningkatkan kewaspadaan dalam penggunaan analitik Big Data, karena aplikasi dengan niat terbaik sekalipun mungkin memiliki konsekuensi yang tidak diinginkan. Dan masalahnya tidak terbatas pada hasil dari upaya ini, tetapi juga terletak pada asumsi implisit yang mungkin diterima begitu saja oleh



para analis. Harford mengidentifikasi empat "artikel kepercayaan" yang dapat menyebabkan masalah serius: menilai terlalu tinggi akurasi jika kita mengabaikan positif palsu; penggantian penyebab dengan korelasi; gagasan bahwa bias pengambilan sampel dihilangkan ketika masalah masih ada; dan membiarkan "data berbicara" dan mengabaikan adanya korelasi palsu. Banyak masalah lainnya memerlukan analis tidak hanya untuk mendefinisikan masalah dengan benar, memilih dan menerapkan teknik yang sesuai dan kemudian menafsirkan hasil dengan benar, tetapi juga untuk menyadari perhatian yang lebih implisit ini dalam setiap situasi penelitian.



4. Apa perbedaan antara model data dan model algoritmik? Bagaimana dampaknya terhadap jenis analisis yang dilakukan ? Jawab : Model data adalah model khusus peneliti yang kemudian diestimasi dengan menggunakan data yang tersedia untuk menilai kecocokan model dan akhirnya dapat diterima. Tantangan bagi peneliti adalah untuk (a) menentukan dengan benar bentuk model yang merepresentasikan proses yang sedang diperiksa, dan (b) melakukan analisis dengan benar untuk memberikan penjelasan dan prediksi yang diinginkan. Dengan demikian, peneliti harus membuat beberapa asumsi tentang sifat proses dan menentukan bentuk model yang paling mereplikasi operasinya. Model dasar inferensi statistik kami, seperti regresi berganda, MANOVA, atau analisis diskriminan / regresi logistik, adalah contoh pendekatan analisis ini. Model algoritmik, juga dikenal sebagai data mining dan bahkan istilah kontemporer pembelajaran mesin dan kecerdasan buatan, mengambil pendekatan berbeda untuk memahami proses dengan mengalihkan fokus dari penjelasan proses prediksi. Beberapa perbedaan antara kedua pendekatan model data dengan model algoritmik pada sejumlah karakteristik mendasar dari proses penelitian. Pendekatan statistik atau model data mendekati apa yang dianggap banyak orang sebagai metode ilmiah, mendalilkan model berdasarkan teori dan kemudian melaksanakan desain penelitian untuk menguji model itu secara ketat dan akhirnya teori yang mendasarinya. Data mining atau model algoritmik mendekati masalah secara berbeda, dan membawa sedikit spekulasi tentang bagaimana proses harus dijelaskan. Mereka malah fokus pada algoritme terbaik yang dapat mereplikasi proses dan mencapai akurasi prediksi. Selain itu, ada sedikit pengujian teori dan dengan demikian sedikit penjelasan tentang bagaimana proses yang diminati benar-benar beroperasi, hanya saja dapat ditiru oleh algoritme yang diwakili oleh akurasi prediktifnya.



Perbandingan antara Model Statistik/Data dan Model Data Mining/Algorithmic Ciri



Mode Statistik/Data



Data



Mining



/



Model



Algoritma Objek penelitian



Penjelasan terutama



Ramalan



Paradigma penelitian



Berbasis teori (deduktif)



Berbasis



Sifat masalah



Tersusun



Tidak Terstruktur



Sifat Pengembangan model Konfirmasi



Penyelidikan



jenis data Yang dianailis



Didefinisikan dengan baik, Tidak terdefinisi, umumnya dikumpulkan untuk tujuan analisis menggunakan data penelitian



Ruang lingkup analisis



yang tersedia



Dataset kecil hingga besar Dataset yang sangat besar (jumlah variabel dan/ atau (jumlah variabel dan/ atau observasi)



pengamatan)



5 Apa yang dimaksud dengan inferensi kausal? Bagaimana melengkapi eksperimen terkontrol acak? Jawab : Inferensial kausal adalah pergerakan di luar inferensial statistik ke pernyataan yang lebih kuat tentang "sebab dan akibat" dalam situasi non-eksperimental. Sementara pernyataan kausal terutama dipahami sebagai domain eksperimen terkontrol secara acak, perkembangan terbaru telah memberikan peneliti dengan (a) kerangka teoritis untuk memahami persyaratan untuk kesimpulan kausal dalam pengaturan non-eksperimental, dan (b) beberapa teknik yang berlaku untuk data tidak berkumpul dalam pengaturan eksperimental yang masih memungkinkan beberapa kesimpulan kausal ditarik.



6 Apa dua aspek pengelolaan variat? Peran apa yang dimainkan masing-masing dalam analisis multivariat yang khas? Jawab : Keputusan peneliti dalam mengelola variate terbagi dalam dua area utama: menentukan variabel independen yang akan dimasukkan dalam analisis dan kemudian pemilihan variabel selama estimasi model. Menentukan variabel-variabel keputusan utama di sini adalah apakah akan menggunakan variabel individu atau melakukan beberapa bentuk reduksi dimensi, seperti analisis faktor eksplorasi. Menggunakan variabel asli mungkin tampak seperti pilihan yang jelas karena



mempertahankan karakteristik variabel dan dapat membuat hasil lebih dapat ditafsirkan dan dipercaya. Namun ada juga kendala dalam pendekatan ini. Pertama dan terpenting adalah efek memasukkan ratusan dan bahkan ribuan variabel dan kemudian mencoba menafsirkan dampak dari setiap variabel, dengan demikian mengidentifikasi variabel yang paling berdampak dari kumpulan besar. Selain itu, dengan meningkatnya jumlah variabel, begitu pula peluang untuk multikolinearitas yang membuat perbedaan dampak variabel individu menjadi lebih sulit. Pemilihan variabel keputusan kedua yang harus diambil mengenai variate adalah jika peneliti ingin mengontrol variabel tertentu untuk dimasukkan dalam analisis maka membiarkan perangkat lunak menentukan kumpulan variabel "terbaik" untuk membentuk variate. Seperti keputusan sebelumnya, ini pada dasarnya berkisar pada tingkat kendali peneliti. Dengan simultan (semua variabel dimasukkan secara bersamaan) atau konfirmatori (hanya satu set variabel atau sekuensial yang diuji), peneliti dapat mengontrol variabel yang tepat dalam model. Pendekatan kombinatorial adalah varian dari pendekatan konfirmatori dimana semua kemungkinan kombinasi dari himpunan variabel independen diestimasi dan kemudian dibandingkan pada berbagai kriteria kecocokan model. Dengan kontrol perangkat lunak, perangkat lunak menggunakan algoritma untuk memutuskan variabel mana yang akan disimpulkan. Metode yang paling banyak digunakan adalah pendekatan sekuensial, di mana variabel dimasukkan (biasanya yang paling berdampak pertama) hingga tidak ada variabel yang berdampak lain yang dapat ditemukan. Pendekatan terbatas mengidentifikasi variabel yang paling berdampak dan membatasi semua variabel yang lebih kecil ke parameter yang diperkirakan lebih kecil atau bahkan nol.



7. Jenis pertanyaan penelitian apa yang dapat ditangani oleh model linear umum (GLZ) lebih langsung daripada model linier umum (GLM) yang lebih tradisional? Jawab : Landasan untuk hampir semua teknik persamaan tunggal yang dibahas dalam buku ini adalah model linier umum (GLM), yang dapat memperkirakan korelasi kanonik, regresi berganda, ANOVA, dan analisis diskriminan, serta semua perbandingan kelompok univariat - uji t dan semacamnya. Mungkin tidak ada satu bentuk model yang lebih mendasar untuk statistik inferensial daripada model linier umum. Tetapi satu karakteristik pembatas dari GLM adalah asumsinya tentang distribusi kesalahan setelah istribusi normal. Dengan demikian, banyak kali kita harus mengubah variabel dependen ketika diketahui tidak mengikuti distribusi normal (misalnya, cacah, variabel biner, proporsi atau probabilitas).



Model linier umum (GLZ atau GLIM), model ini memberi peneliti alternatif dari model linier umum yang didasarkan pada variabel dependen yang menunjukkan distribusi normal. Sementara GLM memerlukan transformasi variabel dependen non-normal seperti yang dibahas di atas, GLZ dapat memodelkannya secara langsung tanpa transformasi. Model GLZ menggunakan estimasi kemungkinan maksimum dan dengan demikian memiliki serangkaian ukuran kecocokan model yang berbeda, termasuk pengujian dan deviasi rasio Wald dan Likelihood. GLZ terkadang disebut sebagai GLM yang menyebabkan kebingungan dengan model linier umum. Kami membuat perbedaan untuk tujuan klarifikasi. Sementara model linier umum telah menjadi pokok statistik inferensial, model linier umum memperluas model linier ke variabel hasil yang lebih luas. Di luar ukuran kecocokan model yang berbeda, kedua jenis model diestimasi dan dievaluasi dengan cara yang sama. Peneliti yang menghadapi situasi di mana variabel dependen memiliki distribusi tidak normal didorong untuk mempertimbangkan penggunaan model GLZ sebagai alternatif untuk mengubah ukuran dependen untuk mencapai normalitas.



8. Mengapa validasi sangat penting? Jawab : Tujuan validasi adalah untuk menghindari hasil yang menyesatkan yang dapat diperoleh overfitting - estimasi parameter model yang merepresentasikan karakteristik sampel secara berlebihan dengan mengorbankan kemampuan generalisasi untuk populasi secara luas.



9. Bagaimana cara kerja validasi silang? Apa saja jenis yang lebih populer? Validasi silang meskipun mungkin tampak sederhana untuk hanya membagi sampel menjadi dua sub-sampel, seringkali ukuran sampel yang terbatas atau pertimbangan lain membuat hal ini tidak mungkin dilakukan. Untuk situasi ini, pendekatan validasi silang telah dikembangkan. Prinsip dasar validasi silang adalah bahwa sampel asli dibagi menjadi sejumlah sub-sampel yang lebih kecil dan kesesuaian validasinya adalah kecocokan "ratarata" di semua sub-sampel. Tiga dari pendekatan validasi silang yang lebih populer adalah kfold, repeated random/resampling or leave-one-out/jackknife.



10 Daftar dan jelaskan teknik analisis data multivariat yang dijelaskan dalam bab ini. Berikan contoh setiap teknik yang sesuai ? Jawab : Analisis multivariat adalah serangkaian teknik yang terus berkembang untuk analisis data yang mencakup berbagai situasi penelitian yang mungkin dibuktikan dengan skema klasifikasi yang baru saja dibahas. Beberapa teknik analisis multivariate sebagai berikut:



Interdependence Techniques ● Exploratory Factor Analysis: Principal components and common factor analysis Analisis faktor eksplorasi, termasuk analisis komponen utama dan analisis faktor umum, adalah pendekatan statistik yang dapat digunakan untuk menganalisis keterkaitan antara sejumlah besar variabel dan untuk menjelaskan variabel ini dalam hal dimensi dasar umum mereka (faktor). Seorang peneliti dapat menggunakan analisis faktor, misalnya, untuk lebih memahami hubungan antara peringkat pelanggan dari restoran cepat saji. Dengan cara meminta pelanggan untuk menilai restoran pada enam variabel berikut: rasa makanan, suhu makanan, kesegaran, waktu tunggu, kebersihan, dan keramahan karyawan. Analis ingin menggabungkan enam variabel ini ke dalam jumlah yang lebih kecil. Dengan menganalisis respons pelanggan, analis mungkin menemukan bahwa variabel rasa makanan, suhu, dan kesegaran digabungkan bersama untuk membentuk satu faktor kualitas makanan, sedangkan variabel waktu tunggu, kebersihan, dan keramahan karyawan bergabung untuk membentuk faktor tunggal lainnya, kualitas layanan. ● Cluster analysis Analisis klaster adalah teknik analitis untuk mengembangkan subkelompok individu atau objek yang bermakna. Secara khusus, tujuannya adalah untuk mengklasifikasikan sampel entitas (individu atau objek) ke dalam sejumlah kecil kelompok yang saling eksklusif berdasarkan kesamaan di antara entitas. Dalam analisis kluster, tidak seperti analisis diskriminan, kelompok tidak didefinisikan sebelumnya. Sebaliknya, teknik ini digunakan untuk mengidentifikasi kelompok. Sebagai contoh analisis klaster, mari kita asumsikan pemilik restoran ingin tahu apakah pelanggan menggurui restoran karena alasan yang berbeda. Data dapat dikumpulkan pada persepsi harga, kualitas makanan, dan sebagainya. Analisis klaster dapat digunakan untuk menentukan apakah beberapa subkelompok (klaster) sangat termotivasi oleh harga rendah versus mereka yang jauh lebih tidak termotivasi untuk datang ke restoran berdasarkan pertimbangan harga. Dependence Techniques ● Multiple regression and multiple correlation Multiple regression adalah metode analisis yang sesuai ketika masalah penelitian melibatkan variabel tergantung metrik tunggal yang dianggap terkait dengan dua atau lebih variabel independen metrik. Tujuan dari beberapa analisis regresi adalah untuk memprediksi perubahan variabel dependen dalam menanggapi perubahan variabel independen. Tujuan ini paling sering dicapai melalui aturan statistik kuadrat paling sedikit



Setiap kali peneliti tertarik untuk memprediksi jumlah atau ukuran variabel dependen, beberapa regresi berguna. Misalnya, pengeluaran bulanan untuk makan di luar (variabel dependen) mungkin diprediksi dari informasi mengenai pendapatan keluarga, ukurannya, dan usia kepala rumah tangga (variabel independen). ● Multivariate analysis of variance and covariance Analisis multivariat varians (MANOVA) adalah teknik statistik yang dapat digunakan untuk secara bersamaan mengeksplorasi hubungan antara beberapa variabel independen kategoris (biasanya disebut sebagai perawatan) dan dua atau lebih variabel dependen metrik. Dengan demikian, ini mewakili perpanjangan analisis varians univariat (ANOVA). Analisis multivariat kovarians (MANCOVA) dapat digunakan bersama dengan MANOVA untuk menghapus (setelah percobaan) efek dari variabel independen metrik yang tidak terkontrol (dikenal sebagai covariates) pada variabel dependen. Asumsikan perusahaan ingin tahu apakah iklan yang lucu akan lebih efektif dengan pelanggannya daripada iklan yang tidak lucu. Ini dapat meminta agen iklannya untuk mengembangkan dua iklan — satu lucu dan satu non-humoris — dan kemudian menampilkan sekelompok pelanggan dua iklan. Setelah melihat iklan, pelanggan akan diminta untuk menilai perusahaan dan produknya pada beberapa dimensi, seperti modern versus tradisional atau berkualitas tinggi versus kualitas rendah. MANOVA akan menjadi teknik untuk digunakan untuk menentukan sejauh mana perbedaan statistik antara persepsi pelanggan yang melihat iklan lucu versus mereka yang melihat yang tidak lucu. ● Multiple discriminant analysis Multiple Discriminant Analysis (MDA) adalah teknik multivariat yang sesuai jika variabel dependen tunggal dikotomi (misalnya, laki-laki-perempuan) atau multikotomi (misalnya, tinggi-sedang-rendah) dan karenanya nonmetrik. Analisis diskriminan berlaku dalam situasi di mana total sampel dapat dibagi menjadi beberapa kelompok berdasarkan variabel dependen nonmetrik yang mencirikan beberapa kelas yang diketahui. Tujuan utama dari beberapa analisis diskriminan adalah untuk memahami perbedaan grup dan untuk memprediksi kemungkinan bahwa entitas (individu atau objek) akan termasuk dalam kelas atau grup tertentu berdasarkan beberapa variabel independen metrik. ● Logistic regression Logistic Regression, yang sering disebut sebagai analisis logit, adalah kombinasi dari beberapa regresi dan beberapa analisis diskriminan. Teknik ini mirip dengan beberapa analisis regresi dalam satu atau lebih variabel independen yang digunakan untuk memprediksi variabel dependen tunggal. Yang membedakan model regresi logistik dari



beberapa regresi adalah bahwa variabel dependennya nonmetrik, seperti dalam analisis diskriminan. Skala nonmetrik dari variabel dependen membutuhkan perbedaan dalam metode estimasi dan asumsi tentang jenis distribusi yang mendasarinya, namun di sebagian besar aspek lain sangat mirip dengan beberapa regresi. Asumsikan penasihat keuangan mencoba mengembangkan sarana untuk memilih perusahaan yang muncul untuk investasi start-up. Untuk membantu dalam tugas ini, mereka meninjau catatan masa lalu dan menempatkan perusahaan ke dalam salah satu dari dua kelas: berhasil selama periode lima tahun, dan tidak berhasil setelah lima tahun. Untuk setiap perusahaan, mereka juga memiliki banyak data keuangan dan manajerial. Mereka kemudian dapat menggunakan model regresi logistik untuk mengidentifikasi data keuangan dan manajerial yang paling baik diferensiasi antara perusahaan yang sukses dan tidak berhasil untuk memilih kandidat terbaik untuk investasi di masa depan. ● Structural equation modeling and confirmatory factor analysis Structural equation modeling and confirmatory factor analysis (SEM) adalah teknik yang memungkinkan hubungan terpisah untuk masing-masing set variabel dependen. Metode SEM ini didasarkan pada analisis hanya varians umum dan dimulai dengan menghitung matriks kovarians, dan sering disebut sebagai SEM berbasis kovarians. ● Partial least squares structural equation modeling and confirmatory composite analysis Partial least squares structural equation modeling and confirmatory composite analysis adalah pemodelan persamaan struktural parsial kotak (PLS-SEM), sering disebut sebagai SEM berbasis varians. Metode SEM ini didasarkan pada analisis varians total dan juga mencakup model pengukuran dan model struktural. Teori dan pengetahuan sebelumnya atau pedoman lain memungkinkan peneliti untuk membedakan variabel independen mana yang memprediksi setiap variabel dependen. Langkah awal dalam menerapkan metode ini memeriksa model pengukuran dan disebut sebagai analisis komposit konfirmasi. ● Canonical correlation analysis Canonical correlation analysis dapat dilihat sebagai ekstensi logis dari beberapa analisis regresi. Ingat bahwa beberapa analisis regresi melibatkan variabel dependen metrik tunggal dan beberapa variabel independen metrik. , tujuannya adalah untuk menghubungkan secara bersamaan beberapa variabel dependen metrik dan beberapa variabel independen metrik. Sedangkan beberapa regresi melibatkan variabel dependen tunggal, korelasi kanonis melibatkan beberapa variabel dependen. Prinsip yang mendasarinya adalah mengembangkan kombinasi linier dari setiap set variabel (baik independen maupun tergantung) dengan cara yang memaksimalkan korelasi antara kedua set. Dinyatakan dengan cara yang berbeda,



prosedur ini melibatkan mendapatkan satu set bobot untuk variabel dependen dan independen yang memberikan korelasi sederhana maksimum antara set variabel dependen dan serangkaian variabel independen. Asumsikan perusahaan melakukan studi yang mengumpulkan informasi tentang kualitas layanannya berdasarkan jawaban atas 50 pertanyaan yang diukur secara metris. Studi ini menggunakan pertanyaan dari penelitian kualitas layanan yang dipublikasikan dan mencakup informasi benchmarking tentang persepsi kualitas layanan "perusahaan kelas dunia" serta perusahaan tempat penelitian dilakukan. Korelasi kanonis dapat digunakan untuk membandingkan persepsi perusahaan kelas dunia pada 50 pertanyaan dengan persepsi perusahaan. Penelitian kemudian dapat menyimpulkan apakah persepsi perusahaan berkorelasi dengan perusahaan kelas dunia. Teknik ini akan memberikan informasi tentang korelasi keseluruhan persepsi serta korelasi antara masing-masing dari 50 pertanyaan ● Conjoint analysis Conjoint analysis adalah teknik ketergantungan yang membawa kecanggihan baru untuk evaluasi objek, seperti produk, layanan, atau ide baru. Aplikasi yang paling langsung adalah dalam pengembangan produk atau layanan baru, memungkinkan evaluasi produk yang kompleks sambil mempertahankan konteks keputusan yang realistis bagi responden. Peneliti pasar mampu menilai pentingnya atribut serta tingkat masing-masing atribut sementara konsumen hanya mengevaluasi beberapa profil produk, yang merupakan kombinasi dari tingkat produk. Asumsikan konsep produk memiliki tiga atribut (harga, kualitas, dan warna), masing-masing pada tiga tingkat yang mungkin (misalnya, merah, kuning, dan biru sebagai tiga tingkat warna). Alih-alih harus mengevaluasi semua 27 13 3 3 3 32 kemungkinan kombinasi, subset (9 atau lebih) dapat dievaluasi untuk daya tarik mereka kepada konsumen, dan peneliti tidak hanya tahu betapa pentingnya setiap atribut tetapi juga pentingnya setiap level (misalnya, daya tarik merah versus kuning versus biru). Selain itu, ketika evaluasi konsumen selesai, hasil analisis conjoint juga dapat digunakan dalam simulator desain produk, yang menunjukkan penerimaan pelanggan untuk sejumlah formulasi produk dan bantuan dalam desain produk yang optimal. ● Perceptual mapping, also known as multidimensional scaling Perceptual mapping, tujuannya adalah untuk mengubah penilaian konsumen terhadap kesamaan atau preferensi (misalnya, preferensi untuk toko atau merek) ke dalam jarak yang diwakili dalam ruang multidimensi. Jika objek A dan B dinilai oleh responden sebagai yang paling mirip dibandingkan dengan semua pasangan objek lain yang mungkin, teknik



pemetaan persepsi akan memposisikan objek A dan B sedemikian rupa sehingga jarak di antara mereka dalam ruang multidimensi lebih kecil dari jarak antara pasangan objek lainnya. Peta persepsi yang dihasilkan menunjukkan posisi relatif semua objek, tetapi analisis tambahan diperlukan untuk menggambarkan atau menilai atribut mana yang memprediksi posisi setiap objek. Sebagai contoh pemetaan persepsi, mari kita asumsikan pemilik waralaba Burger King ingin tahu apakah pesaing terkuat adalah McDonald's atau Wendy's. Sampel pelanggan diberikan survei dan diminta untuk menilai pasangan restoran dari yang paling mirip dengan yang paling tidak mirip. Hasil penelitian menunjukkan bahwa Burger King paling mirip dengan Wendy, sehingga pemiliknya tahu bahwa pesaing terkuat adalah restoran Wendy karena dianggap paling mirip. Analisis tindak lanjut dapat mengidentifikasi atribut apa yang memengaruhi persepsi kesamaan atau ketidaksederhanaan. ● Correspondence analysis Correspondence analysis adalah teknik interdependensi yang baru dikembangkan yang memfasilitasi pemetaan persepsi objek (misalnya, produk, orang) pada satu set atribut nonmetrik. Para peneliti terus-menerus dihadapkan dengan kebutuhan untuk "mengukur data kualitatif" yang ditemukan dalam variabel nominal. Analisis korespondensi berbeda dari teknik



interdependensi



yang



dibahas



sebelumnya



dalam



kemampuannya



untuk



mengakomodasi data nonmetrik dan hubungan nonlinear. Dalam bentuk yang paling mendasar, analisis korespondensi menggunakan tabel kontinjensi, yang merupakan tabulasi silang dari dua variabel kategoris. Kemudian mengubah data nonmetrik ke tingkat metrik dan melakukan pengurangan dimensi (mirip dengan analisis faktor eksplorasi) dan pemetaan persepsi. 11 Jelaskan mengapa dan bagaimana berbagai metode multivariat dapat dilihat sebagai keluarga teknik ? Jawab : Hubungan dekat ada di antara berbagai prosedur ketergantungan, yang dapat dilihat sebagai keluarga teknik. Seperti yang dapat kita lihat, korelasi kanonis dapat dianggap sebagai model umum di mana banyak teknik multivariat lainnya didasarkan, karena menempatkan pembatasan paling sedikit pada jenis dan jumlah variabel dalam variat dependen dan independen. Karena pembatasan ditempatkan pada variat, kesimpulan yang lebih tepat dapat dicapai berdasarkan skala spesifik pengukuran data yang digunakan. Dengan demikian, teknik multivariat berkisar dari metode umum analisis kanonis hingga teknik khusus pemodelan persamaan struktural.



12 Mengapa pengetahuan pengukuran berskala penting untuk pemahaman analisis data multivariat? Jawab: Pembahasan kekuatan statistik menunjukkan dampak substansial ukuran sampel bermain dalam mencapai signifikansi statistik, baik dalam ukuran sampel kecil maupun besar. Untuk sampel yang lebih kecil, kecanggihan dan kompleksitas teknik multivariat dapat dengan mudah menghasilkan (1) terlalu sedikit kekuatan statistik untuk pengujian untuk secara realistis mengidentifikasi hasil yang signifikan atau (2) terlalu mudah "overfitting" data sehingga hasilnya baik secara artifisial karena sesuai dengan sampel namun tidak memberikan generalisasi. Dampak serupa juga terjadi untuk ukuran sampel besar, yang seperti yang dibahas sebelumnya, dapat membuat tes statistik terlalu sensitif. Setiap kali ukuran sampel melebihi 400 responden, peneliti harus memeriksa semua hasil yang signifikan untuk memastikan mereka memiliki signifikansi praktis karena peningkatan daya statistik dari ukuran sampel.



13 Apa perbedaan antara signifikansi statistik dan praktis? Apakah satu prasyarat untuk yang lain? Jawab : Seorang peneliti justru harus melihat tidak hanya pada signifikansi statistik hasil tetapi juga pada signifikansi praktis mereka. Signifikansi praktis mengajukan pertanyaan, "Jadi apa?" Untuk aplikasi manajerial apa pun, hasilnya harus menawarkan efek yang dapat didemonstrasikan yang membenarkan tindakan. Dalam pengaturan akademik, penelitian menjadi lebih fokus tidak hanya pada hasil yang signifikan secara statistik tetapi juga pada implikasi substantif dan teoritis mereka, yang berkali-kali diambil dari signifikansi praktis mereka. Misalnya, analisis regresi dilakukan untuk memprediksi niat pembelian kembali, diukur sebagai probabilitas antara 0 dan 100 bahwa pelanggan akan berbelanja lagi dengan perusahaan. Studi ini dilakukan dan hasilnya kembali signifikan pada tingkat signifikansi .05. Eksekutif bergegas untuk merangkul hasil dan memodifikasi strategi yang tegas sesuai. Apa yang luput dari perhatian, bagaimanapun, adalah bahwa meskipun hubungan itu signifikan, kemampuan prediktifnya buruk - sangat buruk sehingga perkiraan probabilitas pembelian kembali dapat bervariasi sebanyak 620 persen pada tingkat signifikansi .05. Hubungan "signifikan secara statistik" dengan demikian dapat memiliki rentang kesalahan 40 poin persentase! Seorang pelanggan yang diprediksi memiliki peluang pengembalian 50 persen benar-benar dapat memiliki probabilitas dari 30 persen hingga 70 persen, mewakili tingkat yang tidak dapat diterima untuk mengambil tindakan. Jika para peneliti dan manajer



menyelidiki signifikansi praktis atau manajerial dari hasilnya, mereka akan menyimpulkan bahwa hubungan itu masih membutuhkan penyempurnaan sebelum dapat diandalkan untuk memandu strategi dalam arti substantif apa pun.



14 Apa implikasi dari kekuatan statistik rendah? Bagaimana kekuatan dapat ditingkatkan jika dianggap terlalu rendah? Jawab : Memeriksa kekuatan untuk sebagian besar tes inferensi statistik dan memberikan pedoman untuk tingkat kekuatan yang dapat diterima, menunjukkan bahwa studi dirancang untuk mencapai tingkat alfa setidaknya 0.05 dengan tingkat daya 80 persen. Untuk mencapai tingkat daya tersebut, ketiga faktor—alfa, ukuran sampel, dan ukuran efek—harus dipertimbangkan secara bersamaan. Keterkaitan ini dapat diilustrasikan dengan contoh sederhana. Contohnya melibatkan pengujian untuk perbedaan antara skor rata-rata dua kelompok. Asumsikan bahwa ukuran efek diperkirakan berkisar antara kecil (0.2) dan sedang (0.5). Peneliti sekarang harus menentukan tingkat alfa yang diperlukan dan ukuran sampel masingmasing kelompok. Perhatikan bahwa dengan daya ukuran efek sedang mencapai tingkat yang dapat diterima pada ukuran sampel 100 atau lebih untuk tingkat alfa dari 0.05 dan 0.01. Tetapi ketika ukuran efeknya kecil, tes statistik memiliki sedikit daya, bahkan dengan tingkat alfa yang lebih fleksibel atau ukuran sampel 200 atau lebih. Misalnya, jika ukuran efeknya kecil sampel 200 dengan alfa 0.05 masih hanya memiliki peluang 50 persen dari perbedaan signifikan yang ditemukan. Ini menunjukkan bahwa jika peneliti mengharapkan bahwa ukuran efeknya akan kecil, penelitian harus memiliki ukuran sampel yang jauh lebih besar dan / atau tingkat alfa yang kurang ketat (misalnya, 0.10).



15 Detail pendekatan pembangunan model untuk analisis multivariasi, berfokus pada masalah utama di setiap langkah? Jawab : Proses pembangunan model enam langkah ini menyediakan kerangka kerja untuk mengembangkan, menafsirkan, dan memvalidasi analisis multivariat apa pun. Setiap peneliti harus mengembangkan kriteria untuk "berhasil" atau "gagal" di setiap tahap, tetapi pembahasan masing-masing teknik memberikan pedoman jika tersedia. Penekanan pada pendekatan pembangunan model di sini, daripada hanya spesifik dari setiap teknik, harus memberikan dasar yang lebih luas dari pengembangan model, estimasi, dan interpretasi yang akan meningkatkan analisis multivariat dari praktisi dan akademisi.



Tahap 1: Sesuaikan program pembelajaran, tujuan, dan multivarisasi yang akan digunakan Dengan model obyektif dan konseptual yang ditentukan, peneliti tinggal memilih teknik multivariat yang sesuai berdasarkan karakteristik pengukuran variabel dependen dan independen. Variabel untuk setiap konsep ditentukan sebelum studi dalam desainnya, tetapi dapat ditentukan kembali atau bahkan dinyatakan dalam bentuk yang berbeda (misalnya, transformasi atau pembuatan variabel dummy) setelah data dikumpulkan. Tahap 2: Meningkatkan rencana analisis Dengan model konseptual yang ditetapkan dan teknik multivariat dipilih, perhatian beralih ke masalah implementasi. Masalahnya mencakup pertimbangan umum seperti ukuran sampel minimum atau yang diinginkan dan jenis variabel yang diperbolehkan atau diperlukan (metrik versus nonmetrik) dan metode estimasi. Tahap 3: Evaluasi Asumsi yang diterbitkan multivariasi Dengan data yang dikumpulkan, tugas pertama bukanlah memperkirakan model multivariat tetapi mengevaluasi asumsi yang mendasarinya, baik statistik maupun konseptual, yang secara substansial memengaruhi kemampuan mereka untuk merepresentasikan hubungan multivariat. Untuk teknik yang didasarkan pada inferensi statistik, asumsi normalitas multivariat, linieritas, independensi istilah kesalahan, dan persamaan varian semuanya harus dipenuhi. Tahap 4: Manajemen Multivarisasi dan penanggung jawab multivarisasi terhadap model fit Dengan asumsi yang terpenuhi, analisis dilanjutkan ke estimasi aktual model multivariat dan penilaian kesesuaian model secara keseluruhan. Dalam proses estimasi, peneliti dapat memilih di antara opsi untuk menemukan karakteristik spesifik dari data (misalnya, penggunaan kovariat dalam MANOVA) atau untuk memaksimalkan kesesuaian dengan data (misalnya, rotasi faktor atau fungsi diskriminan). Setelah model diperkirakan, kesesuaian model keseluruhan dievaluasi untuk memastikan apakah model tersebut mencapai tingkat yang dapat diterima pada kriteria statistik (misalnya, tingkat signifikansi), mengidentifikasi hubungan yang diusulkan, dan mencapai signifikansi praktis. Sering kali, model akan ditentukan ulang dalam upaya mencapai tingkat kesesuaian dan / atau penjelasan keseluruhan yang lebih baik. Namun, dalam semua kasus, model yang dapat diterima harus diperoleh sebelum melanjutkan. Tahap 5: Memperbaiki varitasi Dengan tingkat kecocokan model yang dapat diterima, menafsirkan variasi mengungkapkan sifat hubungan multivariasi. Interpretasi efek untuk variabel individu dilakukan dengan memeriksa koefisien estimasi (bobot) untuk setiap variabel dalam variate. Selain itu,



beberapa teknik juga memperkirakan beberapa variasi yang mewakili dimensi yang mendasari perbandingan atau asosiasi. Interpretasi tersebut dapat menyebabkan penambahan spesifikasi variabel dan / atau formulasi model, dimana model tersebut diestimasi ulang dan kemudian diinterpretasikan kembali. Tujuannya adalah untuk mengidentifikasi bukti empiris hubungan multivariat dalam data sampel yang dapat digeneralisasikan untuk total populasi. Tahap 6: Keberhargaan multivariasi model Sebelum menerima hasil, peneliti harus mengarahkan mereka pada satu set analisis diagnostik terakhir yang menilai tingkat generalisasi hasil dengan metode validasi yang tersedia. Upaya untuk memvalidasi model diarahkan untuk menunjukkan generalisasi hasil terhadap total populasi. Analisis diagnostik ini menambah sedikit interpretasi hasil tetapi dapat dipandang sebagai "jaminan" bahwa hasil paling deskriptif dari data, namun dapat digeneralisasikan untuk populasi