Laporan Praktikum 1 Analisis Komponen Utama [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

LAPORAN PRAKTIKUM MATAKULIAH ANALISIS MULTIVARIAT TEPL637



Nama : Ni Putu Ely Kusumasari NIM : 1411305018



PROGRAM STUDI TEKNIK PERTANIAN FAKULTAS TEKNOLOGI PERTANIAN UNIVERSITAS UDAYANA 2017



Pengolahan Data Multivariat dengan Metode Analisis Komponen Utama 1. Landasan Teori Analisis komponen utama (principal component analysis / PCA) adalah teknik yang digunakan untuk menyederhanakan suatu data, dengan cara mentransformasi linier sehingga terbentuk sistem koordinat baru dengan varians maksimum. PCA dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan. Analisis komponen utama merupakan suatu tehnik statistik untuk mengubah dari sebagian besar variabel asli yang digunakan yang saling berkorelasi satu dengan yang lainnya menjadi satu set variabel baru yang lebih kecil dan saling bebas (tidak berkorelasi lagi). Jadi analisis komponen utama berguna untuk mereduksi data, sehingga lebih mudah untuk menginterpretasikan data-data tersebut (Johnson & Wichern, 1982). Analisis komponen utama merupakan analisis antara dari suatu proses penelitian yang besar atau suatu awalan dari analisis berikutnya, bukan merupakan suatu analisis yang langsung berakhir. Menurut Johnson dan Dean, Analisis Komponen Utama terkonsentrasi pada penjelasan struktur variansi dan kovariansi melalui suatu kombinasi linear variabel-variabel asal, dengan tujuan utama melakukan reduksi data dan membuat interpretasi. Analisis komponen utama lebih baik digunakan jika variabel-variabel asal saling berkorelasi (1988: 340). Banyaknya komponen utama yang terbentuk sama dengan banyaknya variabel asli. Pereduksian (penyederhanaan) dimensi dilakukan dengan kriteria persentase keragaman data yang diterangkan oleh beberapa komponen utama pertama. Apabila beberapa komponen utama pertama telah menerangkan lebih dari 75% keragaman data asli, maka analisis cukup dilakukan sampai dengan komponen utama tersebut.



Bila komponen utama diturunkan dari populasi multivariat normal dengan random vektor X = (X1, X2,… , Xp) dan vektor rata-rata μ = (μ1, μ2, … , μp) dan matriks kovarians Σ dengan akar ciri (eigenvalue) yaitu λ1 ≥ λ2 ≥ ⋯ ≥ λp ≥ 0 didapat kombinasi linier komponen utama yaitu sebagai berikut.



Maka Var(Yi ) = ei'Σei dan Cov(Yi,Yk ) = ei'Σei dimana i,k = 1, 2, ... , p. Syarat untuk membentuk komponen utama yang merupakan kombinasi linear dari variabel X agar mempunyai varian maksimum adalah dengan memilih vektor ciri (eigen vector) yaitu e = (e1, e2, …, ep) sedemikian hingga Var(Yi) = ei'Σei maksimum dan ei'ei = 1. 



Komponen



kombinasi



linear e1'X yang







memaksimumkan Var(e1'X) dengan syarat e1'e1 = 1. Komponen utama kedua adalah kombinasi



linear e2'X yang







memaksimumkan Var(e2'X) dengan syarat e2'e2 = 1. Komponen utama ke-i adalah kombinasi



linear ei'X yang



utama



pertama



adalah



memaksimumkan Var(ei'X) dengan syarat ei'ek = 1 dan Cov(ei'ek)=0 untuk k < 1. Antar komponen utama tersebut tidak berkorelasi dan mempunyai variasi yang



sama



dengan



akar



ciri



dari Σ. Akar



ciri



dari



matriks



ragam



peragam Σ merupakan varian dari komponen utama Y, sehingga matriks ragam peragam dari Y adalah:



Total keragaman variabel asal akan sama dengan total keragaman yang diterangkan oleh komponen utama yaitu:



Penyusutan dimensi dari variabel asal dilakukan dengan mengambil sejumlah kecil komponen yang mampu menerangkan bagian terbesar keragaman data.



Apabila



komponen



utama



yang



diambil



sebanyak q komponen,



dimana q < p, maka proporsi dari keragaman total yang bisa diterangkan oleh komponen utama ke-i adalah:



Penurunan komponen utama dari matriks korelasi dilakukan apabila data sudah terlebih dahulu ditransformasikan ke dalam bentuk baku Z. Transformasi ini dilakukan terhadap data yang satuan pengamatannya tidak sama. Bila variabel yang diamati ukurannya pada skala dengan perbedaan yang sangat lebar atau satuan ukurannya tidak sama, maka variabel tersebut perlu dibakukan (standardized). Variabel baku (Z) didapat dari transformasi terhadap variabel asal dalam matriks berikut:



V1/2 adalah matriks simpangan baku dengan unsur diagonal utama adalah (αii)1/2 sedangkan unsur lainnya adalah nol. Nilai harapan E(Z) = 0 dan keragamannya adalah



Dengan demikian komponen utama dari Z dapat ditentukan dari vektor ciri yang didapat melalui matriks korelasi variabel asal ρ. Untuk mencari akar ciri dan menentukan



vektor



pembobotnya



sama



seperti



pada



matriks



Σ.



Sementara trace matriks korelasi ρ akan sama dengan jumlah p variabel yang dipakai. Pemilihan komponen utama yang digunakan didasarkan pada nilai akar cirinya, yaitu komponen utama akan digunakan jika akar cirinya lebih besar dari satu.



2. Bahan dan Alat



SPSS yang digunakan adalah SPSS 23. SPSS adalah sebuah program komputer yang digunakan untuk membuat analisis statistika. SPSS merupakan salah satu program yang paling banyak digunakan untuk analisis statistika ilmu sosial. SPSS digunakan oleh peneliti pasar, peneliti kesehatan, perusahaan survei, pemerintah, peneliti pendidikan, organisasi pemasaran, dan sebagainya. Selain analisis statistika, manajemen data dan dokumentasi data juga merupakan fiturfitur dari software dasar SPSS. Statistik yang termasuk software dasar SPSS sebagai berikut: Statistik Deskriptif: Tabulasi Silang, Frekuensi, Deskripsi, Penelusuran,







Statistik Deskripsi Rasio Statistik Bivariat: Rata-rata, t-test, ANOVA, Korelasi (bivariat, parsial,







jarak), Nonparametric tests 



Prediksi Hasil Numerik: Regresi Linear







Prediksi untuk mengidentivikasi kelompok: Analisis Faktor, Analisis Cluster (two-step, K-means, hierarkis), Diskriminan. SPSS meletakkan batasan-batasan pada struktur file internal, tipe data,



pengolahan data dan pencocokan file, yang memudahkan pemrograman. SPSS datasets memiliki struktur tabel 2 dimensi dimana bagian baris menunjukkan kasus-kasus dan bagian kolom menampilkan ukuran-ukuran. Hanya 2 tipe data yang digambarkan : numerik dan teks. Seluruh pengolahan data dilakukan berurutan kasus per kasus melalui file. File dapat dipasangkan satu per satu atau satu-banyak, tapi tidak dapat banyak per banyak. User interface grafis memiliki 2 jenis tampilan yang dapat dipilih dengan cara meng-klik salah satu dari dua tombol di bagian bawah kiri dari window SPSS. SPSS mampu mengakses data dari berbagai macam format data yang tersedia seperti Base, Lotus, Access, text file, spreadsheet, bahkan mengakses database melalui ODBC (Open Data Base Connectivity) sehingga data yang sudah ada, dalam berbagai macam format, bisa langsung dibaca SPSS untuk dianalisis.



SPSS memberi tampilan data yang lebih informatif, yaitu menampilkan data sesuai nilainya (menampilkan label data dalam kata-kata) meskipun sebetulnya kita sedang bekerja menggunakan angka-angka (kode data). Misalnya untuk field Jenis Kelamin, kode angka yang digunakan adalah 1 untuk “pria” dan 2 untuk “wanita”, maka yang akan muncul di layar adalah label datanya, yaitu “pria” dan “wanita”. SPSS memberikan informasi lebih akurat dengan memperlakukan missing data secara tepat, yaitu dengan memberi kode alasan mengapa terjadi missing data. Misalnya karena pertanyaan tidak relevan dengan kondisi responden, pertanyaan tidak dijawab, atau karena memang pertanyaannya yang harus dilompati. SPSS



melakukan



analisis



yang



sama



untuk



kelompok-kelompok



pengamatan yang berbeda secara sekaligus hanya dalam beberapa mouse click saja. SPSS mampu merangkum data dalam format tabel multidimensi (crosstabs), yaitu beberapa field ditabulasikan secara bersamaan.



3. Contoh Kasus Penelitian Seorang mahasiswa menganalisis tingkat kepuasan tourist terhadap 10 variabel yang membuat mereka ingin berkunjung kembali ke Bali, adapun 10 variabel tersebut : budaya, fasilitas, kuliner, fashion, seni, cendramata, pemandangan, keamanan, kebersihan, kenyamanan. Pada penelitian ini diambil 50 tourist sebagai responden. setiap variabel diberikan 5 pilihan jawaban : 1. Sangat Tidak Setuju, 2. Tidak Setuju, 3. Cukup, 4. Setuju, 5. Sangat Setuju. Berikut data hasil responden (nilai rekayasa penyusunan) No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23



Buda ya 4 4 4 4 4 5 4 4 4 4 4 4 4 4 4 4 4 4 5 4 4 4 4



Fasil itas 4 3 3 4 5 5 4 5 5 5 5 4 4 4 4 4 4 5 5 4 4 4 4



Kuli ner 4 4 3 3 5 5 4 5 5 4 4 4 3 3 4 4 5 4 5 4 4 3 3



Fashi on 4 4 4 4 4 5 4 4 5 5 5 5 4 4 4 4 4 4 5 4 4 4 4



Se ni 4 4 2 2 2 5 3 3 3 4 3 4 4 4 5 5 5 5 5 5 5 5 4



Cendr amata 4 3 3 3 4 3 4 4 4 4 4 4 4 4 4 4 4 4 3 3 4 3 3



Peman dangan 4 4 4 4 4 5 3 3 4 3 3 5 5 5 5 4 5 4 4 4 4 4 4



Keama nan 4 4 4 4 2 2 2 4 2 2 4 2 4 4 2 2 4 2 2 4 2 3 4



Keber sihan 4 4 2 2 2 5 3 3 3 4 3 4 4 3 3 3 1 1 1 5 1 1 1



Kenya manan 4 4 2 2 2 5 3 3 3 4 3 4 4 4 4 5 5 5 5 5 2 2 4



24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50



5 4 4 4 4 4 4 4 4 5 4 4 4 4 4 5 5 5 4 4 3 3 4 4 4 4 4



4 4 4 4 4 5 4 3 3 5 3 3 3 4 3 2 5 1 4 4 3 4 4 4 4 4 4



4. Prosedur Kerja



5 4 4 4 4 2 2 2 2 5 4 4 4 4 4 5 5 5 4 4 4 3 3 4 5 5 4



5 4 4 4 4 3 3 3 3 3 4 3 3 2 2 5 1 5 1 1 4 1 4 4 4 4 4



5 5 4 5 5 5 4 5 4 5 4 4 4 4 4 5 5 5 4 1 1 4 2 4 3 3 4



5 4 4 4 4 4 4 3 3 5 3 3 3 4 3 4 4 5 4 4 4 4 4 5 4 5 5



5 4 4 4 4 4 4 4 4 3 4 4 3 4 3 3 5 5 1 4 1 4 4 1 1 1 1



3 4 4 2 1 4 3 4 2 1 4 4 3 4 4 3 5 2 4 2 1 4 1 1 1 1 4



5 5 5 5 5 5 4 5 4 5 4 4 4 4 4 5 5 5 4 4 4 4 5 5 4 4 5



2 2 2 2 2 5 2 2 2 5 4 4 4 2 2 5 2 2 2 2 2 4 4 2 4 4 4



Adapun prosedur kerja dalam menggunakan SPSS sebagai berikut : 1. Input data penelitian pada Data View di SPSS 2. Isi baris pertama pada kolom Name di Variable view dengan P1, baris kedua P2 dst 3. Ubah kolom Decimals menjadi 0 4. Masukan pada kolom Label : Budaya, Fasilitas, Kuliner, Fashion, Seni, Cendramata, Pemandangan, Keamanan, Kebersihan, Kenyamanan 5. Ubah kolom Values menjadi : 1. Sangat Tidak Setuju, 2. Tidak Setuju, 3. Cukup, 4. Setuju, 5. Sangat Setuju.



Berikut adalah tampilan setelah langkah 1-5 sudah dikerjakan 6. Selanjutnya klik menu Analyze => Dimension Reduction => Factor, klik kanan pada Budaya lalu ubah Display Variable Labels menjadi Display Variabels Names, maka tampilan akan menjadi sebagai berikut :



7. Klik



Descriptives



=>



centang



Initial



Solution,



Coefficients,



Reproduced, Anti-Image, KMO, continue



8. Klik Extraction => ubah Method yang digunakan menjadi Principal Componen, pilih Correlation Matrix, Based on Eigenvalue, Unrotated Factor Solution, Scree Plot, continue



9. Klik Rotation => pilih Varimax, Rotated Solution, Loading Plot(s), continue



10. Klik Scores => pilih Save as Variables, Regression, continue



11. Klik Options => pilih Exclude Cases Listwise, Sorted by Size, Suppress Small Coefficients, continue



12. Selanjutnya klik Paste => block dari bawah sampai Factor, lalu Play. Tampilan sebagai berikut :



13. Selanjutnya keluarlah hasil dari perhitungan SPSS 5. Interpretasi Dari hasil pengolahan data dengan Metode Analisis Komponen Utama pada Aplikasi SPSS, maka diperoleh data sebagai berikut:



Tabel Correlation Matrix merupakan tabel matriks korelasi yang berisi nilainilai korelasi antara variabel-variabel yang akan dianalisis. Pada bagian Correlation dapat dilihat besarnya korelasi antarvariabel.



Berdasarkan Bartlett’s Tes of Sphericity dengan Chi-Square 90,029 (df 45) dan nilai sig = 0,000 < 0,05 menunjukkan bahwa matriks korelasi bukan merupakan matriks identitas sehingga dapat dilakukan analisis komponen utama. Di samping itu, Nilai KMO yang dihasilkan adalah sebesar 0.555, serta p-value sebesar 0,000 (