Klasifikasi Ikan Layang Dan Ikan Tongkol Menggunakan Metode PCA (Principal Component Analysis) [PDF]

  • Author / Uploaded
  • Qory
  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

Klasifikasi Ikan Layang dan Ikan Tongkol Menggunakan Metode PCA (Principal Component Analysis) Qory Aprilarita Jurusan Ilmu Komputer FMIPA Unila



Abstract



Classification is one of the important tasks that are common in everyday life. The process helps people save time and work. One of the example classification task is classification types of fish. That is because the shape is similar to other types. Therefore, in this study will be the classification of the flying fish and tuna. The goal is to help sellers and buyers in practice recognizing the type of fish. The method used is the extraction image of PCA and Euclidean Distance method. Results of research conducted is a system able to work optimally in doing classification task with accuracy value of 91,67%. Keywords: Euclidean Distance; Ikan Layang; Ikan Tongkol; Klasifikasi; PCA.



1.



Pendahuluan



Indonesia merupakan salah satu negara kepulauan terbesar di dunia. Sebagai negara kepulauan, maka jelas Negara Indonesia memiliki wilayah daratan dan lautan (perairan) yang luas. Wilayah perairan Indonesia memiliki luas kurang lebih 5.193.250 km2. Dengan wilayah perairan yang luas, maka tak heran jika Indonesia memiliki banyak keragaman hayati bawah laut seperti contohnya ikan. Ikan merupakan komoditi perdagangan yang menguntungkan bagi devisa negara. Banyak jenis ikan yang beredar di pasaran, diantaranya adalah ikan layang dan ikan tongkol. Ikan layang dan ikan tongkol memiliki potensi ekonomi yang cukup tinggi karena memiliki permintaan yang terus meningkat [1]. Ikan layang dan ikan tongkol memiliki bentuk fisik yang hampir sama, sehingga menyebabkan konsumen kesulitan dalam membedakannya. Selama ini konsumen dan penjual hanya dapat melakukan cara-cara manual dalam mengidentifikasi kedua jenis ikan tersebut. Tentunya cara tersebut tidaklah praktis untuk dilakukan dan memberikan efek yang merugikan jika dibandingkan dengan cara otomatis yang dibantu dengan teknologi yang maju. Kerugian tersebut akan semakin terasa apabila terjadi kasus dimana penjual harus memasukkan ikan dalam jumlah yang sangat banyak ke dalam wadah yang berbeda jenisnya. Proses tersebut akan memakan waktu yang cukup panjang dan menghabiskan tenaga. Belum lagi jika penjual salah menempatkan ikan, maka akan menimbulkan kerugian bagi konsumen. Timbulnya permasalahan di atas memunculkan beragam solusi praktis, salah satunya adalah metode klasifikasi ikan layang dan ikan tongkol yang dilakukan dengan bantuan komputer [2]. Telah banyak metode yang digunakan untuk tujuan klasifikasi, namun dari sekian banyak



metode, metode PCA (Principal Component Analysis) adalah yang paling sering digunakan karena memiliki nilai akurasi yang cukup tinggi dan mampu bekerja secara



optimal. PCA bertujuan untuk mereduksi dimensi dengan melakukan transformasi linear dari suatu ruang berdimensi tinggi ke dalam ruang dimensi [1]. Tujuan dari penelitian ini sendiri adalah untuk memudahkan konsumen maupun penjual dalam mengenali jenis ikan layang dan ikan tongkol dengan menggunakan metode PCA, sehingga dapat menghemat waktu dan tenaga. 2.



Metodologi



2.1. Waktu dan Tempat Penelitian Penelitian ini dilakukan di Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung dan Pasar Tempel Way Halim untuk pengambilan dataset. Waktu penelitian dilaksanakan dalam kurun waktu satu minggu, yaitu dari 3 Januari 2017 sampai dengan 10 Januari 2017. 2.2. Alat Pendukung Alat pendukung yang digunakan dalam penelitian ini adalah sebagai berikut: a. Perangkat keras  Perangkat laptop ASUS dengan spesifikasi Processor Intel (R) Core (TM) i32370M CPU @ 2.40 GHz, Harddisk 500 GB, RAM 2.00 GB, OS Windows 8.1 Pro 32 bit b.  



Perangkat lunak Matlab R2012a sebagai text editor source code Microsoft Word sebagai text editor penulisan paper.



2.3. Tahapan Penelitian Dalam membuat paper ini dilakukan studi pustaka dan metode eksperimental. Tahapan penelitian dapat digambarkan melalui flowchart di bawah ini.



2.4. Metode Penelitian Metode yang digunakan selama dilakukan penelitian adalah metode PCA dan Euclidean distance. Berikut ini adalah penjelasan dari kedua metode. 2.4.1. PCA PCA adalah suatu metode yang melibatkan prosedur matematika yang mengubah dan mentransformasikan sejumlah besar variabel yang berkorelasi menjadi sejumlah kecil variabel yang tidak berkorelasi, tanpa menghilangkan informasi penting di dalamnya. PCA banyak digunakan untuk memproyeksikan atau mengubah suatu kumpulan data berukuran besar menjadi bentuk sajian data dengan ukuran yang lebih kecil. Transformasi PCA terhadap sebuah ruang data yang besar akan menghasilkan sejumlah vektor basis ortonormal dalam bentuk kumpulan vektor eigen dari suatu matriks kovarian tertentu yang dapat secara optimal menyajikan distribusi data. Sasaran dari PCA pada penelitian ini adalah menangkap variasi total dari citra ikan-ikan yang ada di dalam basis data yang dilatihkan. Untuk kemudian mereduksinya sehingga menjadi variabel-variabel yang lebih sedikit. Dengan mereduksi sehingga dimensinya menjadi lebih kecil, maka vektor mana yang harus direduksi dan mana yang tidak direduksi dapat ditentukan dengan mengurutkan nilai eigen terbesar ke nilai eigen terkecil dan vektor eigennya diurutkan sesuai dengan nilai eigen yang bersangkutan. Vektor yang direduksi adalah vektor yang mempunyai nilai eigen yang kecil, karena nilai eigen yang kecil menandakan informasi yang dibawa tidaklah seberapa penting, sehingga dapat direduksi tanpa mempengaruhi ruang citra [2]. Secara singkat langkah-langkah dari proses pembentukan ruang eigen menggunakan PCA adalah sebagai berikut: 1.



Misalnya, terdapat sejumlah n citra. X  x1 x2  xn 



2.



Menghitung citra rata-rata dari matriks X dengan persamaan sebagai berikut.



 3.



Mengurangi matriks X dengan citra rata-rata, sehingga didapatkan matriks Y sebagai berikut.



4.



Menentukan matriks kovarians C dengan dimensim x m , yaitu jumlah piksel x jumlah piksel sebagai berikut.



5.



Mencari nilai eigen dan vektor eigen dari C sehingga memenuhi persamaan: C . b = .b



6.







Jika e1



e2  e M



 dan 1 2 



M



adalah PCA atau vektor eigen



dan nilai



eigen dari matriks kovarians C maka harga e dapat dihitung dari  hasil langkah 6.







Menentukan jumlah vector eigen em berdasarkan nilai ambang, yaitu dengan mengambil sejumlah tertentu dari vektor eigen e [2].



2.4.2. Euclidean Distance Setelah didapatkan vektor ciri dari citra uji, maka proses selanjutnya adalah membandingkan vektor ciri dari citra uji dengan vektor ciri citra latih. Perbandingan tersebut dapat dilakukan dengan cara menghitung jarak euclidean (euclidean distance), yang merupakan selisih nilai piksel antara 2 vektor tersebut. Jarak euclidean adalah akar dari jumlah selisih kuadrat antara 2 vektor, dan secara matematis dapat dirumuskan:



Keterangan : de : jarak euclidean fdi : bobot citra pelatihan kj : data bobot test m : jumlah data pelatihan [2]. 2.5. Tahap Pengembangan Sistem Tahapan dalam pengembangan sistem dapat digambarkan seperti pada diagram berikut.



3. Pembahasan Dataset yang digunakan pada penelitian ini adalah data gambar yang berjumlah 200 foto, dimana 100 foto adalah data foto ikan layang, dan 100 foto lainnya adalah data foto ikan tongkol. Dataset diambil dengan menggunakan kamera ponsel berkemampuan 8 megapixel. Setelah foto diambil, maka langkah selanjutnya adalah meng-cropping gambar untuk diberi background warna dasar putih. Setelah itu, semua foto di-resize ke ukuran 225 x 232 pixel. Setelah semua foto memiliki ukuran yang sama, m aka langkah selanjutnya adalah menjadikan foto ke dalam citra grayscale dengan tujuan untuk mereduksi ukuran dimensi gambar saat proses ekstraksi ciri menggunakan PCA. Berikut ini merupakan tahapan gambar yang dihasilkan dari tahap praproses.



Gambar 3.1 Hasil Foto



Gambar 3.2 Hasil Cropping



Gambar 3.3 Hasil Resize



Gambar 3.4 Hasil Grayscale



Setelah tahap praproses dilakukan maka langkah selajutnya adalah tahap ekstraksi fitur dengan menggunakan PCA dan tahap pengujian. Pada tahap pengujian, diberikan sebuah skenario dimana dari 200 dataset dibagi menjadi 70% untuk data latih dan 30% untuk data uji. Hal pertama yang perlu dilakukan adalah mengatur direktori tempat data latih dan data uji berada, selanjutnya sistem akan mulai melakukan klasifikasi. Dalam proses pengklasifikasian tersebut, sistem akan memberikan sebuah pertanyaan apakah gambar yang ditampilkan oleh sistem mirip dengan data uji yang telah diatur sebelumnya. Pemberian pertanyaan ditujukan untuk mengetahui keakuratan sistem dalam mengklasifikasi, sehingga pada hasil akhirnya akan diberikan jumlah persentase



keakuratan sistem. Berikut merupakan tampilan sistem.



Gambar 3.5 Tampilan Interface Sistem



Pada tampilan program, diketahui bahwa nilai akurasi yang diperoleh adalah sebesar 91,67% dengan empat kali kesalahan data prediksi. Nilai akurasi sendiri diperoleh dari perhitungan jumlah seluruh dataset dibagi dengan jumlah kesalahan data prediksi lalu dikali 100. Selain menampilkan akurasi, sistem juga menampilkan nilai Euclidean Distance dan data prediksi untuk setiap data uji. Berikut ini adalah tabel hasil pengujian 60 data set yang dijadikan data uji. Data Uji Data ke-1 Data ke-2 Data ke-3 Data ke-4 Data ke-5 Data ke-6 Data ke-7 Data ke-8 Data ke-9 Data ke-10 Data ke-11 Data ke-12



Hasil Euclidean Distance 3.574 6.865 3.234 4.941 5.480 7.648 5.724 5.716 2.928 6.425 7.453 3.512



Data Prediksi Data ke-34 Data ke-62 Data ke-47 Data ke-15 Data ke-43 Data ke-22 Data ke-65 Data ke-61 Data ke-8 Data ke-9 Data ke-31 Data ke-70



Kesimpulan Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok



Data Uji Data ke-13 Data ke-14 Data ke-15 Data ke-16 Data ke-17 Data ke-18 Data ke-19 Data ke-20 Data ke-21 Data ke-22 Data ke-23 Data ke-24 Data ke-25 Data ke-26 Data ke-27 Data ke-28 Data ke-29 Data ke-30 Data ke-31 Data ke-32 Data ke-33 Data ke-34 Data ke-35 Data ke-36 Data ke-37 Data ke-38 Data ke-39 Data ke-40 Data ke-41 Data ke-42 Data ke-43 Data ke-44 Data ke-45 Data ke-46 Data ke-47 Data ke-48 Data ke-49 Data ke-50 Data ke-51 Data ke-52 Data ke-53



Hasil Euclidean Distance 9.866 8.088 8.311 2.117 3.817 3.469 3.657 7.319 5.751 7.273 6.845 5.598 8.599 3.487 7.462 7.263 7.393 4.113 6.156 1.980 6.137 4.564 5.171 6.131 5.640 4.255 3.542 5.639 3.515 5.235 3.273 5.740 2.967 4.508 3.162 2.626 5.032 4.639 2.558 4.958 5.274



Data Prediksi Data ke-67 Data ke-70 Data ke-21 Data ke-47 Data ke-34 Data ke-8 Data ke-34 Data ke-31 Data ke-78 Data ke-43 Data ke-61 Data ke-64 Data ke-43 Data ke-42 Data ke-36 Data ke-31 Data ke-87 Data ke-64 Data ke-139 Data ke-123 Data ke-89 Data ke-138 Data ke-81 Data ke-121 Data ke-139 Data ke-82 Data ke-82 Data ke-23 Data ke-139 Data ke-113 Data ke-133 Data ke-135 Data ke-134 Data ke-133 Data ke-85 Data ke-122 Data ke-116 Data ke-113 Data ke-96 Data ke-90 Data ke-128



Kesimpulan Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Tidak Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Tidak Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Tidak Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok Cocok



Data Uji Data ke-54 Data ke-55 Data ke-56 Data ke-57 Data ke-58 Data ke-59 Data ke-60



Hasil Euclidean Distance 5.379 6.648 5.520 8.563 3.272 3.209 5.594



Data Prediksi Data ke-128 Data ke-95 Data ke-130 Data ke-127 Data ke-128 Data ke-20 Data ke-49



Kesimpulan Cocok Cocok Cocok Cocok Cocok Tidak Cocok Tidak Cocok



5. Kesimpulan Dari hasil dan pembahasan yang dibahas sebelumnya, didapat kesimpulan bahwa: 1. Tahap praproses dimulai dari cropping, resize, lalu konversi ke grayscale. 2. Dataset yang digunakan berupa gambar ikan layang dan ikan tongkol yang difoto dengan menggunakan kamera digital. 3. Dataset berjumlah 200 data dan berdasarkan metode holdout 70:30, data dibagi menjadi 140 data latih dan 60 data uji. 4. Program dengan metode PCA bekerja dengan sangat baik, dimana hasil akurasi mencapai nilai 91,67% 5. Semakin banyak data latih yang digunakan maka semakin baik persen tasi keakuratan program dalam mengklasifikasi. 6. Faktor ciri-ciri ikan juga berpengaruh penting dalam sistem pengenalan, artinya setiap jenis ikan semakin banyak ciri-ciri yang dominan, hasil pengenalan akan semakin akurat. 6. Ucapan Terima Kasih Dalam pembuatan paper ini banyak pihak yang membantu penulis sehingga dapat menyelesaikan paper ini, untuk itu Penulis mengucapkan terimakasih kepada: a. Tuhan Yang Maha Esa yang telah memberikan kesehatan dan kelancaran kepada penulis sehingga dapat menyelesaikan paper ini. b. Orang tua yang telah memberikan dukungan kepada penulis untuk menyelesaikan paper ini. c. Dosen yang telah membimbing penulis dalam menyelesaikan paper ini. 7. Refference [1]



Danar Putra Pamungkas, Fajar Rohman Hariri, Pengenalan Citra Tanda Tangan Menggunakan Metode 2DPCA dan Euclidean Distance, Seminar Nasional Teknologi Informasi dan Multimedia 2016 (2016).



[2]



Suharto Jati Santoso, Budi Setiyono, R. Rizal Isnanto, Pengenalan Jenis-Jenis Ikan Menggunakan Metode Analisis Komponen Utama, Fakultas Teknik Universitas Diponegoro (2011).



[3]



Wan Rita Fayetri, T. Efrizal dan Andi Zulfikar, Kajian Analitik Stok Ikan Tongkol (Euthynnus affinis) Berbasis Data Panjang Berat yang Didaratkan di Tempat Pendaratan Ikan Pasar Sedanau Kabupaten Natuna, Faculty of Marine Science and Fisheries Maritime Raja Ali Haji of University (2013).