Optical Character Recognition Pada Dokumen Surat Keputusan Menggunakan Algoritma Reduced Support Vector Machines [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

OPTICAL CHARACTER RECOGNITION PADA DOKUMEN SURAT KEPUTUSAN MENGGUNAKAN ALGORITMA REDUCED SUPPORT VECTOR MACHINES SKRIPSI



Diajukan sebagai salah satu syarat untuk memperoleh gelar Sarjana (S1)



LAMHOT SUDIARTA NAIBAHO 10115580



PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK DAN ILMU KOMPUTER UNIVERSITAS KOMPUTER INDONESIA 2020



BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Optical character recognition (OCR) adalah sebuah sistem komputer yang dapat membaca huruf, baik yang berasal dari sebuah pencetak (printer atau mesin ketik) maupun yang berasal dari tulisan tangan. OCR adalah aplikasi yang menerjemahkan gambar karakter (image character) menjadi bentuk teks dengan cara menyesuaikan pola karakter per baris dengan pola yang telah tersimpan dalam database aplikasi. Hasil dari proses OCR adalah berupa teks sesuai dengan gambar output scanner dimana tingkat keakuratan penerjemahan karakter tergantung dari tingkat kejelasan gambar dan metode yang digunakan [1]. Penelitian sebelumya mengenai Optical Character Recognition telah dilakukan sebelumnya oleh peneliti sebelumnya dengan menggunakan berbagai metode, pada penelitian Aldi Setiawan, Herry Sujaini, Arif Bijaksana PN (2017), implementasi Optical Character Recognition berbasis android, penelitian ini mengangkat masalah utama yaitu tidak efisiennya penggunaan kamus cetak untuk mencari arti dari satu kata demi satu kata, dan untuk penerjemah eletronik akan menerjemahkan kata atau kalimat yang diketik oleh user melalui keyboard atau keypad sebagai inputan dan diperoleh hasil pengujian recall dan precission aplikasi, diperoleh bahwa aplikasi cukup baik dalam menangkap kata masukan dengan beberapa font dan ukuran font antara 12 sampai 16. [2] Pada penelitian yang termasuk ke dalam text processing menggunakan rsvm Epa Suryanto dan Santi Wulan Purnami (2015) Metode SSVM membutuhkan waktu running yang juga hampir sama dengan RSVM, tetapi untuk jumlah data lebih dari 1000 waktu yang dibutuhkan metode SSVM mengalami peningkatan yang tinggi. Pada metode RSVM waktu yang dibutuhkan dengan berbagai jumlah data lebih cepat dibandingkan SSVM. Performansi RSVM lebih baik daripada SSVM untuk jumlah data yang relatif besar (lebih dari 1000). Sedangkan pada data yang relatif kecil



(kurang dari 1000) kedua metode memberikan performansi yang sama. Akurasi RSVM pada data simulasi lebih besar dari 99%. [3] Penelitian Santi Wulan Purnami, Jasni Mohamad Zain, Tutut Heriawan (2011) Memberikan alternatif pada metode SVM yang tidak efisien untuk memecahkan masalah optimasi pada data besar yaitu dengan memakai metode RSVM sebagai modifikasi dari metode SVM. Dari hasil perbandingan antara metode RSVM dan SSVM, metode RSVM mampu untuk mengklarifikasi jumlah data diatas 8000 data, sedangkan pada metode SSVM fungsi kernel mengalami out of memory bahkan sebelum memulai pencarian solusi. [4] Penelitian Kuang Ming Lin dan Chih Jen Lin (2003) membahas tentang perbandingan metode RSVM dan SVM yang merupakan modifikadi dari metode SVM. Hasil penelitian menjelaskan bahwa hasil akurasi kecepatan RSVM lebih cepat daripadada SVM. Dan metode RSVM dapat digunakan pada proses klarifikasi pada data besar sedangkan SVM tidak bisa [5] Penelitian Vincent Limountha membahas tentang esktraksi informasi pada dokumen surat keputusan. Kasus yang diangkat dari penelitian ini adalah untuk mengetahui tingkat akurasi dari metode Conditional Random Fields (CRF). Hasil dari penelitian menjelaskan bahwa hasil akurasi kcepatan CRF sebesar 91,73 %, tingkat akurasi ini diperoleh oleh nilai parameter awal pada proses pelatihan. [6] Berdasarkan penelitian sebelumnya penerapan RSVM menghasilkan nilai akurasi yang baik, maka kali ini perlu dilakukan sebuah penelitian untuk membangun sebuah sistem ekstraksi informasi pada surat keputusan menggunakan algoritma RSVM dengan Metode OCR. Dengan penelitian ini diharapkan dapat menemukan hasil akhir apakah penggunaan algoritma RSVM dengan Metode OCR memiliki nilai akurasi yang baik. 1.2 Identifikasi Masalah



Berdasarkan latar belakang masalah yang diurakian diatas, masalah yang dapat teridentifikasi yaitu dibutuhkannya hasil akurasi dari sistem ekstraksi informasi dengan menggunakan Algoritma RSVM untuk dokumen surat keputusan. 1.3 Maksud dan Tujuan Maksud dari penelitian ini adalah untuk Mengimplementasikan Optical Character Recognition pada dokumen Surat Keputusan. Berdasarkan rumusan masalah yang telah dipaparkan diatas, maka tujuan dilakukannya penelitian ini untuk



mengetahui nilai akurasi, presisi, dan recall



algoritma RSVM dan Metode OCR dalam implementasi ekstraksi informasi pada Surat Keputusan.



1.4. Batasan Masalah Batasan masalah pada penelitian yang akan dilakukan adalah: 1. Penelitian ini hanya melakukan pengambilan data berupa angka dan huruf pada Surat Keputusan. 2. Data masukan yang digunakan pada penelitian ini adalah Surat Keputusan yang ditujukan untuk satu orang. 3. Tanda tangan tidak dilakukan proses pengenalan. 4. Jenis dokumen yang digunakan untuk data training pada penelitian ini berformat *.pdf atau *.jpg. 5. Jenis dokumen yg digunakan untuk data testing pada penelitian ini berformat *.pdf atau *.jpg



1.5 Metode Penenelitian



Metode penelitian yang digunakan dalam penelitian ini adalah metode penelitian deskriptif. Metode yang mempelajari masalah yang ada dengan tatacara kerja yang berlaku. Langkah-langkah penelitian dapat dilihat pada gambar 1.1. Identifikasi masalah



Pengumpulan Data



Analisis



Pembangunan Perangkat Lunak



Pengujian



Penarikan Kesimpulan Gambar 0.1 Sistematika Metode Penelitian Deskriptif 1. Identifikasi Masalah Berdasarkan fenomena tersebut maka rumusan masalah adalah karakteristik pada dokumen surat keputusan tiap instansi berbeda sehingga dibutuhkan klasifikasi untuk mengekstraksi informasi didalamnya. Metode klasifikasi yang akan digunakan adalah SVM dikarenakan iya memiliki hasil yang baik dalam ekstraksi informasi. 2. Pengumpulan Data Pengumpulan data dilakukan dengan cara mengambil data dari internet, jurnal, artikel ilmiah, ataupun dari sumber-sumber yang memiliki data-data yang akan dijadikan bahan dalam penelitian yang akan dilakukan. Kerangka Pengumpulan data yang didapatkan dari objek penelitian yaitu :



1. Studi Pustaka Studi yang dilakukan dalam mencari informasi yang terkait dengan penelitian melalui literatur jurnal, paper, proceedings, maupun buku. 2. Dataset Pengumpulan data dengan mengumpulkan bahan dari internet, literatur, maupun sumber-sumber yang memiliki data yang akan menjadi bahan dalam penelitian. 3. Analisis Tahap analisis yang dilakukan adalah analisis data masukan yang akan digunakan, analisis tahap preprocessing, sampai analisis ekstraksi dengan menggunakan metode OCR dan algoritma RSVM. 4. Pembangunan Perangkat Lunak Metode pembangungan perangkat lunak pada penelitian ini dengan metode prototype.



Analisis



Desain Sistem



Membangun Protorype



Evaluasi Prototype



Pengujian Prototype



Gambar 0.2 Metode Pembangunan Perangkat Lunak Pemodelan sistem yang digunakan menggunakan pemodelan Prototype. Berikut tahapan pada model Prototype . 1. Analisis Sistem Mengumpulkan kebutuhan-kebutuhan untuk sistem yang dibuat kemudian dianalisis sesuai dengan kebutuhan penelitian seperti dokumen pendukung dan informasi tambahan yang dibutuhkan. 2. Desain Menjabarkan informasi yang didapat dan telah dianalisis secara rinci seperti kebutuhan software dan hardware yang dimuat kedalam bentuk



blueprint sebelum masuk ke tahap pembangunan prototype agar sistem dapat dibangun secara mendetail. 3. Pembangunan Prototype Tahap penerjemahan desain ke dalam bahasa pemrograman yang berisikan pemecahan masalah pada penelitian. 4. Pengujian Menguji apakah sistem yang dibangun dapat memecahkan masalah atau tidak, sesuai dengan apa yang telah dirancang sebelumnya. 5. Evaluasi Prototype Pada tahap ini sistem akan mengalami perubahan-perubahan tergantung permintaan atau kebutuhan pengguna. 5. Pengujian Pengujian yang dilakukan pada penelitian ini menggunakan confussion matrix dengan menghitung precission, recall, dan akurasi. 6. Penarikan Kesimpulan Penarikan kesimpulan dilakukan setelah pengujian dilakukan. Hasil dari pengujian dijadikan bahan untuk menarik kesimpulan, apakah CNN mempunyai hasil yang bagus atau tidak dalam implementasi ekstraksi informasi pada surat masuk. 1.6



Sistematika Penulisan Sistematika penulisan tugas akhir ini disusun untuk memberikan gambaran



umum tentang penelitian yang dijalankan. Sistematika penulisan tugas akhir ini adalah sebagai berikut : BAB I PENDAHULUAN Menguraikan tentang latar belakang permasalahan, mencoba merumuskan inti permasalahan yang dihadapi, menentukan tujuan dan kegunaan penelitian, yang kemudian diikuti dengan pembatasan masalah, asumsi, serta sistematika penulisan BAB II LANDASAN TEORI



Pada bab ini akan menjelaskan mengenai objek dari penelitain, dan teori – teori diantaranya yaitu teori RSVM, teori OCR, teori Pengolahan Citra, serta teori pendukung yang berhubungan dengan penelitian ini serta perangkat lunak pendukung yang digunakan dalam penelitian ini. BAB III. ANALISIS DAN PERANCANGAN SISTEM Pada bab ini membahas tentang analisis masalah dan kebutuhan mengenai metode Optical Character Recognition dan algoritma RSVM dalam menekstraksi dokumen. Penjelasan proses dalam ekstraksi informasi secata matematis. Pada bab ini juga dibahas tentang perancangan UML dan perancangan antarmuka. BAB IV. IMPLEMENTASI DAN PENGUJIAN SISTEM Bab ini berisi mengenai hasil dari implementasi dari analisis yang telah dilakukan di BAB 3 dan pengujian akurasi metode OCR dan algoritma RSVM yang digunakan untuk ekstraksi informasi pada surat keputusan. BAB V. KESIMPULAN DAN SARAN Berisi kesimpulan dari hasil penelitian Ekstraksi Informasi pada Surat Keputusan Menggunakan metode Optical Character Recognition dan algoritma RSVM dan saran-saran untuk pengembangan penelitian yang akan datang.



BAB 2 TINJAUAN PUSTAKA 2.1 Optical Character Recognition (OCR) Optical Character Recognition (OCR)



adalah teknik mengubah sebuah



gambar berisi teks, tulisan tangan, menjadi teks yang dapat diubah untuk proses selanjutnya, Sejarah OCR dimulai sejak 1950 dan masih terus berkembang sampai saat ini. Teknologi ini terus berkembang seiring berkembangnya teknologi. Teknologi ini memungkinkan mesin untuk mengenali mengenali teks secara otomatis, teknik ini seperti kombinasi dari mata dan otak manusia, sebuah mata dapat melihat seuah teks dari gambar tapi sebenarnya otak yang memproses dan mengolah teks tersebut sehingga dapat dibaca oleh mata. Dalam pengembangan OCR terdapat beberapa masalah, diantaranya yang pertama adalah terdapat beberapa huruf dan angka yang sulit dibedakan karena memiliki ciri yang hampir sama, faktor kedua adalah faktor cahaya dalam citra yang mempersulit system mengenali huruf[ CITATION Sol15 \l 1033 ] 2.2 Dokuman Surat Keputusan Menurut Kamus Besar Bahasa Indonesia, dokumen adalah surat yang tertulis atau tercetak yang dapat dipakai sebagai bukti keterangan. Surat tugas atau surat keputusan adalah surat yang menerangkan bahwa orang yang diberi surat itu diperintahkan atau diberi tugas untuk menjalankan sesuatu. Pada penelitian ini, dokumen yang akan digunakan adalah dokumen surat keputusan. Dokumen yang digunakan hanya dokumen surat keputusan yang ditujukan kepada 1 (satu) orang. Lembar dokumen surat keputusan terdiri dari Kepala Surat, Jenis Surat, Nomor Surat, Tentang, Jabatan yang Menetapkan Surat, Menimbang, Mengingat, Putusan, Nama yang Dituju, Nomor Induk yang Dituju, Isi Putusan, Tempat Diputuskan, Tanggal Diputuskan, Organisasi, Nama yang Menetapkan Surat, dan Tembusan.



2.3 Pengolahan Citra Istilah citra digital sangat polpuler pada masa sekarang. Banyak perlatan elektronik,misalnya scanner, kamera digital, mikroskop digital, dan fingerprint reader (pembaca sidik jari), yang menghasilkan citra digital. Perangkat lunak untuk mengolah citra digital jugasangat popular digunakan oleh pengguna untuk mengolah foto atau untuk berbagai keperluan lain. Penolahan citra merupakan proses memanipulasi dan menganalisis citra dengan bantuan komputer, dalam hal ini mengolah informasi yang terdapat pada suatu gambar untuk keperluan pengenalan objek secara otomatis. Ada berbagai teknik pengolahan citra tergantung kebutuhan dan keluaran yang diinginkan [8]. 2.4 Prepocessing Pre-processing adalah bagiaan penting dari setiap system pemrosesan Bahasa alami, karena karakter, kata, dan kalimat yang diintifikasi pada tahap ini adalah unit dasar atau awal sebelum pemrosesan lebih lanjut. Pre-processing dilakukan karena data teks sering mengandung berbagai macam format atau berbeda-beda seperti format angka dan kata-kata yag tidak membantu dan dapat dihilagkan sehingga memudahkan proses selanjutya. Image preprocessing adalah suatu bentuk pengolahan atau pemrosesan sinal dengan input berupa gambar (image) dan ditransformasikan menjadi gambar lain sebagai keluatan dengan teknik tertentu. Image preprocessing dilakukan untuk memprbaiki kesalahan data sinyal akibat transmisi dan selama akusisi sinyal, serta untuk meningkatkan kualitas penampakan gambar agar lebih mudah diinterpretasi oleh system penglihatan manusia baik dengan melakukan manipulasi dan juga penganalisisan terhadap gambar. Operasi image preprocessing dapat dikelompokan berdasarkan tujuan transformasinya. 2.4.1 Grayscale



Grayscale adalah istilah untuk menyebutkan satu citra yang memiliki warna abu-abu, hitam, dan putih. Grayscale adalah koleksi atau kisaran corak monokromik (abu-abu), mulai dari putih murni di ujung yang paling terang hingga hitam murni di ujung yang berlawanan. Citra grayscale adalah citra yang hanya memiliki 1 buah kanal sehinga yang ditapilan hanyalah nilai intensitas atau dikenal juga dengan istilah derajat keabuan. Karena jenis citra ini hanya memiliki 1 kanal saja, maka citra grayscale memiliki tempat penyimpanan yang lebih hemat. Jenis citra ini disebut juga sebagai 8-bit. Foto hitam putih maupun gambar yang ditampilkan oleh televisi hitam putih sebenarnya meggunakan citra grayscale, bukan dalam warna hitam dan warna putih. Namun dikalagan masyarakat istilah foto hitam putih maupun televisi hitam putih sudah terbiasa digunakan falam kehidupan sehari-hari [9]. Secara teori ada beberapa cara dalam mengonversi citra berwarna RGB ke dalam citra grayscale. Untuk mendapatkan hasil konversi yang baik, persamaan berikut dapat digunakan GS=0.299 R '+0.587G'+ 0.114B' Keterangan : GS



: Citra grayscale



R’



: Komponen merah dari citra RGB



G’



: Komponen hijau dari citra RGB



B’



: Komponen biru dari citra RGB



( 0.0 )



2.4.2 Thresholding Citra biner atau citra hitam putih adalah citra yang hanya memiliku 2 kemungkinan nilai untuk setiap pikselnya, yaitu 0 atau 1. Nilai 0 akan tampil sebagai sebagai warna hitam sedangkan nilai 1 akan tampil sebagai warna putih. Maka dari itu, jenis citra ini hanya membutuhkan 1-bit untuk menyimpan setiap nilai pada setiap pikselnya. Jenis citra ini sering digunakan untuk proses masking ataupun proses segmentasi citra [9]. Proses thresholding digunakan untuk mengekstrak foreground (tinta) dan background (kertas) dan mengubah menjadi citra biner. Proses



thresholding mengubah warna gambar menjadi citra biner (binary image) dimana ditentukan sebuah nilai level threshold kemudian piksel yang memiliki nilai level dibawah level threshold di set menjadi warna putih (1 pada nilai biner) dan nilai diatas nilai threshold di set menjadi warna hitam (0 pada nilai biner). 2.4.3 Resize Resize adalah proses yang digunakan untuk mengubah ukuran citra digital dalam piksel, baik menjadi lebih kecil atau lebih besar dari ukuran sebenarnya. Proses resize pada penelitian ini tidak memerlukan metode khusus, caranya hanya dengan dilakukan perbandingan ukuran antara citra hasil thresholding (pada tahap latih) dan hasil segmentasi (pada tahap uji) dengan menggunakan persamaan ( 0 .0 ) untuk mendapatkan posisi koordinat dari titik x yang baru dan persamaan ( 0 .0 ) untuk mendapatkan posisi koordinat dari titik y yang baru[9]. Dimana kedua persamaan tersebut adalah sebagai berikut. Xbaru=



pb × pp pa



( 0.0 )



Keterangan: Xbaru



= Posisi koordinat x baru



pb



= Ukuran panjang dari matriks baru



pp



= Posisi koordinat x lama



pa



= Ukuran panjang dari matriks lama Untuk mencari koordinat y yang baru, digunakan persamaan ( 0 .0 ) sebagai



berikut. Ybaru=



lb × pp la



Keterangan: Ybaru = Posisi koordinat y baru lb



= Ukuran lebar dari matriks baru



pp



= Posisi koordinat y lama



( 0.0 )



la



= Ukuran lebar dari matriks lama Pada penelitian ini resize digunakan untuk merubah ukuran pixel sesuai dengan



kebutuhan dalam melakukan proses ektraksi ciri. Hal ini dilakukan agar semua citra karakter dari hasil segmentasi mempunyai ukuran yang sama (normalisasi ukuran citra) sebelum masuk ke tahap ekstraksi fitur. 2.5 Segmentasi Segmentasi bertujuan untuk memotong huruf per-huruf. Pemotongan tersebut dilakukan dengan cara mencari pixel-pixel terluar dari setiap sisi (atas, bawah, kiri, kanan). Pixel-pixel terluar itulah yang akan menjadi batas pemotongan, sehingga didapat citra segiempat yang siap diproses lebih lanjut. 2.5.1 Profile Projection Metode Profile Projection digunakan untuk memisahkan tulisan perbaris dan perkarakter. Metode Profile Projection akan menghitung jumlah piksel nonbackground secara vertikal dan horizontal dan nilai tersebut akan dibandingkan dengan nilai ambang tertentu untuk memisahkan tulisan perbaris dan perkarakter [10].



2.5.1.1 Horizontal Profile projection Horizontal Profile Projection adalah jumlah banyaknya piksel hitam yang tegak lurus dengan sumbu x. Horizontal Profile Projection dipresentasikan dengan suatu vektor Ph berukuran M. Horizontal Profile Projection pada kolom ke-j, yaitu Ph[j], didefinisikan sebagai berikut : N



Ph [h]=∑ S [i, j] j=1



2.5.1.2 Vertical Profile Projection



( 0.0 )



Vertical Profile Projection adalah jumlah banyaknya piksel hitam yang tegak lurus dengan sumbu y. Vertical Profile Projection dipresentasikan dengan suatu vektor Pv berukuran N. Vertical Profile Projection pada baris ke-I, yaitu Pv[i], didefinisikan sebagai berikut :



M



Pv [v ]=∑ S[i , j]



( 0.0 )



i=1



Keterangan : S



: Citra Biner



M



: Banyak kolom pada citra



N



: Banyak baris pada citra



2.6 Ekstraksi Fitur Ekstraksi fitur bertujuan untuk mendapatkan karakteristik suatu karakter yang membedakan dari karakter lain. dalam penelitian ini, untuk mendapatkan karakteristik dengan cara memasukan nilai pixel gambar ke dalam sebuah vektor atau array 1 dimensi. Sebelum dimasukkan ke array, pixel diubah terlebih dahulu menjadi nilai 1 dan 0 dimana 1 mewakilkan warna putih dan 0 mewakilkan warna hitam pada gambar. 2.6.1



Zone Based Feature Extraction Zoning adalah salah satu ekstraksi fitur yang paling popular dan sederhana untuk diimplementasikan [11]. Setiap citra dibagi menjadi N x M zona dan dari setiap zona tersebut dihitung nilai fitur sehingga didapatkan fitur dengan panjang N x M. Salah satu cara menghitung nilai fitur setiap zona adalah dengan menghitung jumlah piksel hitam setiap zona dan membaginya dengan jumlah piksel hitam terbanyak pada yang terdapat pada salah satu zona. Contoh pembagian 3 zona pada citra biner dapat dilihat dari Gambar 0 . 3.



Gambar 0.3 Pembagian Zona pada Citra Biner Metode ekstraksi fitur berbasis zona memberikan hasil yang baik bahkan ketika langkah sebelum proses tertentu dimulai seperti filtering. Smoothing dan menghapus zona yang dianggap tidak ada. Konsep metode ekstraksi ciri yang digunakan untuk mengekstraksi fitur untuk klasifikasi yang efisien dan pengenalan yaitu : 1. Hitung centroid dari citra. Menghitung centroid dari citra biner masukan dengan persamaan ( 0 .0 ) dan ( 0 .0 ). Rumus mencari centroid X C x=



(x 1 . p1 + x 2 . p2 +…+ x n . pn ) (p 1+ p 2+ …+ pn)



( 0.0 )



Rumus mencari centroid Y C y=



( y 1 . p1 + y 2 . p2 +…+ y n . pn) ( p1 + p2 +…+ p n) Keterangan : a.



Cx



= centroid koordinat x



b.



Cy



= centroid koordinat y



c.



Xn



= koordinat x dari piksel ke-n



( 0.0 )



d.



Yn



= koordinat y dari piksel ke-n



e.



Pn



= nilai piksel ke-n



2. Bagi matriks kedalam n buah zona yang sama besar proporsinya. 3. Hitung jarak antara titik centroid dengan koordinat pixel yang memiliki nilai. Persamaan untuk menghitung jarak piksel. ( 0.0 )



d ( P ,C )=√ ¿ ¿ Keterangan : a.



d



= jarak antara dua titik



b.



P



= koordinat piksel



c.



C



= koordinat centroid



d.



Xp



= koordinat piksel X



e.



Yp



= koordinat piksel Y



f.



Cx



= koordinat centroid X



g.



Cy



= koordinat centroid Y



4. Ulangi langkah 3 untuk pixel yang ada di semua zona. 5. Hitung rata-rata dari jarak yang telah didapat pada langkah 3. rerata jarak=∑



d (P ,C ) ∑P



( 0.0 )



6. Ulangi langkah 5 hingga didapat masing-masing rata-rata jarak dari setiap zona. 7. Akhirnya n buah fitur akan didapat untuk melakukan klasifikasi dan pengenalan



2.7 Pemodelan Sistem Suatu sistem yang memiliki beberapa proses di dalamnya harus dimodelkan untuk memperjelas gambaran yang terjadi pada proses tersebut. Berikut pemodelan



sistem yang digunakan pada penelitian ini, yang terdiri dari Blok Diagram, DFD, Diagram Konteks, dan Flowchart. 2.7.1 Data Flow Diagram Model diagram yang dapat menggambarkan keterkaitan proses yang ada pada sistem secara mendalam dapat dibuat dengan menggunakan diagram Data Flow Diagram (DFD). DFD adalah suatu model logika data atau proses yang dibuat untuk menggambarkan darimana asal data, dan kemana tujuan data yang keluar dari sistem, dimana data disimpan, proses apa yang menghasilkan data tersebut, dan interaksi antara data yang tersimpan, dan proses yang dikenakan pada data tersebut [12]. Terdapat 4 simbol utama pada DFD yang terdiri dari: 1. Entitas Luar (External Entity) Entitas luar digunakan untuk menyatakan departemen, kantor, organisasi, orang, maupun sekelompok orang. 2. Arus Data (Data Flow) Arus data digunakan untuk menggambarkan masukan maupun keluaran dari proses. 3. Proses (Process) Proses digunakan untuk menggambarkan pekerjaan yang dilakukan oleh manusia maupun sistem. 4. Simpanan Data (Store Data) Simpanan data digunakan untuk penyimpanan data dari suatu sistem maupun memanggil suatu data dari simpanan data 2.7.2 Diagram Konteks Suatu model sistem yang belum dilakukan analisis secara mendalam terhadap proses yang terdapat pada sistem, dinamakan dengan diagram konteks. Diagram konteks merupakan bagian dari Data Flow Diagram (DFD) yang hanya memiliki satu simbol. Istilah lain diagram konteks adalah context diagram yang merupakan top level pada penggambaran Data Flow Diagram (DFD). Diagram konteks memiliki karakteristik, yaitu: 1. Hanya mengandung satu proses saja. 2. Tidak diberikan penomoran khusus pada prosesnya.



3. Semua arus data dan datanya sendiri digambarkan secara jelas. Pada penelitian ini, diagram konteks digunakan untuk menjelaskan alur masukan, proses dan keluaran data secara menyeluruh. 2.8 RSVM (Reduced Support Vector Machines) Support Vector Machine merupakan metode berbasis machine learning yang sangat menjanjikan untukdikembangkan karena memiliki performansi tinggi dan dapat diaplikasikan secara luas untuk klasifikasi dan estimasi. SVM memanfaatkan optimasi dengan quadratic programming, sehingga untuk data berdimensi tinggi dan berjumlah besar, SVM menjadi kurang efisien. Untuk mengatasi hal tersebut, dikembangkan Smooth Support Vector Machine (SSVM). Pada jumlah data yang besar SSVM juga tidak efisien kemudian dikembangkan Reduced Supp3ort Vector Machine (RSVM) yang melakukan klasifikasi dengan menggunakan sebagian karakteristik dari data yang dipilih secara random. [13] Terdapat dua masalah besar dalam klasifikasi data besar yang non linier, yang pertama kesulitan komputasi dalam memecahkan masalah optimasi tanpa kendala dan melibatkan fungsi kernel yang membutuhkan memori sangat besar. Pada umumnya komputer mengalami out of memory bahkan sebelum dimulai proses pencarian solusi. Yang kedua kesulitan dalam menggunakan formula yang tidak terlihat, untuk bidang pemisah . untuk menyelesaikan masalah tersebut muncul sebuah ide menyelesakan bidang pemisah non linier pada data besar dengan hanya menggunakan sebagian karakteristik dari data. Hal inilah yang mengawali ide dasar dari RSVM. Dengan formulasi data penuh (full set) A ∈ R mxn dengan square kernel



K ( A , A¿¿ T )∈ R mxn ¿



dimodifikasi sedemikian hingga reduced dataset



A ∈ R mxn dengan diagonal matriks D



dan matriks



kernel . Selanjutnya



algoritma tersebut diselesaikan dengan smoothing technique. Hasil modifikasi tersebut dirumuskan dengan menggantikan



dengan



sebagai berikut



(1) dengan kendala T D(K( , A A Du e )   )   y e dan y ≥ 0. Persamaan (1) diatas menghasilkan solusi untuk masalah penggunaan matriks yang besar dan waktu pemrosesan data. Menurut Lee dan Mangasarian (2001) pada [9] menyebutkan bahwa secara garis besar algoritma RSVM dapat dituliskan sebagai berikut: 1. Memilih



matriks ∈ R mxn dari matriks awal A ∈ R mxn secara random



subset



dengan



sebesar 1% hingga 10%.



2. Menyelesaikan



persamaan



SSVM



yang



telah dimodifikasi berikut dan



diselesaikan dengan algoritma Newton-Armijo dimana AT digantikan oleh dengan



. (2)



3. Pada



persamaan (2) di atas bidang pemisah dengan AT



digantikan oleh



sehingga adalah solusi unik dari persamaan 2.18 dan ∈ R n



yang merupakan variabel input untuk data yang baru. 2.9 Pengujian Sistem Pengujian sistem adalah proses pemeriksaan atau evaluasi sistem atau komponen sistem secara manual atau otomatis untuk memverifikasi apakah sistem memenuhi kebutuhan-kebutuhan yang dispesifikasikan atau mengidentifikasi perbedaan-perbedaan antara hasil yang diterapkan dengan hasil yang terjadi [14] Pengujian seharusnya meliputi tiga konsep berikut : 1. Demonstrasi validasi perangkat lunak pada masing-masing tahap diskusi pengembangan sistem. 2. Penentuan validitas sistem akhir dikaitkan dengan kebutuhan pemakai.



3. Pemeriksaan prilaku sistem dengan mengeksekusi sistem pada data sample pengujian. Pada dasarnya pengujian diartikan sebagai aktivitas yang dapat atau hanya dilakukan setelah pengkodean (kode program selesai). Namun, pengujian seharusnya dilakukan dalam skala lebih luas. Pengujian dilakukan bagitu skesifikasi kebutuhan telah dapat didefinisikan. Evaluasi terhadap spesifikasi dan perancangan juga merupakan teknik pengujian. Kategori pengujian dapat dikategorikan menjadi dua, yaitu : 1. Berdasarkan ketersediaan logic sistem, terdiri dari Black Box testing dan White Box testing. 2. Berdasarkan arah pengujian, terdiri dari top down dan pengujian Bottom up. 2.9.1 Pengujian Blackbox Konsep black box digunakan untuk mempresentasikan sistem yang cara kerja di dalamnya tidak tersedia untuk diinspeksi. Dalam black box, item-item yang diuji dianggap “gelap” karena logiknya tidak diketahui, yang diketahui hanya apa yang masuk dana pa yang keluar dari black box. 2.9.2 Pengujian Akurasi Akurasi merupakan seberapa dekat suatu angka hasil pengukuran terhadap angka sebenarnya (true value dan reference value). Tingkat akurasi diperoleh dengan persamaan sebagai berikut [22] : jumlah karakter sama ×100 % jumlah seluruh karakter 2.10 Python Akurasi=



( 0.0 )



Python adalah Bahasa pemrograman bersifat umum. Python diciptakan pada tahun 1990 oleh Guido van Rossum. Bahasa level tinggi, stabil, dinamis, orientasi objek dan cross platform adalah karakteristik yang membuat Bahasa python disukai oleh banyak pengembang. Tidak seperti bahasa lain yang susah untuk dibaca dan dipahami, python lebih menekankan pada keterbacaan kode agar lebih mudah untuk memahami sintaks. Hal ini membuat python sangat mudah dipelajari baik untuk



pemula maupun untuk yang sudah menguasai Bahasa pemrograman lain. Bahasa pemrograman python berjalan dikebanyakan hardware dan system operasi, sehingga kebanyakan computer bias menjalankannya. Bahasa pemrograman Python saat ini dikembangkan dan dikelola oleh suatu tim relawan dengan nama Python Software Foundation [15].



BAB 3 ANALISIS DAN PERANCANGAN 3.1Analisis Masalah Pada bab ini akan dibahas tentang analisis. masalah berdasarkan latar belakang dan rumusan masalah yang telah dipaparkan pada bab 1. Adapaun masalahnya adalah belum diketahui ada atau tidaknya kecocokan metode OCR dan algoritma Reduced Support Vector Machine (RSVM) pada ektraksi informasi surat keputusan dan nilai presisi, recall, dan akurasinya. Penelitian sebelumnya mengenai OCR oleh Aldi Setiawan mengangkat masalah utama yaitu tidak efisiennya penggunaan kamus cetak untuk mencari arti dari suatu kata. Hasil akurasi dari penelitian ini diperoleh bahwa OCR cocok digunakan untuk mencari arti dari suatu jata dikamus [2] penelitian sebelumnya yang dilakukan oleh Epa Suryanto dan Santi Wulan Purnami membahas tentang perbangingan antara SVM dengan RSVM, diperoleh hasil bahwa RSVM memperoleh hasil akurasi sebesar 99% [3]. 3.2Analisis Sistem Analisis sistem ini dilakukan agar setiap tahapan dalam perancangan ini dapat diperjelas secara detail sehingga pembangunan perangkat lunak dapat berjalan. Pada penelitian ini tahapan yang digunakan dibagi menjadi dua bagian, yaitu bagian pelatihan dan pengujian dalam pengenalan tulisan dari citra dokumen surat keputusan. Berikut gambaran tentang tahapan yang digunakan :



Gambar 3.1 Gambaran Sistem Pada Gambar 3.1 tahapan alur sistem terbagi menjadi dua bagian yaitu tahapan pelatihan dan tahapan pengujian. Dalam tahap pelatihan data dari citra latih di unggah oleh pengguna akan masuk pada proses preprocessing dan ekstraksi fitur menggunakan metode zoning, pada proses preprocessing terdiri dari grayscaling, thresholding, segmentasi dan resize. Setelah mealui preprocessing dan ekstraksi fitur, citra latih akan digunakan sebagai masukan untuk metode pengenalan RSVM. Dalam tahapan pengujian citra uji memasuki tahapan preprocessing, thresholding, segmentasi, binerisasi dan ekstraksi fitur zoning. Setelah itu data dari kemudian



akan



melalui



proses



pengenalan



menggunakan



metode



citra uji RSVM



menggunakan persamaan yang sama dengan perhitungan bobot pada proses pembelajaran RSVM.



3.2.1



Analisis Data Masukan



Data masukan yang digunakan pada sistem adalah berupa citra alfabet dengan jenis font Times New Roman dengan ukuran 15 x 15 piksel. Tabel 0.1 Contoh Data Latih Citra



Keterangan Contoh citra S Contoh citra K Contoh citra 1



Dan berikut adalah citra yang akan digunakan sebagai contoh dalam pelatihan, citra huruf S dengan ukuran 15 x 15 piksel.



Gambar 0.4 Contoh Data Latih Untuk data masukan yang digunakan pada tahap pengujian adalah berupa citra hasil foto atau scan dari Surat Keputusan, berikut adalah contoh masukan citra data uji.



Gambar 0.5 Contoh Surat Keputusan



3.3 Analisis Proses Analisis proses adalah salah satu tahapan untuk menganalisis suatu cara atau menganilis metode-metode yang akan digunakan. 3.3.1



Analisi Proses Pelatihan Analisis proses pelatihan terbagi menjadi beberapa tahapan, yaitu



mengunggah citra data latih, preprocessing pelatihan, ekstraksi fitur Zoning dan pelatihan RSVM. Preprocessing dilakukan untuk mengolah, memperbaiki kualitas gambar dan menghilangkan bagian yang tidak penting. Adapun tahapan proses pada preprocessing pelatihan dapat dilihat pada Gambar 3.4 berikut.



Gambar 3.4 Proses Preprocessing Pelatihan Dan berikut adalah citra yang akan digunakan sebagai contoh dalam pelatihan, citra huruf S dengan ukuran 15 x 15 piksel.



Gambar 0.6 Contoh Data Latih Dan berikut ini adalah tabel matriks RGB dari citra data latih. Tabel 0.2 Matriks RGB citra latih x/y



0



1



0



[R = 225 G = 225 B = 225]



[R = 225 G = 225 B = 225]



1



[R = 255 G = 255 B = 255]



[R = 221 G = 221 B = 221]



2



3







14



[R = 170 G = 170 B = 170]



[ R =156 G = 156 B = 156]







[R = 255 G = 255 B = 255]



[R = 38 G = 38 B = 38]



[R=0 G=0 B = 0]







[R = 255 G = 255 B = 255]



[R = 244 G = 244 B = 244]



[R = 39 G = 39 B = 39]



[R = 0 G=0 B = 0]



[R = 140 G = 140 B = 140]







2



[R = 255 G = 255 B = 255]



[R = 0 G=0 B = 0]



[R = 0 G=0 B = 0]



[ R = 87 G = 87 B = 87]







3



[R = 184 G = 184 B = 184]



[R = 255 G = 255 B = 255]



… [R = 170 G = 170 B = 170]



… [R = 184 G = 184 B = 184]



… [ R = 255 G = 255 B = 255]



… [R = 170 G = 170 B = 170]



  …



… [R = 255 G = 255 B = 255]



… 14



3.3.1.1 Grayscale Proses grayscale dilakukan untuk mengubah mode citra RGB atau RGBA menjadi grayscale. Nilai citra dari setiap piksel pada citra akan diambil yang kemudian akan dihitung dengan rumus ( 0 .0 ). Nilai citra tergantung dari mode citra yang dimasukan pada pelatihan. Nilai citra bias mempunyai tiga buah nilai pada citra dengan mode RGB (Red,Green,Blue) ataupun empat nilai pada citra dengan mode RGBA (Red,Green,Blue,Alpha). Gambar 0 . adalah alur dari proses grayscale.



Gambar 0.3 Proses Grayscale Citra Adapun langkah-langkah yang dilakukan sebagai berikut : 1.



Warna citra dihitung dan dikelompokkan berdasarkan nilai RGB, pada Error: Reference source not found2 citra uji yang digunakan, dilakukan contoh perhitung pada koordinat (0,0) nilai RGB didapat sebesar R=255, G=255, dan B=255.



2.



Kemudian dihitung menggunakan persamaan ( 0 .0 ) maka akan didapatkan nilai warna grayscale citra. Maka hasil perhitungan grayscale didapat sebesar GS=0,299 ( R ) +0,587(G)+0,114(B) = 0,299(255) + 0,587(2 55 ) + 0,114(255 ) = 76.245 + 149,685 + 29.07



=255 Dari hasil perhitungan tersebut maka di dapat nilai derajat keabuan atau nilai grayscale. Perthitungan tersebut dilanjutkan hingga seluruh piksel dari cira data latih diubah menjadi nilai grayscale hingga membentuk matix. Tabel berikut merupakan contoh matrix dari data latih setelah melalui proses grayscale. Tabel 3.3 Matrix Hasil Grayscale citra Data Latih x/y 0 0 25 5 1 25 5 2 24 4 3 18 4 4 18 4 5 23 3 6 25 5 7 25 5 8 25 5 9 25 5 10 17 0 11 17 0 12 17 0 13 17 0 14 17 0



1 2 255 17 0 221 38



3 15 6 0



39



0



0



0



14 0 87



0



0



0



0



0



0



156 25 5 255 25 5 255 25 5 88 20 9 0 0



184 0



0



0



255 10 7 255 25 5 255 25 5 221 25 5 107 25 5 0 38



10 7 25 5 25 5 25 5 25 5 25 5 38



0



0



0



184 25 5



17 0



4 88



5 0



125



0



255 25 5 255 25 5 255 25 5 255 25 5 66 17 0 0 0



0



0



0



0



9 17 0 12 5 25 5 25 5 25 5 25 5 10 7 0



0



0



0



0



0



0



12 10 7 10 7 10 7 10 7 14 1 25 5 25 5 22 1 28



107 0



0



0



0



66



255



255 17 0 255 25 5 255 25 5 255 17 0 0 88



38



0



0



66



255



170 0



0



66



255



170 0



0



125 255



0



19 7 25 5



255 255



156 15 6 255 25 5 255 25 5 255 25 5 255 25 5 170 25 5 170 38



6 0



7 0



255 18 4 255 25 5 255 25 5 255 25 5 255 25 5 0 0



8 66



255 255 255 255 0



10 11 255 25 5 0 0 209 0 255 10 7 255 25 5 255 25 5 197 25 5 0 88



38



170 25 5



13 14 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 125 255



255 255



3.3.1.2 Thresholding Setelah diubah menjadi citra grayscale, dilakukan metode thresholding untuk citra uji, yaitu mengubah nilai matriks grayscale sesuai dengan nilai threshold. Nilai yang digunakan dalam metode threshold yaitu 0, dan 255. Nilai 0 untuk nilai piksel < 128 dan nilai 255 untuk nilai piksel > 128.dilakukannya proses threshold untuk memudahkan proses segmentasi. Berikut adalah langkah-langkah metode thresholding : 1. Pertama-tama lakukan pengambilan piksel dimulai dari piksel (0,0). Pada tahapan thresholding, citra yang digunakan merupakan citra yang sudah melalui proses grayscale, citra hasil grayscale memiliki 1 nilai disetiap satu pikselnya, nilai tersebut yang nantinya akan digunakan untuk proses thresholding. 2. Sudah dilakukan pengambilan piksel, maka lakukan perhitungan pada nilai tersebut menggunakan persamaan. Berdasarkan gambar dapat dilihat bahwa nilai grayscale pada piksel (0,0) adalah 255. Nilai 255 > 128 maka nilai binernya adalah 255. Hal ini akan dilakukan hingga piksel terakhir. Berikut adalah citra hasil binerisasi.



Tabel 3.3 Matriks Hasil Threshold Data Latih x/y 0 0 0



1 0



2 0



3 0



1



0



0



2



0



255



3



0



255



4



0



255



5



0



255



6



0



0



7



0



0



8



0



0



25 5 25 5 25 5 25 5 25 5 25 5 25 5 0



25 5 25 5 25 5 25 5 25 5 25 5 25 5 0



9



0



0



0



0



0



10



0



0



0



0



11



0



255 0



12



0



13



0



14



0



255 25 5 255 25 5 0 0



3.3.1.3 Binerisasi



4 5 255 25 5 0 0



6 7 255 25 5 0 0



0



0



0



0



8 9 255 25 5 0 25 5 0 0



0



0



0



0



0



0



255 0



0



0



0



255 25 5 255 25 5 255 25 5 0 0



255 0



0



0



355 25 5 255 25 5 255 25 5 0 0



0



0



0



0



255 25 5 255 25 5 255 25 5 255 25 5 0 0



0



0



0



0



0



0



0



0



0



0



0



0



0



0



25 5 25 5



255 0



0



0



0



0



255 25 5



255 25 5



13 0



14 0



0



0



0



0



0



0



0



255 25 5 0 25 5 0 25 5 0 0



12 25 5 25 5 25 5 25 5 0



0



0



0



0



0



0



0



0



0



0



0



0



0



0



0



0



25 5 25 5 25 5 25 5 25 5 25 5 0



0



0



255 25 5



10 0



11 0



255 25 5 255 25 5 255 25 5 255 25 5 0 25 5 0 25 5 255 25 5 255 0



255 0 255 0 255 0 255 0 0



0



0



0



Proses pengolahan citra menjadi citra biner atau citra hitam putih. Citra yang diubah ke nilai binerisasi output hasil dari proses grayscale. Cara yang digunakan untuk menghasilkan citra biner dengan melakukan perbandingan, apabila nilai piksel lebih besar dari nilai ambang batas, maka ubah menjadi nilai 0, dan apabila tidak maka nilai akan diubah menjadi 1. Berdasarkan penelitian sebelumnya[ CITATION Okt17 \l 1033 ], terdapat 3 nilai ambang batas di dalam pengujiannya, yaitu nilai tengah, nilai minimum dan nilai maksimum. Nilai tengah adalah 128, nilai minimum diambil dari nilai tengah dibagi 2 sehingga nilai minimum adalah 64, sedangkan nilai maksimum adalah 128 ditambah 64 sehingga hasilnya adalah 192. Penelitian tersebut menyatakan bahwa nilai tengah mempunyai hasil warna lebih jelas ketika dibandingkan dengan nilai minimum dan maksimum[ CITATION Okt17 \l 1033 ]. Tabel 3.4 Matriks Hasil Binerisasi Data Latih x/ y 0



0 0 0 0 1 1 1 1 1 1



1 0 0



1 1 0



1 2 1



1 3 0



1 4 0



1



0 0 1 1 0 0 0 0 0 1



1



1



1



0



0



2



0 1 1 1 0 0 0 0 0 0



0



1



1



0



0



3



0 1 1 1 0 0 0 0 0 0



0



1



1



0



0



4



0 1 1 1 1 0 0 0 0 0



0



0



0



0



0



5



0 1 1 1 1 1 1 0 0 0



0



0



0



0



0



6



0 0 1 1 1 1 1 1 1 1



0



0



0



0



0



7



0 0 1 1 1 1 1 1 1 1



1



1



0



0



0



8



0 0 0 0 0 0 1 1 1 1



1



1



1



0



0



9



0 0 0 0 0 0 0 0 1 1



1



1



1



1



0



10



0 0 0 0 0 0 0 0 0 0



1



1



1



1



0



11



0 1 0 0 0 0 0 0 0 0



0



1



1



1



0



12



0 1 1 0 0 0 0 0 0 0



0



1



1



1



0



13



0 1 1 1 1 0 0 0 0 0



1



1



1



0



0



14



0 0 0 1 1 1 1 1 1 1



1



0



0



0



0



0 1 2 3 4 5 6 7 8 9



3.3.Zone Based Feature Extraction Setelah dilakukan proses segmentasi dan resize, maka tahapan selanjutnya yaitu proses zoning. Proses zoning bertujuan untuk memberikan bobot nilai fitur dari setiap karakter yang telah dipisah-pisah. Adapun langkah-langkah yang dilakukan sebagi berikut : 1. Hitung nilai centroid pada citra masukan, seperti pada persamaan ( 0 .0 ) dan ( 0 . 0 ) Nilai yang menjadi masukan pada persamaan diatas adalah hasil dari proses binerisasi. Citra yang akan digunakan adalah citra dengan huruf S seperti pada Error: Reference source not found. Berikut adalah contoh perhitungan pada persamaan diatas. C y= ¿



( y 1 . p1 + y 2 . p2 +…+ y n . pn) ( p1 + p2 +…+ p n)



( ( 0.0 ) + ( 1.1 ) + ( 1.2 ) +…+(1.14)) (92) ¿7



C y=



( x 1 . p1 + x 2 . p 2+ …+ x n . pn ) ( p 1+ p2 +…+ p n)



¿ ( 0.7 )+ ( 1.6 )+ ( 1.7 ) +…+(1.14)¿ ¿ (92) ¿7 2. Setelah mendapatkan nilai centroid dari citra, kemudian citra dibagi menjadi tiga zona dengan ukuran sama besar, yaitu zona atas, zona tengah dan zona bawah. Karena citra masukan memiliki ukuran 15 x 15 piksel maka, setiap zona memiliki ukuran 15 x 5 piksel. Berikut adalah gambaran setelah dibagi menjadi tiga zona.



Tabel 3.5 Matriks citra Uji Setelah di bagi 3 zona x/y 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14



0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0



1 0 0 1 1 1 1 0 0 0 0 0 1 1 1 0



2 0 1 1 1 1 1 1 1 0 0 0 0 1 1 0



3 0 1 1 1 1 1 1 1 0 0 0 0 0 1 1



4 1 0 0 0 1 1 1 1 0 0 0 0 0 1 1



5 1 0 0 0 0 1 1 1 0 0 0 0 0 0 1



6 1 0 0 0 0 1 1 1 1 0 0 0 0 0 1



7 1 0 0 0 0 0 1 1 1 0 0 0 0 0 1



8 1 0 0 0 0 0 1 1 1 1 0 0 0 0 1



9 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1



10 0 1 0 0 0 0 0 1 1 1 1 0 0 1 1



11 0 1 1 1 0 0 0 1 1 1 1 1 1 1 0



12 1 1 1 1 0 0 0 0 1 1 1 1 1 1 0



13 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0



14 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0



3. Hitung jarak piksel yang mempunyai nilai 1 dari centroid, menggunakan persamaan ( 0 .0 ). d ( P ,C )=√ ¿ ¿ Berikut adalah contoh perhitungan dari persamaan diatas. Zona 1 (Atas) : d (( 4,0),( 7,7) )=√ ¿ ¿ Zona 2 (Tengah) : d ((5,4 ),(7,7)) =√ ¿ ¿



Zona 3 (Bawah) : d ((10,10),(7,7) )= √ ¿ ¿



4. Setelah semua jarak setiap piksel ke centroid pada setiap zona dihitung, selanjutnya perhitungan rerata jaraknya menggunakan persamaan ( 0 .0 ). Zona 1 (Atas) : rerata jarak=



jarak ( ( 4 , 0 ) , ( 7,7 ) ) +…+ jarak ( ( 4,4 ) , ( 7,7 ) ) 7,616+…+ 4,234 = Banyak titik 27



¿ 6,7729 Zona 2 (Tengah) : rerata jarak=



jarak ( (1,5 ) , ( 7,7 ) ) + …+ jarak ( ( 13 , 9 ) , ( 7,7 ) ) 6,325+…+ 6,326 = Banyak titik 37



¿ 3 , 0767 Zona 3 (Bawah) : rerata jarak= ¿



jarak ( (10,2 ) , ( 8,8 ) ) +…+ jarak ( 14,14 ) Banyak titik



4,234+ …+7,616 29



¿ 6,9775 5. Didapatkan 3 nilai ciri pada data masukan yang berbeda pada setiap zona, berikut adalah nilai ketiga zona : Zona 1 (Atas)



= 6,7729



Zona 2 (Tengah)



= 3,0767



Zona 3 (Bawah)



= 6,9775



Vektor ciri karakter citra uji : [6,7729; 3,0767; 6,9775]