Algoritma Bayesian Networks [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

Muh. Yusuf – D42111011 Zulkifli – D42115701 Soal: 1. Jelaskan dan berikan contoh dari data Nominal dan Numerik. 2. Jelaskan Langkah-langkah dari Algoritma Data Mining yang anda ambil. Jawab 1.1. Data Nominal Data Nominal biasa disebut data skala nominal adalah data yang diperoleh dengan cara kategorisasi atau klasifikasi. Contoh: Jenis pekerjaan, diklasifikasi sebagai: 1. Pegawai negeri, diberi tanda 1, 2. Pegawai swasta, diberi tanda 2, 3. Wiraswasta, diberi angka 3 Ciri Data Nominal:  



Posisi data setara. Dalam contoh tersebut, pegawai negeri tidak lebih tinggi/lebih rendah dari pegawai swasta. Tidak bisa dilakukan operasi matematika (X, +, - atau : ). Contoh, tidak mungkin 3-2=1 (Wiraswasta dikurangi pegawai swasta=pegawai negeri



1.2. Data Numerik Tipe Data Numeric adalah Tipe data yang digunakan pada variabel atau konstanta untuk menyimpan nilai dalam bentuk bilangan atau angka baik angka atau bilangan tersebut merupakan bilangan bulat ataupun bilangan real. Sourch Code Tipe Data Numeric : $jumlah=10; $harga=2000; $total=$jumlah*$harga; //variabel $total akan menyimpan hasil 20000 Tipe data Numeric/Number terbagi menjadi 2 bagian antara lain : 



Tipe Bilangan Bulat



Tipe Bilangan Bulat adalah tipe bilangan yang hanya dapat menampung data bernilai positif, negatif dan nol ( 0 ). Didalam tipe bilangan bulat sendiri sebenarnya masih dapat terbagi lagi menjadi beberapa golongan berdasarkan rentang datanya. Misalnya, jika yang digunakan adalaha bahasa pemrograman java maka tipe bilangan bulat dibagi menjadi sebagai berikut :



Tipe Data



Ukuran (bit)



Range



Byte



8



-128 s.d. 127



Short



16



-32768 s.d. 32767



Int



32



-2147483648 s.d. 2147483647



Long



64



-9223372036854775808 9223372036854775807







s.d.



Tipe Bilangan Pecahan



Tipe Bilangan Pecahan adalah tipe bilangan yang hanya dapat menampung data bernilai positif, negatif, nol, yang bernilai pecahan. Didalam tipe bilangan pecahan sendiri sebenarnya masih dapat terbagi lagi menjadi beberapa golongan berdasarkan rentang datanya. Misalnya, jika yang digunakan adalaha bahasa pemrograman java maka tipe bilangan bulat dibagi menjadi sebagai berikut : Tipe



Ukuran



Range



Presisi (jumlah digit)



bytes



bit



float



4



32



+/- 3.4 x 1038



6-7



double



8



64



+/- 1.8 x 10308



15



2. Algoritma Bayesian Networks Bayesian Network / Belief Netwok / Probalilistik Network merupakan sebuah model grafik untuk merepresentasikan sebuah interaksi antar variable. Adapun Bayesian Netwok itu sendiri digambarkan seperti graf yang terdiri dari simpul (node) dan busur (arc). Simpul akan menunjukan variable, misalnya X beserta nilai probalilitasnya p(x) dan busur akan menunjukan hubungan antar simpul. Jika ada hubungan dari simpul X ke simpul Y, ini akan mengindikasikan bahwa variable X ada pengaruhnya terhadap variable Y, dan pengaruh itu dinyatakan dengan peluang bersyarat P(Y|X). Bayesian Networks juga dapat di artikan sebagai suatu metode pemodelan data berbasis probabilitas yang merepresentasikan suatu himpuan variabel dan conditional interdependenciesnya melalui suatu DAG (Directed Acyclic Graph). Dalam proses pencarian model data menggunakan Bayesian Networks ini adalah dua proses yang dilakukan yaitu parameter learning dan structure learning. Structure learning umumnya dilakukan dengan proses try and error, dengan model dari semua node ke model hasil atau dari satu node ke model hasil. Umumnya metode yang banyak digunakan adalah metode pertama, dimana semua node dan kaitan antar mereka dimunculkan dan kemudian menguji



semua kaitan serta menghilangkan kaitan yang tidak mempunyai nilai keterkaitan yang tinggi. Parameter learning umumnya dilakukan bersamaan dengan pelaksanaan proses structure learning. Proses structure learning dan parameter learning dilakukan dengan memanfaatkan data yang dimiliki sebagai training data. Perbedaan dari Naïve Bayes dengan Bayesian Network adalah pada Naïve Bayes mengabaikan korelasi antar variable, sedangkan pada Bayesian Network merupakan variable input yang bisa saling dependen (berhubungan). Contoh: perhitungan manual pada Alat Bantu Prediksi Hasil Panen Singkong Menggunakan Algoritma Bayesian Network.



Disini menggunakan 2 varabel yaitu variabel perawatan singkong dan variabel hasil. Variabel Perawaran berpengaruh terhadap variabel Hasil. Atribut-atribut dari variabel perawatan singkong (P) antara lain : 1. Proses Penggemburan Tanah —–>digunakan sebagai acuan 2. Pemberian Pupuk 3. Lama Tanam Dibawah ini merupakan data sampel yang diambil penuis pada petani singkong. No



1 2 3 4 5 6 7 8 9 10 11



Proses Penggemburan Tanah Sapi Traktor Traktor Traktor Traktor Sapi Sapi Sapi Traktor Traktor Sapi



Pemberian (kw) 8 8 2 3 2 8 8 8 5 4 4



Pupuk Lama (bulan) 12 12 12 12 12 10 10 10 10 10 12



Tanam



12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30



Traktor Traktor Sapi Sapi Traktor Traktor Traktor Traktor Traktor Sapi Traktor Sapi Traktor Traktor Traktor Traktor Sapi Sapi Traktor



3 3 7 2 6 6 5,5 6 4 8 8 7 6 5 7 5 5 6 5



10 10 12 10 10 9 10 10 10 12 10 12 10 12 10 10 12 12 12



Setelah memperoleh data tersebut langkah pertama yang harus dilakukan adalah menghitung probabilitas masing-masing atribut, untuk probabilitas kemunculan setiap nilai untuk atribut Proses Penggemburan Tanah adalah sebagai berikut : 1. Terdapat 11 dari 30 data yang Proses Penggemburan Tanah menggunakan Sapi, berarti probabilitasnya adalah 11/30. 2. Terdapat 19 dari 30 data yang Proses Penggemburan Tanah menggunakan Traktor, berarti probabiltasnya adalah 19/30. Setelah probabilitas proses penggemburan tanah diperoleh, selanjutnya mencari probabilitas kemunculan setiap nilai untuk atribut Lama Tanam adalah sebagai berikut : Tabel 1. Probabilitas Lama Tanam Lama Tanam >10 bulan 7 kw ≤7 kw



Penggemburan Tanah Sapi Traktor 5/30 2/30 6/30 17/30 11/30 19/30



Jumlah 7/30 23/30 30/30



Setelah memperoleh data-data yang dibutuhkan dalam variabel Perawatan kemudian mencari probabilitas masing-masing atribut dari variabel Hasil. Variabel Hasil (H) terdiri dari atribut Jarak Antar Tanaman, Jenis Tanah yang sekaligus digunakan sebagai acuan, Luas Lahan. Dibawah ini adalah data sampel dari variabel Hasil. Atribut-atribut dari variabel Hasil (H) antara lain: 1. Jarak Antar Tanaman 2. Jenis Tanah———> sebagai acuan 3. Luas Lahan No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26



Jarak Antar Tanaman (cm) 90 90 90 90 90 90 90 90 90 90 80 90 90 80 90 80 90 80 80 80 90 90 80 90 90 90



Jenis Tanah



Luas Lahan (m2 )



Merah Merah Merah Merah Merah Merah Merah Merah Merah Merah Padas Merah Merah Padas Merah Merah Merah Merah Merah Merah Merah Merah Merah Merah Padas Merah



12.500 18.000 4.500 6.000 4.655 17.500 12.500 15.000 10.000 7.000 7.000 5.000 5.000 12.000 2.500 6.000 5.200 5.000 5.600 7.000 15.000 12.000 10.000 6.000 5.000 11.000



27 28 29 30



80 90 90 90



Merah Merah Merah Padas



5.500 7.000 9.000 6.000



Setelah memperoleh data tersebut langkah pertama yang harus dilakukan adalah menghitung probabilitas masing-masing atribut, untuk probabilitas kemunculan setiap nilai untuk atribut Jenis Tanah adalah sebagai berikut : 1. Terdapat 26 dari 30 data yang Jenis Tanah Merah, maka probabilitasnya adalah 26/30. 2. Terdapat 4 dari 30 data yang Jenis Tanah Padas, maka probabiltasnya adalah 19/30. Setelah probabilitas Jenis tanah diperoleh, selanjutnya mencari probabilitas kemunculan setiap nilai untuk atribut Luas Lahan adalah sebagai berikut : Tabel 3. Probabilitas Luas Lahan Luas Lahan ( Jenis Tanah m2) Padas ≥ 7.000 2/30 < 7.000 2/30 4/30



Jumlah Merah 14/30 12/30 26/30



16/30 14/30 30/30



Selanjutnya mencari probabilitas kemunculan setiap nilai untuk atribut Jarak Antar Tanaman, berikut perhitungannya : Tabel 4. Probabilitas Jarak Antar Tanaman Jarak Antar Tanaman 80 cm > 80 cm



Jenis Tanah Padas 2/30 2/30 4/30



Jumlah Merah 6/30 20/30 26/30



8/30 22/30 30/30



Setelah memperoleh data-data yang dibutuhkan termasuk probabilitas untuk masingmasing atribut, maka selanjutnya dapat dilakukan perhitungan untuk mendapatkan hasil yang dicari. Contoh : misalkan ada inputan antara lain: Variabel perawatan (P):   



Proses Penggemburan : Traktor Pemupukan : 8 kw Lama Tanam : 12 bulan



Variabel hasil (H):   



Jarak Antar Tanaman : 90 cm Luas Lahan : 18.000 m2 ≤Jenis Tanah : Merah



Penyelesaian : P (C1) = Proses Penggemburan || Pemupukan || Lama Tanam = 19/30 x 2/30 x 6/30 = 0,0084 P (C2) = Jarak Antar Tanaman || Luas Lahan || Jenis Tanah = 20/30 x 14/30 x 26/30 = 0,269 Perhitungan probabilitas yang digunakan sebagai acuan : 1. Jika inputan Proses Penggemburan Tanah menggunakan Traktor dan Jenis Tanah yang digunakan adalah Merah maka perhitungannya sebagai berikut :



2. Jika inputan Proses Penggemburan Tanah menggunakan Traktor dan Jenis Tanah yang digunakan adalah Padas maka perhitungannya sebagai berikut :



3. Jika inputan Proses Penggemburan Tanah menggunakan Sapi dan Jenis Tanah yang digunakan adalah Merah maka perhitungannya sebagai berikut :



4. Jika inputan Proses Penggemburan Tanah menggunakan Sapi dan Jenis Tanah yang digunakan adalah Padas maka perhitungannya sebagai berikut:



Setelah diperoleh hasil dari tiap variabel langkah selanjutnya adalah Klasifikasi Bayesian Network untuk mengetahui berapa kemungkinan hasil panen singkong yang didapatkan dengan data yang sudah diinputkan tadi?



Jadi berdasarkan perhitungan diatas, kemungkinan hasil panen singkong yang didapatkan dengan inputan yang sudah ada sebesar 23,947 ton dengan status MEMUASKAN karena hasil yang didapatkan 15 ton. Contoh lain cara kerja Bayesian network Asumsikan diberikan sebuah data biasa: Variable 1 : memiliki probabilitas 1. Variable 2 : memiliki probabilitas 2. . . . Variabel n : memilki probabilitas n. Untuk Data – data tersebut proses pengolahannya: a. Amati node dari tiap variable. b. Hubungkan tiap node – node tersebut berdasarkan hubungan sebab akibat jika terdapat hubungan Sebagai contoh misalkan ada struktur Bayesian Network seperti dibawah ini:



Maka dari graf diatas terlihat bahwa A dan B independen, sementara C terhubungkan oleh A dan juga B dan jika terhubung maka untuk mencari nilai peluangnya kita gunakan peluang bersyarat. c. Ulangi proses b hingga semua node terhubungkan satu sama lain. d. Estimasi peluang dari masalah yang akan dicari solusinya dengan melihat nilai peluang dari masing-masing node baik yang independen dan bersyarat dan biasanya untuk nilai peluang dari masing-masing node sudah ditentukan dari awal. e. Hitung peluang dari masalah yang ingin dicari solusinya dengan melihat nilai peluang dari masing-masing node yang berhubungan dengan node yang ingin dicari solusinya dengan tetap menggunakan kaidah Bayes yang telah dijelaskan pada algoritma Naïve Bayesian rumus:



f. Bandingkan nilai dari hasil node yang telah diperoleh untuk dicari solusinya Misalnya untuk graf C diatas , bandingkan jika nilai C=ya dan jika C= tidak g. Tarik kesimpulan berdasarkan nilai peluang yang tertinggi dari proses f