Praktikum Klasifikasi Data Mining RapidMiner [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

PRAKTIKUM DATA MINING RapidMiner Algoritma C4.5 (Decision Tree)  Classification



1. Buka RapidMiner 2. Untuk membuat baru, pilih New Process



Ratna – Data Mining



1



3. Pengaturan penggunaan data training, dengan cara : a. Dikarenakan data training yang akan digunakan dalam bentuk Excel, maka pada tab Operator dipilih Data  Import  Read Excel b. Letakkan operator Read Excel tersebut pada Main Process dengan double klik operator Read Excel atau dengan klik dan drag Read Excel ke Main Process



c. Menempatkan file data training yang berupa excel, dengan meng-klik tombol Import Configuration Wizard... yang terdapat di tab parameter



d. Menentukan lokasi penyimpanan file data training, lalu tekan tombol Next



Ratna – Data Mining



2



e. Selanjutnya, memilih range data yang akan di Import lalu tekan tombol Next



f. Klik tombol Next lagi g. Kemudian menentukan tipe data, atribut dan label



 Binominom : untuk tipe data yang hanya terdiri 2 (dua) kategori, seperti Ya – Tidak, Baik – Cukup, Kuat – Lemah dsb



Ratna – Data Mining



3



 Polynom : untuk tipe data yang terdiri lebih dari 2 kategori, seperti Tinggi – Sedang – Kurang dsb  Attribute : digunakan sebagai variabel prediksi (predictor)  Label : digunakan sebagai variabel tujuan (class) Tekan tombol Finish, setelah selesai menentukan tipe data, atribut dan label. 4. Meletakkan operator Decision Tree yang terdapat di tab Operator  Modeling  Classification and Regression  Tree Induction  Decision Tree di Main Process



5. Agar data training dapat di proses, maka operator Read Excel dengan Decision Tree harus dikoneksikan dengan cara : a. Pada Read Excel, klik “out” (output), lalu drag ke “tra” (training) yang terdapat di Decision Tree b. Pada Decision Tree, klik “mod” (model), lalu drag ke “res” (result) yang terdapat di sebelah kanan Main Process



6. Tekan tombol Run, untuk mengetahui hasil dari Main Process



Ratna – Data Mining



4



7. Maka akan tampil Decision Tree seperti berikut ini :



LATIHAN 1. Diketahui data sebagai berikut :



Dengan menggunakan RapidMiner, buatlah decession tree dengan algoritma C.45 dan apa yang dapat Anda simpulkan dari Decession Tree tersebut.



Ratna – Data Mining



5



2. Diketahui data sebagai berikut :



Dengan menggunakan RapidMiner, buatlah decession tree dengan algoritma C.45 dan apa yang dapat Anda simpulkan dari Decession Tree tersebut.



Ratna – Data Mining



6



PRAKTIKUM DATA MINING RapidMiner Algoritma Naïve Bayes  Classification



EXCEL 



Tuliskan Data Training (data sample yang sudah ada) berikut ini di sheet1







Tuliskan Data Testing (data yang akan diprediksi) berikut ini di sheet2



Ratna – Data Mining



7



RapidMiner 1. Buka RapidMiner 2. Untuk membuat baru, pilih New Process



3. Memanggil Data Training, dengan cara : a. Pada TextBox Search tuliskan Read, maka akan menampilkan komponen yang terdapat kata Read. b. Drag and drop Read Excel ke editor Main Proses. c. Maka di Main Proses akan tampil komponen Read Excel.



a b



c



d. Menempatkan file data training yang berupa excel, dengan meng-klik tombol Import Configuration Wizard... yang terdapat di tab parameter



Ratna – Data Mining



8



e. Menentukan lokasi penyimpanan file Excel yang telah dibuat sebelumnya, lalu tekan tombol Next



f. Selanjutnya, memilih data yang ada di sheet1 lalu tekan tombol Next



Ratna – Data Mining



9



g. Kemudian pada BELI KOMPUTER, ubah attribute menjadi LABEL. Setelah selesai tekan tombol FINISH.



4. Memanggil Teknik yang digunakan, yaitu Naïve Bayes dengan cara : a. Pada TextBox Search tuliskan Naive, maka akan menampilkan komponen yang terdapat kata Read. b. Drag and drop Naïve Bayes ke editor Main Proses. c. Maka di Main Proses akan tampil komponen Naïve Bayes. d. Koneksikan Read Excel (output) dengan Naïve Bayes (training)



Ratna – Data Mining



10



a d



c



b



5. Memanggil Data Testing, dengan cara : a. Pada TextBox Search tuliskan Read, maka akan menampilkan komponen yang terdapat kata Read. b. Drag and drop Read Excel ke editor Main Proses. c. Maka di Main Proses akan tampil komponen Read Excel (2).



a b



c



d. Menempatkan file Excel yang akan diolah, dengan meng-klik tombol Import Configuration Wizard... yang terdapat di tab parameter. e. Menentukan lokasi penyimpanan file Excel tersebut, lalu tekan tombol Next. f. Selanjutnya, memilih data yang ada di sheet2 lalu tekan tombol FINISH.



Ratna – Data Mining



11



6. Mengaplikasikan (Apply Model) komponen-komponen yang ada dengan cara : a. Pada TextBox Search tuliskan Apply, maka akan menampilkan komponen yang terdapat kata Apply. b. Drag and drop Apply Model ke editor Main Proses. c. Maka di Main Proses akan tampil komponen Apply Model.



a



b c



d. Koneksikan Naïve Bayes (model) dengan Apply Model (model) e. Koneksikan Read Excel (2) (output) dengan Apply Model (unl) f. Koneksikan Apply Model (lab) ke result g. Koneksikan Apply Model (model) ke result



Ratna – Data Mining



12



7. Tekan tombol Run, untuk mengetahui hasil dari Main Process



8. Maka akan tampil sebagai berikut, dan untuk mengetahui hasil prediksi Label Beli Komputer data testing dengan klik Tab ExampleSet (Read Excel (2)) :



Ratna – Data Mining



13



9. Maka akan ditampilkan hasil prediksi sebagai berikut



:



Sehingga akan diperoleh Class / Label Beli Komputer untuk :  Usia 40; Pendapatan = Tinggi; Pelajar = Tidak; Penilaian = Cukup; diprediksi memiliki Label Beli Komputer = TIDAK.



LATIHAN No. 1 Data Training



Data Testing



Dengan menggunakan RapidMiner, tentukan Label Beli Komputer dari Data Testing dengan Teknik Naïve Bayes. Ratna – Data Mining



14



LATIHAN No. 2 Data Training mengenai REKOMENDASI yang diangkat menjadi KARYAWAN TETAP, dengan Class REKOMENDASI



Data Testing



Dengan menggunakan RapidMiner, tentukan Label REKOMENDASI dari Data Testing dengan Teknik Naïve Bayes.



Ratna – Data Mining



15



PRAKTIKUM DATA MINING RapidMiner Algoritma K – Nearest Neigbor  Classification Data training dan testing menggunakan data excel sebelumnya (Class BELI KOMPUTER) 1. Buka RapidMiner 2. Untuk membuat baru, pilih New Process



3. Memanggil Data Training, dengan cara : a. Pada TextBox Search tuliskan Read, maka akan menampilkan komponen yang terdapat kata Read. b. Drag and drop Read Excel ke editor Main Proses. c. Maka di Main Proses akan tampil komponen Read Excel.



a b



c



d. Menempatkan file data training yang berupa excel, dengan meng-klik tombol Import Configuration Wizard... yang terdapat di tab parameter Ratna – Data Mining



16



e. Menentukan lokasi penyimpanan file Excel yang telah dibuat sebelumnya, lalu tekan tombol Next



f. Selanjutnya, memilih data yang ada di sheet1 lalu tekan tombol Next



Ratna – Data Mining



17



g. Kemudian pada BELI KOMPUTER, ubah attribute menjadi LABEL. Setelah selesai tekan tombol FINISH.



4. Memanggil Teknik yang digunakan, yaitu k-NN dengan cara : a. Pada TextBox Search tuliskan k-NN, maka akan menampilkan komponen yang terdapat kata Read. b. Drag and drop k-NN ke editor Main Proses. c. Maka di Main Proses akan tampil komponen k-NN. d. Koneksikan Read Excel (output) dengan k-NN (training)



a



b



Ratna – Data Mining



d



c



18



5. Memanggil Data Testing, dengan cara : a. Pada TextBox Search tuliskan Read, maka akan menampilkan komponen yang terdapat kata Read. b. Drag and drop Read Excel ke editor Main Proses. c. Maka di Main Proses akan tampil komponen Read Excel (2).



a b



c



d. Menempatkan file Excel yang akan diolah, dengan meng-klik tombol Import Configuration Wizard... yang terdapat di tab parameter. e. Menentukan lokasi penyimpanan file Excel tersebut, lalu tekan tombol Next. f. Selanjutnya, memilih data yang ada di sheet2, blok data yang akan diolah lalu tekan tombol NEXT, lalu FINISH.



Ratna – Data Mining



19



6. Mengaplikasikan (Apply Model) komponen-komponen yang ada dengan cara : a. Pada TextBox Search tuliskan Apply, maka akan menampilkan komponen yang terdapat kata Apply. b. Drag and drop Apply Model ke editor Main Proses. c. Maka di Main Proses akan tampil komponen Apply Model.



a



b c



d. Koneksikan k-NN (model) dengan Apply Model (model) e. Koneksikan Read Excel (2) (output) dengan Apply Model (unl) f. Koneksikan Apply Model (lab) ke result g. Koneksikan Apply Model (model) ke result 7. Mengisikan nilai k sebagai jumlah tetangga terdekat



8. Tekan tombol Run, untuk mengetahui hasil dari Main Process



Ratna – Data Mining



20



9. Maka akan tampil sebagai berikut, dan untuk mengetahui hasil prediksi Label Beli Komputer data testing dengan klik Tab ExampleSet (Read Excel (2)), maka akan ditampilkan hasil prediksi sebagai berikut :



Sehingga akan diperoleh Class / Label Beli Komputer untuk :  Usia 40; Pendapatan = Tinggi; Pelajar = Tidak; Penilaian = Cukup; diprediksi memiliki Label Beli Komputer = TIDAK.



LATIHAN No. 1 Data Training



Ratna – Data Mining



21



Data Testing



Dengan menggunakan RapidMiner, tentukan Label Beli Komputer dari Data Testing dengan Teknik Naïve Bayes.



LATIHAN No. 2 Data Training mengenai REKOMENDASI yang diangkat menjadi KARYAWAN TETAP, dengan Class REKOMENDASI



Data Testing



Dengan menggunakan RapidMiner, tentukan Label REKOMENDASI dari Data Testing dengan Teknik Naïve Bayes.



Ratna – Data Mining



22