Laporan KNN [PDF]

LAPORAN PENERAPAN METODE K-NEAREST NEIGHBOR UNTUK PREDIKSI KELULUSAN MAHASISWA Diajukan untuk memenuhi tugas Ujian Akhir

5 0 395 KB

Report DMCA / Copyright

DOWNLOAD FILE

Buku KNN

0 0 2 MB Read more

Jurnal KNN

0 0 929 KB Read more

LPJ KNN Desa Jagan - Bendosari - Sukoharjo

1 0 8 MB Read more

A Review of Various KNN Techniques

0 0 578 KB Read more

Kasus Tugas Besar Update LVQ Knn-Dikonversi

1 0 41 KB Read more

Identifikasi Jenis Penyakit Pada Kakao Dengan PCD Dan KNN

0 0 519 KB Read more

Klasifikisai Buah Mangga Berdasarkan Citra HSV Dan KNN

0 0 227 KB Read more

Analisis Perbandingan Algoritma Klasifikasi Data Mining Model Decision Tree, KNN, Dan Naïve Bayes Pada Dataset Prestasi Siswa

0 0 117 KB Read more

Laporan

0 0 2 MB Read more

LAPORAN

0 0 2 MB Read more

File loading please wait...

Citation preview

LAPORAN PENERAPAN METODE K-NEAREST NEIGHBOR UNTUK PREDIKSI KELULUSAN MAHASISWA Diajukan untuk memenuhi tugas Ujian Akhir Semester Kecerdasan Komputasional

Dosen Pengampu : Muhammad Muharrom Al Haromainy S.Kom Nama Kelompok : 1. A. Khuwarismi Ijtaba Robbuhu

(B34180008)

2. Dimas Bayu Cahya Putra

(B34180015)

3. Muhammad Haris Abidin

(B34180037)

4. Risalatul Khasanah

(B34180057)

PROGRAM STUDY TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER UNIVERSITAS NAHDLATUL ULAMA SIDOARJO 2021

PENERAPAN METODE K-NEAREST NEIGHBOR UNTUK PREDIKSI KELULUSAN MAHASISWA A. Khuwarismi Ijtaba Robbuhu1 , Dimas Bayu Cahya Putra 𝟐 , Muhammad Haris Abidin𝟑, Risalatul Khasanah𝟒

ABSTRAK Tidak stabilnya kelulusan mahasiswa program studi Teknik Informatika pada Universitas Nahdlatul ulama Sidoarjo menjadi tugas yang berat bagi Program Studi. Bertambahnya mahasiswa tiap tahunnya menyebabkan penumpukan data mahasiswa. Prediksi ketepatan kelulusan mahasiswa dirancang untuk mendukung prodi untuk membimbing mahasiswa agar kelulusan tepat waktu. Dengan mengetahui prediksi status kelulusan mahasiswa berjalannya perkuliahan, maka dari itu prodi di bantu pembimbing akademik dapat memberi perhatian khusus terhadap mahasiswa yang di prediksi tidak lulus tepat waktu (terlambat) sehingga mahasiswa tersebut dapat memperbaiki indeks prestasinya tiap semester agar dapat lulus tepat waktu. Dalam penelitian ini untuk memprediksi kelulusan mahasiswa menggunakan algoritma K-Nearest Neighbor. K-Nearest Neighbor merupakan metode klasifikasi, dimana kelas yang paling banyak muncul (mayoritas) yang akan menjadi kelas hasil klasifikasi. Penelitian ini mengambil sample data mahasiswa semester VI Universitas Nahdlatul Ulama Sidoarjo, menggunakan 9 data training dan 1 data testing. Dengan menggunakan k=5 yang diterapkan menggunakan metode K-Nearest Neighbor untuk prediksi kelulusan mahasiswa. Kata Kunci : metode K-NN, Prediksi, kelulusan

i

KATA PENGANTAR Puji syukur kehadirat Tuhan yang Maha Esa atas berkat rahmat dan karunia-Nya, sholawat serta salam semoga selalu tercurahkan kepada Nabi Muhammad SAW. Tugas laporan dalam rangka untuk memenuhi sebagian persyaratan untuk mendapatkan kelulusan Mata Kuliah Kecerdasan Komputasional dengan judul “Penerapan Metode KNearest Neighbor Untuk Prediksi Kelulusan Mahasiswa” dapat disusun sesuai dengan harapan. Dengan bantuan dan dukungan semua pihak, dengan cepat kami menyusun laporan ini. Berkenaan dengan hal tersebut, penulis menyampaikan ucapan terima kasih kepada yang terhormat: 1. Bapak Muhammad Muharrom Al Haromainy S.Kom selaku Dosen Pengampu sekaligus Kepala Program Studi yang telah memberikan semangat, dorongan, dan bimbingan selama penyusunan Tugas Proposal ini. 2. Bapak Sonhaji Arif, S.Pd., M.Sn. selaku Dekan Fakultas Ilmu Komputer yang memberikan persetujuan pelaksanaan Tugas Proposal ini. 3. Orang tua beserta keluarga tercinta, terima kasih untuk doa, semangat, kasih sayang, dorongan dan pengorbanan yang tak terkira. 4. Seluruh pihak, termasuk rekan kelompok dalam penyusunan laporan ini secara langsung maupun tidak langsung, yang tidak dapat disebutkan di sini atas bantuan dan perhatiannya selama penyusunan laporan ini. Dalam proses penyusunan laporan ini, kami menyadari bahwa hasil laporan ini masih jauh dari sempurna. Maka kami sebagai penulis sangat mengharapkan kritik dan saran yang membangun dari para pembaca. Akhir kata, semoga laporan ini dapat membawa manfaat bagi kami, khususnya kelompok kami, dan seluruh masyarakat Indonesia. Namun penulis tetap berharap laporan ini bermanfaat bagi pengembangan ilmu pengetahuan terutama dalam kaitannya dengan pengembangan program audio compression.

Sidoarjo, 11 Juli 2021 Penulis

ii

DAFTAR ISI ABSTRAK ........................................................................................................................ i KATA PENGANTAR ...................................................................................................... ii DAFTAR ISI ................................................................................................................................ iii

Bab 1

Pendahuluan ....................................................................................................... 1

1.1

Latar Belakang ................................................................................................... 1

1.2

Rumusan Masalah .............................................................................................. 1

1.3

Tujuan Penelitian ............................................................................................... 1

1.4

Manfaat Penelitian ............................................................................................. 2

1.5

SISTEMATIKA PENULISAN .......................................................................... 2

Bab 2

Kajian Pustaka ................................................................................................... 3

2.1

Tinjauan Pustaka ................................................................................................ 3

2.1.1 2.2

1 Penelitian Terkait ..................................................................................... 3

Landasan Teori .................................................................................................. 4

2.2.1

K-Nearest Neighbor .................................................................................... 4

2.2.2

Prediksi ....................................................................................................... 4

2.2.3

Kelulusan .................................................................................................... 4

Bab 3

Desain Sistem .................................................................................................... 5

3.1

Flowchart / DFD Data ........................................................................................ 5

3.1.1

Data training ............................................................................................... 5

3.1.2

Data testing ................................................................................................. 5

3.2

Tahapan Penelitian ............................................................................................. 5

3.3

Tahapan Implementasi ....................................................................................... 5

3.4

Tahapan Pengujian ............................................................................................. 5

Bab 4

Kesimpulan dan Saran ....................................................................................... 9

4.1

Kesimpulan ........................................................................................................ 9

4.2

Saran .................................................................................................................. 9

Daftar Pustaka ................................................................................................................ 10

iii

Bab 1

Pendahuluan

1.1 Latar Belakang Mahasiswa adalah asset penting bagi seluruh instusi pendidikan dan untuk itu perlu diperhatikan tingkat kelulusan mahasiswa tepat waktu pada waktunya. Presentasi naik turunnya kemampuan mahasiswa untuk menyelesaikan studi tepat waktu merupakan salah satu elemen penelitian akreditasi kampus. Pada penelitian ini mengunakan algoritma K-Nearest Neighbor (KNN) yang bertujuan untuk dapat mengidentifikasi kelulusan mahasiswa dan berperan untuk mendapat nilai kedekatan kasus baru terhadap kasus lama. Yang selanjutnya populasi terbanyak pada area K dengan nilai terdekat didapatkan mahasiswa tersebut diprediksi apakah lulus tepat waktu atau tidak tepat waktu. K-Nearest Neighbor (KNN) adalah suatu metode untuk klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Metode ini dipiih karena memiliki klasifikasi dan tangguh terhadap training data yang efisien bila data training besar dalam prediksi kelulusan mahasiswa. Prediksi ketepatan kelulusan mahasiswa dirancang untuk mendukung prodi dalam membimbing mahasiswa agar kelulusan tepat waktu. Dengan mengetahui prediksi status kelulusan mahasiswa berjalannya perkuliahan, maka dari itu prodi di bantu pembimbing akademik dapat memberi perhatian khusus terhadap mahasiswa yang di prediksi tidak lulus tepat waktu sehingga mahasiswa tersebut dapat memperbaiki indeks prestasinya tiap semester agar dapat lulus tepat waktu.

1.2 Rumusan Masalah 1. Bagaimana pengaruh Metode K-Nearest Neighbour terhadap Ketepatan Waktu Kelulusan Mahasiwa? 2. Bagaimana tingkat keakuratan Prediksi Ketepatan Waktu Kelulusan Mahasiwa menggunakan Metode K-Nearest Neighbour?

1.3 Tujuan Penelitian Berdasarkan masalah yang ada, dapat dirumuskan tujuan penelitian ini yaitu sebagai berikut: 1. Terciptanya sebuah prediksi kelulusan tepat waktu sebagai bahan pertimbangan dalam menentukan langkah guna mengatasi permasalahan mahasiswa yang tidak lulus tepat waktu dimasa yang akan datang. 2. Untuk memperoleh informasi yang tepat serta akurat tentang mahasiswa yang mampu menyelesaikan masa studi secara tepat waktu sehingga dapat mencegah secara dini kegagalan akademik mahasiswa. 3. Dihasilkannya prediksi kelulusan tepat waktu dengan menggunakan Penerapan Metode K-Nearest Neighbour.

1

1.4 Manfaat Penelitian Manfaat yang diharapkan dari penelitian ini adalah sebagai berikut: 1. Memberikan kontribusi keilmuan pada penelitian bidang klasifikasi data mining khususnya untuk prediksi kelulusan mahasiswa. 2. Membantu administrasi perguruan tinggi untuk memberikan peringatan dini dan pembimbingan awal bagi mahasiswa yang kemungkinan tidak lulus tepat waktu. 3. Membantu perguruan tinggi dalam membuat kebijakan untuk bisa meningkatkan kelulusan mahasiswa.

1.5 SISTEMATIKA PENULISAN Guna membantu kelancaran laporan ini, maka penulis akan mengemukakan sistematika penulisan yang digunakan dalam penyusunan laporan ini. A. BAB I PENDAHULUAN Bab ini membahas tentang latar belakang penelitian, ruang lingkup, tujuan dan manfaat penulisan, metodologi penulisan, dan sistematika penulisan yang digunakan dalam penyusunan proposal ini. B. BAB II KAJIAN PUSTAKA Bab ini membahas tentang landasan teoritis terkait bahan dasar yang digunakan dalam penyusunan proposal tugas akhir, konsep dasar sistem aplikasi yang berhubungan dengan informasi yang dibutuhkan oleh penulis. C. BAB III METODE PENELITIAN Dalam bab ini akan membahas tentang diagram alir penelitian, obyek penelitian, serta rancangan penelitian. D. BAB IV PENUTUP Dalam bab ini akan membahas ringkasan berupa kesimpulan serta saran yang membangun demi kemajuan proposal beserta program atauun sistemnya. E. DAFTAR PUSTAKA Bagian ini mencantumkan setiap sumber teori ataupun penelitian sebelumnya yang digunakan, baik dari Tesis, Skripsi, Tugas Akhir, Buku, eJurnal, Modul, dll.

2

Bab 2

Kajian Pustaka

2.1 Tinjauan Pustaka 2.1.1 1 Penelitian Terkait Penelitian yang dilakukan oleh Karamouiz dan Vretoz pada tahun 2009 dengan judul Sentivity Analysis of Neural Network for Identifying the Factors for Collage Students Success. Masalah yang yang dikaji adalah tingkat kelulusan dianggap sebagai indikator efektivitas suatu lembaga institusi, Metode yang digunakan adalah NN (Neural Network). Dari hasil data training yang dilakukan diperoleh kategori yang lulus adalah 86.04% dan training data untuk kategori yang tidak sukses adalah 68.21%, dan error yang diperoleh untuk kedua kategori tersebut adalah 0.18% (Vrettos, 2009). Penelitian yang dilakukan oleh Qudri dan Kalanyar pada tahun 2010 dengan judul Drop Out Feature of Student Data for Academic Performance Using Decision Tree techniques. Masalah dalam penelitiaanya adalah prestasi akademik siswa sangat penting bagi lembaga pendidikan karena program-program strategis dapat direncanakan untuk meningkatkan atau mempertahankan prestasi siswa selama periode mereka studi di lembaga. Metode yang digunakan adalah Decision Tree, yakni algoritma J4.8. Hasil penelitian ini adalah sebuah pohon keputusan yang dapat dijadikan rule bagi prediksi siswa yang putus sekolah (Kalyankar, 2010). Penelitian yang dilakukan oleh Suhartina dan Ernastuti pada tahun 2010 dengan judul dengan judul Graduation Prediction of Gunadarma University Students Using Algorithm and Naive Bayes C4.5 Algorithm. Permasalahannya adalah banyaknya mahasiswa yang tidak lulus tepat waktu. Untuk mengetahui tingkat kelulusan mahasiswa dalam satu tahun ajaran dapat dilakukan suatu prediksi berdasarkan data-data mahasiswa pada tahun ajaran pertama. Algoritma yang digunakan adalah C45 dan naïve bayes. Hasil dari penelitian ini adalah akurasi untuk metode naïve bayes adalah 80,85% dengan presentasi kesalahan 19,05% Akurasi ketepatan hasil prediksi C4.5 85.7%, dan presentasi kesalahannya adalah 14,3% (Ernastuti, 2010). Penelitian yang dilakukan oleh Hastuti pada tahun 2012 dengan judul analisis komparasi algoritma klasifikasi data mining untuk prediksi mahasiswa non aktif. Permasalahannya adalah mahasiswa non aktif adalah mahasiswa yang berhenti studi dan tidak melakukan registrasi administratif. Mahasiswa yang memiliki status non aktif memiliki kecenderungan untuk drop out.Metode yang digunakan adalah Logistic Regression, Decision Tree, Naïve Bayes, Neural Network. Hasilnya adalah akurasi Logistic Regression 81,64%, Decision Tree 95,29%, Naïve Bayes 93,47%, dan Neural Network 94,59%. Selanjutnya penelitian yang dilakukan oleh Tahyudin, Utami dan Amborowati pada tahun 2013 dengan judul Comparing Clasification Algorithm Of Data Mining to Predict the Graduation Students on Time. Permasalahannya adalah persentase mahasiswa yang lulus tepat waktu adalah salah satu unsur yang mempengaruhi akreditas program studi. Metode yang digunakan adalah mengkomparasi algoritma decision tree, naïve bayes, ANN, Support Vector Machine (SVM) dan Logistic Regression (LR). Hasilnya adalah akurasi algoritma decision tree 80,01%, naïve bayes 75,16%, ANN 100%, SVM 100%, dan LR 100%. (Tahyudin, 2013)

3

Selain algoritma klasifikasi data mining diatas, ada algoritma klasifikasi yang lainnya untuk melakukan suatu prediksi seperti K-Nearest Neighbour, ID3, CHAID dan Learning Discriminant Analysis (LDA) (Gorunescu, 2011). Jadi dalam penelitian ini akan dilakukan analisis prediksi menggunakan metode klasifikasi data mining K-Nearest Neighbour (KNN) untuk mengetahui seberapa besar tingkat akurasinya dalam prediksi ketepatan kelulusan mahasiswa.

2.2 Landasan Teori 2.2.1 K-Nearest Neighbor K-Nearest Neighborhood (K-NN) adalah suatu metode yang menggunakan algoritma supervised dimana hasil dari query instance yang baru diklasifikasikan berdasarkan mayoritas dari label class pada k-NN. Tujuan dari algoritma k-NN adalah mengklasifikasikan objek baru berdasarkan atribut dan training data. Algortima KNN merupakan sebuah metode untuk melakukan klasifikasi terhadap obyek baru berdasarkan (K) tetangga terdekatnya [4][5]. KNN termasuk algoritma supervised learning, dimana hasil dari query instance yang baru, diklasifikasikan berdasarkan mayoritas dari kategori pada KNN. Kelas yang paling banyak muncul yang akan menjadi kelas hasil klasifikasi. Adapun Urutan Algoritma KNN sebagai berikut a. Menentukan parameter K (jumlah tetangga paling dekat) b. Menghitung kuadrat jarak euclidian (euclidean distance) masing-masing obyek terhadap data sampel yang diberikan c. Mengurutkan objek-objek tersebut ke dalam kelompok yang mempunyai jarak euclid terkecil.

d. Mengumpulkan kategori Y (klasifikasi nearest neighbors) Dengan menggunakan kategori mayoritas, maka dapat diprediksikan nilai query instance yang telah dihitung

2.2.2 Prediksi Prediksi mirip seperti klasifikasi dan estimasi, tapi hasilnya untuk memprediksi masa depan. Contoh, memprediksi harga barang tiga bulan mendatang, memprediksi prosentase kenaikan angka kematian karena kecelakaan tahun mendatang jika kecepatan berkendara dinaikkan. Metode dan teknik untuk klasifikasi dan estimasi, jika cocok, bisa juga digunakan untuk prediksi, termasuk metode statistik. 2.2.3 Kelulusan Kelulusan adalah tanda keberhasilan seseorang yang telah menempuh ujian. Bagi seorang siswa atau mahasiswa merupakan batu loncatan untuk melangkah ke jenjang selanjutnya.

4

Bab 3

Desain Sistem

3.1 Flowchart / DFD Data Pada penelitian ini digunakan data sebagai berikut: 3.1.1 Data training Data ini berupa data sampel mahasiswa yang sudah dinyatakan lulus. Data ini memiliki atribut jenis kelamin, status kerja, status nikah, umur, IP smester 1-6 dan capaian SKS dengan status kelulusan cepat, tepat, terlambat, sangat terlambat.28 Jurnal TIKomSiN 3.1.2 Data testing Data ini digunakan sebagai data untuk pengujian sistem yang setatus kelulusannya belum diketahui dan mempunyai atribut yang sama dengan data training.

3.2 Tahapan Penelitian Pada penelitian ini, tahapan penelitian yang dilakukan secara garis besar meliputi beberapa kegiatan yaitu pembuatan proposal, implementasi Algoritma KNN, pengujian.

3.3 Tahapan Implementasi Impelementasi Sistem Prediksi Tingkat Kelulusan ini dilakukan dengan menggunakan paket perangkat lunak xampp dan browser mozila firefox. Penulis menggunakan komputer dengan spesifikasi Intel dualcore 2,30 GHZ, RAM 8 GB dan SSD 120 GB dengan operating system Microsoft Windows 10.

3.4 Tahapan Pengujian Dari pengujian Sistem ingin mencari tingkat akurasi Algoritma KNN untuk Prediksi Masa Studi Mahasiswa.

3.4.1.1 Desain Database

Gambar 3.1 Tampilan Desain DataBase

5

3.4.1.2 Desain Flowchart

Gambar 3.2 Tampilan Desain Flowchart

3.4.1.3 Desain Antar muka

Gambar 3.3 Tampilan Daftar Data Training

6

3.4.1.4 Input data Training Halaman ini Digunakan untuk Input data Training yang digunakan untuk data testing.

Gambar 3.4 Tampilan Input Data Training

3.4.1.5 Input data Testing Memasukkan data mahasiswa yang mau di testing, pada Kolom Nilai K disitu dimasukkan jumlah data training, Disini kami hanya menggunakan 5 data traning.

Gambar 3.5 Tampilan Input Data Testing

3.4.1.6 Hasil testing Dari Gambar 3.6 Output dari hasil data testing yang mana dari inputan data testing gambar 3.5. Disitu dijelaskan bahwa data yang kami input sudah memenuhi ratarata Lulus Tepat Waktu.

7

Gambar 3.6 Tampilan Hasil Data Testing

3.4.1.7 Riwayat Pada bagian Riwayat hanya berisi data Training yang dihapus.

Gambar 3.7 Tampilan Riwayat

8

Bab 4

Kesimpulan dan Saran

4.1 Kesimpulan Kami mengambil kesimpulan sebagai berikut : 1. Data training yang dipakai adalah hasil dari IP (Index Prestasi) tiap semester, sehingga kurang efektif dikarenakan datanya tidak lebih lengkap dari nilai masingmasing mata kuliah, tapi proses perhitungannya relatif lebih cepat. 2. Nilai IP (Index Prestasi) bisa dipakai sebagai data training dalam prediksi kelulusan kerena mencerminkan tingkat keseriusan dan kemampuan mahasiswa. 3. Jumlah serta kelengkapan data dapat mempengaruhi hasil dan keakuratan prediksi. 4. Nilai K dapat mempengaruhi hasil metode K-NN. 5. Teknik klasfikasi menggunakan metode K-NN dapat memprediksi kelulusan. 6. Output yang dihasilkan adalah keterangan dari Data testing.

4.2 Saran Penulis tentunya masih menyadari jika masih terdapat kesalahan dan jauh dari kata kesempurnaan. Penulis akan memperbaiki tersebut dengan berpedoman pada banyak sumber serta kritik yang membangun dari para pembaca.

9

Daftar Pustaka Khalib Alkatib, Hasan Najadat, Ismail Hmeidi, and Mohammed Ali Shatnawi, "Stock Prediction Using K-Nearest Neighbor (kNN) Algorithm," International Journal of Business, Humanities and Technology, vol. Vol 3, pp. 32 - 45, 2013. Han, J., & Kamber, M. (2009). Data Mining: Concept, Models, and Techniques. Verlag Berlin Heidelberg: Springer James H. McMillan. 2008. Assessment Essentials for Standard-based Education

10