Penerapan Data Mining UNTUK PREDIKSI PENJUALAN PRODUK OTOMOTIF MENGGUNAKAN METODE K-NEAREST NEIGHBOR [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

PENERAPAN DATA MINING UNTUK PREDIKSI PENJUALAN PRODUK OTOMOTIF MENGGUNAKAN METODE K-NEAREST NEIGHBOR (Studi Kasus : Bengkel Bangkrut Mantap)



PROPOSAL PENELITIAN



Oleh KEVIN SATRA MUHAMMAD IQBAL NIM 17051214037



UNIVERSITAS NEGERI SURABAYA FAKULTAS TEKNIK JURUSAN TEKNIK INFORMATIKA PRODI S1 SISTEM INFORMASI 2020



BAB I PENDAHULUAN 1.1 Latar Belakang Bengkel Bangkrut Mantap merupakan sebuah bengkel yang bertempat di kota Paron, Jawa Timur. Pelayanan yang disediakan yaitu bidang jasa dan produk otomotif. Produk yang tersedia beraneka ragam dan dengan kuantitas yang terbilang tidak sedikit. Jumlah produk yang tersedia terkadang tidak sesuai dengan kebutuhan konsumen. Ada produkyang tidak terjual tetapi dengan stok menumpuk dan ada produk dengan stok terbatas namun sangat dibutuhkan oleh consume. Hal itu menjadi suatu kendala yang dialami oleh Bengkel Bangkrut Mantao dalam menjalani aktivitas bisnisnya. Dengan adanya studi kasus ini perlu adanya solusi tentang perbaikan strategi bisnis yang inovatif. Solusi yang tepat yaitu penerapan data mining prediksi penjualan produk pada Bengkel Bangkrut Mantap. 1.2 Rumusan Masalah 1. Konsep persiapan pengadaan stok produk belum berjalan maksimal 2. Transaksi tidak berjalan secara efektif dan efisien karena tidak adanya penyesuaian antara produk dengan kebutuhan konsumen 1.3 Batasan Masalah 1. Konsep penerapan penelitian ini dilaksanakan di Bengkel Bangkrut Mantap 2. Strategi penerapan dapat berjalan secara dinamis menyesuaikan dengan sistem pemasaran pada Bengkel Bangkrut Mantap.



1.4 Tujuan 1. Menjadi suatu ajang persiapan dini dalam menghadapi persaingan pasar bagi Bengkel Bangkrut Mantap 2. Bengkel Bangkrut Mantap memiliki persiapan yang lebih matang dalam melayani kebutuhan konsumen 3. Terjadinya transaksi efektif dan efisien di masa mendatang



BAB II KAJIAN PUSTAKA 2.1 Kajian Teoritis 2.1.1



Penelitian Penelitian adalah sebuah proses kegiatan mencari kebenaran terhadap suatu fenomena ataupun fakta yang terjadi dengan cara yang terstruktur dan sistematis. Proses ini biasanya dilakukan oleh ilmuan atau pakar yang berhubungan dengan hal yang akan dicari kebenarannya. Misal ada sebuah penelitian yang akan menemukan fakta tentang unsur budaya yang hilang di Indonesia. Maka yang melakukan penelitian adalah pakar budaya atau orang yang benar-benar paham tentang kebudayaan. Jadi, secara sederhana, arti dari penelitian adalah upaya untuk mengetahui sebuah fenomena dengan rangkaian yang sistematis.



2.1.2



Transaksi Transaksi adalah suatu kegiatan yang diakukan seseorang yang menimbulkan perubahan terhadap harta atau keuangan yang dipunyai baik itu bertambah ataupun berkurang. Misalnya menjual harta, membeli barang, membayar hutang, serta membayar berbagai macam biaya untuk memenuhi sebuah kebutuhan hidup. Dalam transaksi terdapat sebuah administrasi transaksi. Adapun yang dimaksud dengan administrasi disini ialah suatu kegiatan untuk mencatat perubahan keuangan seseorang atau oraganisasi yang dilakukan secara teliti serta mengunakan suatu metode-metode tertentu.



Administarsi transaksi ditujuakan agar hasil pencatatan bisa di komunikasikan kepada pihak lainnya. Adapun yang dimasut dengan transaksi keuangan ialah suatu kegiatan ekonomi yang dapat diukur dengan satuan uang tertentu, yang bisa mengubah posisi keuangan perusahaan tersebut. 2.1.3



Bengkel Bangkrut Mantap Bengkel Bangkrut Mantap merupakan sebuah bengkel yang bertempat di kota Paron, Jawa Timur. Dalam Melayani konsumen Bengkel Bangkrut Mantap tidak hanya melayani pada bidang jasa, namun juga produk pada bisang otomotif. Ragam produk yang dijual membuat Bengkel Bangkrut Mantap perlu memutar otak untuk menyiapkan skema yang baik agar terjalin transaksi yang efektif dan efisien.



2.1.4



Data Data adalah sekumpulan informasi atau juga keterangan – keterangan dari suatu hal yang diperoleh dengan melalui pengamatan atau juga pencarian ke sumber – sumber tertentu. Data yang diperoleh tersebut dapat menjadi sebuah anggapan atau fakta disebabkan karena memang belum diolah dengan lebih lanjut. Sebab itu kemudian di olah melalui penelitian atau percobaan maka suatu data tersebut dapat menjadi bentuk yang lebih kompleks seperti seuatu database, informasi atau juga bahkan solusi untuk menyelesaikan masalah tertentu. Fungsi data pada umumnya yaitu :







Untuk membuat keputusan terbaik didalam memecahkan sebuah masalah, Dapat dijadikan juga sebagai dasar suatu perencanaan atau juga penelitian, Dijadikan sebagai acuan dalam tiap-tiap implementasi suatu kegiatan atau aktivitas dan terakhir Data ini juga dapat dijadikan sebagai bahan evaluasi.



 







2.1.5



Data Mining Data Mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar (Turban dkk. 2005). Terdapat beberapa istilah lain yang memiliki makna sama dengan data mining, yaitu Knowledge discovery in databases (KDD), ekstraksi pengetahuan (knowledge extraction), Analisa data/pola (data/pattern analysis), kecerdasan bisnis (business intelligence) dan data archaeology dan data dredging (Larose, 2005). Data mining mempunyai fungsi yang penting untuk membantu mendapatkan informasi yang berguna serta meningkatkan pengetahuan bagi pengguna. Pada dasarnya, data mining mempunyai empat fungsi dasar yaitu: 1.



Fungsi Prediksi (prediction). Proses untuk menemukan pola dari data dengan menggunakan beberapa variabel untuk memprediksikan variabel lain yang tidak diketahui jenis atau nilainya.



2.



3.



4.



2.1.6



Fungsi Deskripsi (description). Proses untuk menemukan suatu karakteristik penting dari data dalam suatu basis data. Fungsi Klasifikasi (classification). Klasifikasi merupakan suatu proses untuk menemukan model atau fungsi untuk menggambarkan class atau konsep dari suatu data. Proses yang digunakan untuk mendeskripsikan data yang penting serta dapat meramalkan kecenderungan data pada masa depan. Fungsi Asosiasi (association). Proses ini digunakan untuk menemukan suatu hubungan yang terdapat pada nilai atribut dari sekumpulan data



K-Nearest Neighbor K-Nearest Neighbor adalah suatu metode yang menggunakan algoritma supervised learning dimana hasil dari instance yang baru diklasifikasikan berdasarkan mayoritas dari kategori k-tetangga terdekat. Algoritma k-Nearest Neighbor menggunakan Neighborhood Classification sebagai nilai prediksi dari nilai instance yang baru. Prinsip kerja K-Nearest Neighbor (KNN) adalah mencari jarak terdekat antara data yang akan dievaluasi dengan k tetangga (neighbor) terdekatnya dalam data pelatihan(training) . Dengan k merupakan banyaknya tetangga terdekat. Data training diproyeksikan ke ruang berdimensi banyak, yang mana masing-masing dimensi menjelaskan fitur dari data. Ruang ini dibagi menjadi bagian-bagian berdasarkan klasifikasi data training. Sebuah titik pada ruang ini ditandai kelas k(titik hitam) , kelas k merupakan klasifikasi yang paling banyak



ditemui pada k buah tetangga terdekat titik tersebut. Dalam menentukan nilai atau kelas k , sebaiknya kita gunakan nilai ganjil, karena jika tidak, ada kemungkinan kita tidak akan mendapatkan jawaban. Penentuan nilai k dipertimbangkan berdasarkan banyaknya data yang ada dan ukuran dimensi yang dibentuk oleh data. Semakin banyak data yang ada, angka k yang dipilih sebaiknya semakin rendah. Namun, semakin besar ukuran dimensi data, angka k yang dipilih sebaiknya semakin tinggi. Untuk mencari dekat atau jauhnya jarak antar titik pada kelas k biasanya dihitung menggunakan jarak Euclidean . Jarak Euclidean adalah formula untuk mencari jarak antara 2 titik dalam ruang dua dimensi. Langkah kerja KNNyaitu sebagai berikut : 1. 2. 3. 4. 5.



2.1.7



Tentukan parameter K = jumlah dari persekitaran (nearest neighbors) Hitung jarak antara data baru yang ditanyakan dengan seluruh sampel data pelatihan Urutkan seluruh jarak berdasarkan jarak minimum dan tetapkan persekitaran sesuai dengan nilai K. Sesuaikan klasifikasi dari kategori Y dengan persekitaran yang telah ditetapkan Gunakan kelas dengan jumlah terbanyak sebagai dasar menentukan klas dari data baru yang ditanyakan.



Knowledge Discovery in Database (KDD) Knowledge Discovery in Database (KDD) merupakan proses penemuan pengetahuan dalam database. Secara lengkap KDD didefinisikan sebagai proses ekstraksi atau



identifikasi pola, pengetahuan dan informasi potensial dari sekumpulan data yang besar.



Pengetahuan dan informasi yang dihasilkan dari KDD bersifat sah, baru, mudah dimengerti, dan bermanfaat. Langkah-langkah dalam penerapan KDD yaitu sebagai berikut : 1. Data Cleaning and Integration







Data cleaning (Pembersihan data) bertujuan untuk menghilangkan noise dan data yang tidak konsisten  Data integration (Penggabungan data) bertujuan untuk menggabungkan datadaya yang berasal dari berbagai sumber. 2. Data Selection and transformation  Data selection (Seleksi data) berfungsi untuk mengambil data dari database yang relevan dengan tugas analisis.  Data transformation (Transformasi data) berfungsi mentransformasikan dan mengkonsolidasikan data ke dalam bentuk yang sesuai untuk penambangan dengan melakukan operasi ringkasan atau agregasi. 3. Data Mining Data mining (penambangan data) merupakan proses penting di mana metode cerdas diterapkan untuk mengekstrak pola data. 4. Evaluation and presentation  Pattern Evaluation (Evaluasi pola) berfungsi untuk mengidentifikasi polapola yang benar-benar menarik yang mewakili pengetahuan berdasarkan ukuran-ukuran yang menarik.  Knowledge presentation (Presentasi pengetahuan) digunakan untuk memvisualisasikan dan merepresentasikan pengetahuan yang ditambang kepada pengguna. 2.1.8



Basis Data kumpulan data yang disimpan secara sistematis di dalam komputer yang dapat diolah atau dimanipulasi menggunakan perangkat



lunak (software) program atau aplikasi untuk menghasilkan informasi. Pendefinisian basis data meliputi spesifikasi berupa tipe data, struktur data dan juga batasan-batasan pada data yang kemudian disimpan. Basis data merupakan aspek yang sangat penting dalam sistem informasi karena berfungsi sebagai gudang penyimpanan data untuk diolah lebih lanjut. Basis data menjadi penting karena dapat mengorganisasi data, menghidari duplikasi data, menghindari hubungan antar data yang tidak jelas dan juga update yang rumit.



BAB III METODOLOGI PENELITIAN 3.1 Jenis Penelitian Jenis penelitian ini adalah penelitian lapangan karena berorientasi pada data empiric di lapangan berdasarkan pendekatan kualitatif dan kuantitatif 3.2 Lokasi Penelitian Lokasi penelitian ini ada bertempat di Bengkel Bangkrut Mantap yang berada di kota Paron, Jawa Timur. 3.3 Metode Pengumpulan Data 3.3.1



Studi Kepustakaan Studi kepustakaan merupakan tahapan awal penelitian dimulai yaitu dengan mencari informasi terkait yang bersumber dari literatureliteratur, buku, dan internet. Tahapan ini mampu memberikan ragam referensi yang bertujuan untuk memperluas wawasan peneliti terhadap objek terkait. Sehingga masalah demi masalah dapat terpecahkan dengan maksimal sehingga mampu menciptakan hasil peneitian yang bermutu tinggi dan dapat dijamin kredibilitasnya.



3.3.2



Observasi Observasi merupakan teknik pengumpulan data dengan mengamati secara langsung pada sistem transaksi di Bengkel Bagkrut Mantap. Keaslian data lapangan sangat dibutuhkan untuk menunjang persiapan konsep yang matang dengan penyesuaian pada kondisi



lapangan yang ada pada Bengkel Bangkrut Mantap. 3.3.3



Wawancara Wawancara merupakan teknik pengumpulan data dengan cara mengajukan pertanyaan demi pertanyaan secara langsung pada pemilik bengkel terkait. Hal ini ditujukan untuk mendapatkan kumpulan data valid yang nantinya dapat diolah menjadi suatu informasi yang mampu membuahkan presiksi penjualan pada Bengkel Bangkrut mantap.



3.4 Metode Pengolahan Data Mining Adapun metode pengolahan data mining yang digunakan pada penelitian ini yaitu Knowledge Discovery in Database (KDD). Berikut adalah tahapan-tahapan yang dilakukan : 3.4.1



Data Cleaning Tahapan ini bertujuan untuk menghilangkan noise dan data yang tidak konsisten/ tidak dibutuhkan dalam penerapan prediksi penjualan produk di Bengkel Bangkrut Mantap. Terdapat kesimpulan yaitu data transaksi dan data barang menjadi komponen utama dalam penelitian ini



3.4.2



Integration Tahapan ini bertujuan untuk menggabungkan data dari berbagai sumber dengan berdasarkan korelasi tiap unsur pendukungnya antara data primer yang didapat secara langsung dan data sekunder yang berasal dari basis data dari Bengkel Bangkrut Mantap.



3.4.3



Data Selection Data selection merupakan tahapan pemilihan data yang dibutuhkan yang bersumber dari basis data internal Bengkel Bangkrut Mantap. Data penting tersebut diantaranya yaitu data transaksi dan data barang, yang mana data tersebut menyimpan kumpulan riwayat transaksi pelanggan pada Bengkel Bangkrut Mantap pada periode tahun 2019-2020 serta identitas barang yang diperjualbelikan. Atribut data yang ditemukan yaitu tanggal transaksi, nama produk, dan jumlah. Penjabaran dari ketiga artribut tersebut yaitu sebagai berikut : 1. Tanggal transaksi Tanggal transaksi merupakan atribut yang menggambarkan kondisi waktu pada transaksi. 2. Nama produk Nama produk merupakan atribut yang menjelaskan tentang produk yang terlibat dalam proses transaksi 3. Jumlah Jumlah merupakan atribut yang menjelasjkan tentang kuantitas atau banyaknya produk yang terjual disetiap satuan proses transaksi.



3.4.4



Transformation Pada tahapan ini bentuk data mengalami adaptasi sesuai dengan apa yang dibutuhkan. Proses transformasi mampu menghasilkan kualitas data yang siap untuk digunakan secara matang pada tahapan data mining.



3.4.5



Data Mining Tahap data mining merupakan proses mencari pola atau informasi berdasarkan komponen data yang telah mengalami serangkaian proses sebelumnya. Tahap data mining menerapkan suatu metode dengan tujuan dapat mempermudah proses dalam mendapatkan informasi prediksi penjualan produk. Metode yang digunakan yaitu K-Nearest Neighbor dengan menggunakan rumus eucliden distance. Berikut adalah langkah-langkah dalam penerapannya : 1. 2.



3. 4. 5.



3.4.6



Menentukan parameter k (jumlah tetangga paling dekat). Menghitung kuadrat jarak eucliden objek terhadap data training yang diberikan.



Mengurutkan hasil no 2 secara ascending (berurutan dari nilai tinggi ke rendah) Mengumpulkan kategori Y (Klasifikasi nearest neighbor berdasarkan nilai k) Dengan menggunakan kategori nearest neighbor yang paling mayoritas maka dapat dipredisikan kategori objek.



Evaluation Hasil dari proses data mining selanjutnya mengalami pengecekan ulang dengan tujuan memastikan apakah informasi yang didapat sudah sesuai dengan fakta dan siap



untuk digunakan dalam prediksi penjualan produk. 3.4.7



Presentation Setelah melalui beragam tahapan hingga pada akhirnya membuakan informasi yang sudah tersaring kualitasnya, maka informasi siap disajikan kepada penggunayang bersangkutan.



DAFTAR PUSTAKA Sastrawacana. 2019. Pengertian dan Macam-macam Metode Penelitian. www.kompasiana.com/maulanaaffandi0852/5c95ea050b531c6d7 3786e62/pengertian-dan-macam-macam-metode-penelitian. Bitar. 2020. Pengertian Transaksi – Bisnis, Bukti, Manfaat, Jenis, Pengelompokan, Contoh. https://www.gurupendidikan.co.id/pengertian-transaksi. Mughnifar Ilham. 2019. Pengertian Data – Contoh, Jenis-Jenis, Metode Dan Fungsi data. https://materibelajar.co.id/pengertiandata. Muchlisin Riadi. 2017. Pengertian, Fungsi, Proses dan Tahapan Data Mining. https://www.kajianpustaka.com/2017/09/datamining.html. Rizky Desi Ramadhani. 2019. Memahami K-Nearest Neighbor (KNN) Dengan R. https://medium.com/@16611129/memahamik-nearest-neighbor-knn-dengan-r-de5280439053. Han, Jiawei, Micheline Kamber, Jian Pie. 2012 Data Mining: Concepts and Techniques. San Francisco: Morgan Kaufmann Publishers. Hindro. 2020. Pengertian Database . https://www.termasmedia.com/lainnya/software/69pengertian-database.html. Riad Taufik Lazwardi. 2018. 4 Cara Menghitung Jarak dan Algoritma KNN. https://belajarkalkulus.com/clustering-part-iii.