Analisis Sentimen Tragedi Kanjuruhan Di Media Sosial Twitter Menggunakan Metode Support Vector Machine (SVM) [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

ANALISIS SENTIMEN TRAGEDI KANJURUHAN DI MEDIA SOSIAL TWITTER MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM)



OLEH : KA’BAI SHOLEHAH 2202520075



FAKULTAS SAINS DAN TECHNOLOGI JURUSAN SISTEM INFORMASI UNIVERSITAS BAHAUDDIN MUDHARY MADURA



1



I.



Judul : ANALISIS SENTIMEN TRAGEDI KANJURUHAN DI MEDIA SOSIAL TWITTER MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM)



II.



LATAR BELAKANG Salah satu olahraga yang paling di minati masyarakat dunia adalah olahraga sepak bola. Indonesia sendiri termasuk negara penggemar sepak bola paling banyak di dunia. Indonesia menempati urutan kedua sebagai negara penggemar sepak bola di dunia dengan 77% penduduk Indonesia memiliki ketertarikan dengan olahraga sepakbola(Smith,2014). Indonesia dalam bidang lain yaitu penggunaan media sosial merupakan negara dengan pengguna yang cukup aktif. Salah satu media sosial yang populer diantara pengguna Indonesia adalah Twitter. Indonesia merupakan negara kelima pengguna Twitter paling besar di dunia dimana terdapat 4,1 milyar tulisan Twitter yang dibuat oleh pengguna dari Indonesia pada tahun 2016(Herman,2017). Baru-baru ini terjadi tragedi di stadion Kanjuruhan Malang dimana menimbulkan kericuhan sehingga sampai menewaskan 135 orang, Hal ini perlu ditilik lebih lanjut dengan mengetahui pendapat masyarakat tentang apa yang dirasakan saat terjadinya tragedi tersebut. Masyarakat memberikan pendapat dan opininya melalui berbagai media. Salah satu media yang efektif untuk menampung opini Tragedi Kanjuruhan ini adalah Twitter. Twitter sendiri merupakan salah satu media sosial yang akrab digunakan oleh masyarakat Indonesia, yang tentunya akan memudahkan untuk pengumpulan opini dibandingkan dengan melakukan survey ataupun penyebaran kuisioner. Untuk menghasilkan informasi dari data opini yang ada, dilakukan pengolahan data dengan analisis sentimen yang dapat menjadi solusi permasalahan yang telah dipaparkan sebelumnya, yaitu dengan memisahkan opini ke dalam kelas bersentimen positif atau negatif, serta dilakukan pengambilan kesimpulan faktor apa yang sering dibahas dalam opini-opini tersebut. Metode Support Vector Machine (SVM) akan digunakan dalam proses klasifikasi opiniopini tersebut. Berdasarkan penelitian-penelitian sebelumnya, ditemukan bahwa metode support vector machine dapat menghasilkan akurasi yang cukup tinggi dalam melakukan analisis sentimen.



2



III.



BATASAN DAN RUMUSAN MASALAH



1. BATASAN MASALAH Agar lebih terfokus dalam pembahasannya peneliti hanya membahas mengenai sentiment masyarakat Indonesia mengenai tragedi Kanjuruhan Malang, dengan meng-crawling data, memetakan opini negatif positif dan netral.



2. RUMUSAN MASALAH Bagaimana caranya memetakan opini positif dan negatif di twitter? Bagaimana cara menghitung pendapat masyarakat di twitter?



IV.



TUJUAN DAN MANFAAT PENILITIAN



1. TUJUAN PENELITIAN Menggunakan metode Support Vector Machine (SVM) untuk membedakan opini positif dan negative Meng-crawling data di twitter dengan menggunakan hastag



2. MANFAAT PENELITIAN Manfaat dari penelitian ini, dengan menggunakan metode SVM tidak perlu melakukan survey atau menyebarkan kusioner untuk memperoleh opini-opini dari masyarakat Indonesia terkhususkan untuk tragedi stadion Kanjuruhan Malang.



V.



METODOLOGI PENELITIAN 1. Pengumpulan Data Data yang akan digunakan adalah data dari artikel berita olahraga mengenai terjadinya tragedi di stadion Kanjuruhan malang. Data tersebut di peroleh dari tiga situs online berita republika.co.id, JawaPos.com, dan Kompas.com dengan beberapa kata kunci pencarian (keyword) yaitu Stadion Kanjuruhan, tragedy Kanjuruhan, Kanjuruhan, Malang serta kata kunci lain yang berhubungan dengan Tragedi Kanjuruhan. Pada situs berita tersebut banyak terdapat artikel atau berita mengenai Tragedi Kanjuruhan sehingga penulis gunakan untuk mengklasifikasikan data berita positif dan data berita negatif. Data berita yang digunakan dalam penelitian ini sebanyak 200 data.



3



Data yang diperoleh merupakan sumber data yang diambil secara langsung dari Twitter menggunakan bahasa Python dan library Twitterscraper dengan keyword pencarian “Tragedi Kanjuruhan”. twitterscraper “tragedi kanjuruhan” - -limit 100000 - Data yang didapatkan dari proses crawling ini adalah sebanyak 82.715 tweets.



2. Pengolahan Data Awal Pada tahap ini dilakukan klasifikasi teks atau sentimen dengan tahapan preprocessing agar teks yang memiliki isi yang tidak sempurna seperti data yang hilang, data yang tidak valid atau juga hanya sekedar salah ketik. Data tersebut lebih baik dibuang karena keberadaannya bisa mengurangi mutu atau akurasi. Untuk itu, dalam pengolahan data awal, text mining harus melalui beberapa tahapan yang disebut dengan preprocessing. Tahapan preprocessing yang dapat dilakukan yaitu: Tokenize, Filter Tokens (By Length), Stopwords Removal, Transform Cases (Utami,2017). Praproses data sentimen, data mentah yang diperoleh dilakukan pemrosesan untuk mengubahnya menjadi data yang siap digunakan.



3. Metode yang Diusulkan Metode atau model yang diusulkan yaitu menggunakan Support Vector Machine dengan menggunakan seleksi fitur Particle Swarm Optimization (PSO). Metode ini yang nantinya akan menentukan opini positif dan negative.



4. Evaluasi Data Pengujian atau evaluasi hasil memiliki tujuan agar dapat diketahui seberapa baiknya kinerja dari mesin pada tahapan pembelajaran menggunakan kernel SVM. Evaluasi kinerja menggunakan teknik confusion matrix dan lalu dihasilkan nilai akurasi yang merupakan informasi paling penting dari kesuksesan algoritma yang lebih berkelas pada pemrosesan data yang diklasifikasi. Melalui penggunaan tiga jenis kernel yang dihasilkan dilakukan perbandingan yang bertujuan agar dapat diketahui kenal yang paling baik dari SVM pada data Tragedi Kanjuruhan. Parameter kinerja confusion matrix merupakan akurasi yang memiliki definisi menjadi rasio banyaknya diagonal utama terhadap banyaknya total objek. Apabila akurasinya mendekati 100%, hasil dari kinerja algoritma hampir sempurna. Confusion matrix hanya memiliki dua output kelas dengan empat istilah sebagai representasi dari



4



hasil proses klasifikasi, termasuk true positive (TP), true negative (TN), false positive (FP), false negative (FN). Berdasarkan nilai empat representasi tersebut, nilai dari accuracy, precision, dan recall dapat diperoleh. Rumus confusion matrix dalam menghitung nilai akurasi: 𝑎𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = ∑𝐼𝑥=1



𝑇𝑃𝑥+𝑇𝑁𝑥 𝑇𝑃𝑥+𝑇𝑁𝑥+𝐹𝑃𝑥+𝐹𝑁𝑥



x 100%



Tingkat kesalahan klasifikasi (misclassification), merupakan persentase dari seberapa besar kesalahan yang terjadi oleh klasifikasi yang dihasilkan. Semakin kecil persentase kesalahan, semakin baik kinerja yang dimiliki algoritma yang digunakan. 𝑒𝑟𝑟𝑜𝑟 𝑟𝑎𝑡𝑒 = 1 – 𝑎𝑐𝑐𝑢𝑟𝑎𝑐𝑦 Recall atau sensitivitas merupakan perbandingan dari banyaknya objek yang dilakukan klasifikasi dengan benar menjadi bagian dari kelas x pada sistem dengan banyaknya objek dari kelas yang diprediksi sebagai kelas x. recall =∑𝐼



∑𝐼𝑥=1 𝑇𝑃𝑥



𝑥=1(𝑇𝑃𝑥+𝐹𝑁𝑥)



VI.



JADWAL KEGIATAN



Kegiatan



Bulan 1 M1



Studi Kepustakaan Pengumpulan Data Pengolahan Data Perancangan Sistem Pembuatan Program Pengujian Sistem Penyusunan Laporan



5



M2



M3



Bulan 2 M4



M1



M2



M3



Bulan 3 M4



M1



M2



M3



M4



VII.



RANCANGAN SISTEM



1. Flowchart untuk perhitungan analisis ssentimen



2. Flowchart untuk perhitungan SVM



6



3. Flowchart untuk perhitungan Particle Swarm Optimization (PSO)



4. Rancangan confusion matrix



7



5. Rancangan Crawling Data



VIII.



DAFTAR PUSTAKA 



https://openlibrarypublications.telkomuniversity.ac.id/index.php/engineering/articl e/view/2444







https://www.researchgate.net/profile/RizalPerdana/publication/320234928_Analisis_Sentimen_Tingkat_Kepuasan_Penggun a_Penyedia_Layanan_Telekomunikasi_Seluler_Indonesia_Pada_Twitter_dengan_ Metode_Support_Vector_Machine_dan_Lexicon_Based_Features/links/59d64f61a 6fdcc52aca7c6eb/Analisis-Sentimen-Tingkat-Kepuasan-Pengguna-PenyediaLayanan-Telekomunikasi-Seluler-Indonesia-Pada-Twitter-dengan-MetodeSupport-Vector-Machine-dan-Lexicon-Based-Features.pdf







https://journal.trunojoyo.ac.id/edutic/article/view/8779







https://pdfs.semanticscholar.org/f0d1/5870ff2ab5995bf3040dd7c0939e2897a94c.pd f







https://www.academia.edu/9667997/B_Jadwal_Penelitian_Jadwal_penelitian_pada _proposal_ini_adalah_sebagai_berikut



8







https://www.academia.edu/9262394/Bab_3_Metodologi_Penelitian







https://jurnal.unsil.ac.id/index.php/jssainstek/article/view/2525







https://prosiding.stis.ac.id/index.php/semnasoffstat/article/view/1483







https://www.researchgate.net/profile/Erwin-Setiawan3/publication/308815966_Data_Crawling_Otomatis_pada_Twitter/links/5bb583239 2851ca9ed37a37e/Data-Crawling-Otomatis-pada-Twitter.pdf







9



https://link.springer.com/article/10.3758/BF03213026