Laprak Analisis Data [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

LAPORAN PRAKTIKUM I ANALISIS DATA STATISTIKA (Statistika Deskriptif)



Oleh: Nama



: Idris Akmal



NIM



: 119410066



Asisten Praktikum NIM



: Yenci Brika Enkekes :16117069



PROGRAM STUDI SAINS AKTUARIA JURUSAN SAINS INSTITUT TEKNOLOGI SUMATERA 2020



ABSTRAK Idris Akmal Program Studi Aktuaria, Jurusan Sains, Institut Teknologi Sumatera [email protected] Dalam kehidupan manusia, tentunya banyak sekali data yang muncul dan berserakan. Hadirnya ilmu statistika menjadi solusi tentang bagaimana manusia mengolah dan menyajikan data dengan selayaknya. Adapun tujuan dari praktikum analisi data statistik ini adalah agar mahasiswa dapat menghitung, menampilkan, serta menunjukkan bentuk statistika deskriptif dari suatu permasalahan. Dalam ilmu statistika sendiri, banyak sekali metode statistika yang dapat digunakan untuk mengolah data. Salah satunya adalah metode statistika deskriptif. Statistika deskriptif merupakan suatu metode bagaimana cara mengumpulkan angka-angka, menabelkan angka-angka menggambarkannya, mengolah dan menganalisis angkaangka tersebut. Masalah yang sering kali muncul dalam kehidupan manusia adalah banyakya data yang tidak cukup hanya sekedar didata melainkan juga perlu dicari sari numerik dan menampilkan diagram maupun gambar dari data tersebut agar lebih mudah untuk dipahami. Dalam pemograman rstudio, untuk mencari sari numerik ada beberapa perintah yang dapat dijalankan. Perintah tersebut diantaranya; perintah summary, describe pada package hmisc, stat.desc pada package pastecs, skim pada package skimr, dan descr pada package summarytools. Selain perintah mencari sari numerik, dalam rstudio juga terdapat perintah yang dapat dijalankan untuk menampilkan data dalam bentuk gambar maupun diagram, diantaranya; histogram, melainkan juga terdapat pie chart, box plot, dan plot. Kesimpulan dalam praktikum ini, mahasiswa dapat mencari sari numerik, menampilkan grafik, melakukan perhitungan, dan dapat menentukan bentuk statistika deskriptif.



ii



DAFTAR ISI ABSTRAK ................................................................................................................. ii DAFTAR ISI ............................................................................................................ iii DAFTAR TABEL..................................................................................................... iv DAFTAR GAMBAR ................................................................................................. v BAB I ......................................................................................................................... 1 PENDAHULUAN ...................................................................................................... 1 A.



Latar Belakang ......................................................................................................... 1



B.



Tujuan ..................................................................................................................... 2 BAB II........................................................................................................................ 3 TINJAUAN PUSTAKA ............................................................................................ 3



1.



Statistika ................................................................................................................. 3



2.



Statistik Deskriptif Statistik Deduktif ........................................................................ 3



3.



Populasi dan Sampel ............................................................................................... 3



4.



Penyajian Data ........................................................................................................ 3 BAB III ...................................................................................................................... 5 PERMASALAHAN ................................................................................................... 5



1.



Permasalahan I ........................................................................................................ 5



2.



Permasalahan II ....................................................................................................... 9 BAB IV .................................................................................................................... 10 PENYELESAIAN ................................................................................................... 10



A.



Permasalahan I ...................................................................................................... 10



B.



Permasalahan II ..................................................................................................... 14 BAB V ...................................................................................................................... 18 KESIMPULAN ....................................................................................................... 18



Daftar Pustaka .............................................................................................................. 19



iii



DAFTAR TABEL 1. Tabel 3.1 Tabel permasalahan 1………………………………………5-6 2. Tabel 3.2 Tabel permasalahan 2……………………………………….9



iv



DAFTAR GAMBAR 1. Gambar 3.1 Contoh box plot permasalahan 1…………………………….6 2. Gambar 3.2 Contoh box plot permasalahan 1…………………………….8 3. Gambar 4.1 Tampilan sari numerik menggunakan perintah summary(nama_data)…………………………………………………....10 4. Gambar 4.2 Tampilan sari numerik menggunakan perintah stat.desc(nama_data)………………………………………………..……10 5. Gambar 4.3 Tampilan sari numerik menggunakan perintah describe(nama_data)…………………………………………………...…11 6. Gambar 4.4 Tampilan sari numerik menggunakan perintah skim(nama_data)…………………………………………………………12 7. Gambar 4.5 Tampilan sari numerik menggunakan perintah summarytools::descr(nama_data)…………………………………..……12 8. Gambar 4.6 Tampilan box plot setiap minggu pada permasalahan Tabel 1…………………………………………………………………...13 9. Gambar 4.7 Tampilan sari numerik tabel 2 menggunakan perintah summary(nama_data)…………………………………………………....14 10. Gambar 4.8 Tampilan sari numerik menggunakan perintah stat.desc(nama_data)…………………………………………………..…14 11. Gambar 4.9 Tampilan sari numerik menggunakan perintah skim(nama_data)………………………………………………………....14 12. Gambar 4.10 Tampilan sari numerik menggunakan perintah describe(nama_data)……………………………………………………..15 13. Gambar 4.11 Tampilan sari numerik menggunakan perintah summarytools::descr(nama_data)………………………………………...16 14. Gambar 4.12 Tampilan histogram, plot, pie chart, dan box plot dari permasalahan tabel 2……………………………………………………..16



v



BAB I PENDAHULUAN A. Latar Belakang Dalam kehidupan kita sehari-hari, tentunya kita sudah tidak asing lagi dengan istilah data. Setiap ruang lingkup kehidupan kita, tanpa disadari begitu banyak data yang muncul dan memenuhi kehidupan kita. Seperti contohnya; banyaknya penumpang bus pada pagi, siang, dan malam hari, jumlah anggota keluarga kita, banyaknya baju yang kita miliki, jumlah sel darah dalam tubuh kita, dan lain-lain, hingga ke waktu yang kita lewati sekalipun, semua itu merupakan bagian dari data. Banyaknya data yang tersebar di kehidupan manusia, membuat kita sebagai manusia berpikir bagaimana cara agar data tersebut dapat diolah dan disajikan sedemikian rupa. Sehingga data yang sudah diolah dan disajikan tersebut dapat diambil manfaatnya untuk kebaikan hidup manusia. Ilmu statistika muncul sebagai ilmu yang memberikan solusi serta bimbingan bagaimana kita dapat mengolah dan menyajikan data secara layak. Permasalahan tentang bagaiamana mengolah dan menyajikan data telah cukup rampung dibahas di dalam ilmu statistika. Ilmu statistika sendiri tidak hanya membahas tentang bagaimana mengolah dan menyajikan data, melainkan ada pula membahas bagaimana teknik mengumpulkan data. Teknik pengumpulan data ini juga sangat diperlukan untuk kita dapat mengolah dan menyajikan data. Karena berbicara tentang data, kita juga akan berbicara tentang tingkat akurasi data tersebut. Semakin baik teknik pengumpulan data yang digunakan, semakin baik pula tingkat keakuratan hasil data yang akan diolah dan disajikan. Berdasarkan permasalahan yang sering timbul di kehidupan kita dan penjelasan singkat tentang ilmu statistika di atas. Oleh karena itu ilmu statistika sangatlah penting untuk dipelajari dan dipahami, mengingat banyaknya data yang muncul setiap saatnya dalam kehidupan kita. Maka dari itu juga sebagai bukti betapa pentingnya praktikum Analisis Data Statistik ini yang nantinya akan dipelajari, digunakan, dan dikembangkan untuk kebaikan kehidupan manusia sehari-hari.



1



B. Tujuan Setelah mengikuti praktikum ini, mahasiswa diharapkan mampu : a. Menentukan nilai ukuran pemusatan, ukuran sebaran dan ukuran distribusi. b. Menampilkan hasil perhitungan Box-Plot, Histogram dan diagram Stem-Leaf dan lain sebagainya. c. Menentukan jenis Statistika Deskritif yang sesuai dengan permasalahan.



2



BAB II TINJAUAN PUSTAKA 1. Statistika Statistika merupakan ilmu pengetahuan yang mempelajari tentang bagaimana mengumpulkan, mengolah, menganalisis dan menginterpretasikan data sehingga memberikan informasi yang akurat. Sedangkan statistik adalah kumpulan data yang disajikan dalam bentuk tabel/daftar, gambar atau ukuran-ukiran tertentu. Misalnya statistik penduduk, statistik kelahiran, statistik pertanian, statistik perdagangan, dan lain-lain. (Dr. M. Muchson, 2017) 2. Statistik Deskriptif Statistik Deduktif Merupakan suatu metode bagaimana cara mengumpulkan angka-angka, menabelkan angka-angka menggambarkannya, mengolah dan menganalisis angkaangka tersebut serta menginterpretasikannya dengan memberi penafsiranpenafsiran atau dengan perkataan lain merupakan suatu metode tentang bagaimana cara untuk mengumpulkan angka-angka dalam bentuk catatan dan untuk selanjutnya bagaimana cara menyajikan angka angka tersebut dalam bentuk grafik untuk dianalisis dan ditafsirkan dengan mengambil kesimpulan. (Dr. Vivi Silvia, 2017) 3. Populasi dan Sampel Populasi adalah wilayah generalisasi berupa subjek atau objek yang diteliti untuk dipelajari dan diambil kesimpulan, atau dengan kata lain, populasi adalah totalitas dari seluruh objek penelitian. Banyaknya objek penelitian yang diteliti disebut dengan ukuran populasi, dimana ukuran tersebut bervariasi tergantung pada jenis populasi yang diteliti. Misalnya, penelitian terhadap pengeluaran rumah tangga tani per bulan di propinsi A, B maupun C. Untuk masing-masing propinsi, pengeluaran rumah tangga petani dapat berbeda maupun sama. Sampel adalah objek pengamatan yang dipilih dari populasi, sehingga sampel merupakan bagian dari populasi dan mencerminkan karakteristik populasinya. Oleh karena itu, meskipun penelitian menggunakan data sampel dan bukannya data populasi, namun hasilnya dapat digeneralisasikan pada populasi. Banyaknya objek penelitian dalam sampel disebut ukuran sampel. (Wahyudi, 2017) 4. Penyajian Data 3



Data statistik tidak hanya cukup dikumpulkan dan diolah, tetapi juga perlu disajikan dalam bentuk yang mudah dibaca dan dimengerti oleh pengambil keputusan. Penyajian data ini bisa dalam bentuk tabel atau grafik dengan keuntungan bahwa data tersebut akan lebih cepat ditangkap dan dimengerti daripada disajikan dalam bentuk kata-kata. Seorang manajer penjualan bisa menganalisis kecenderungan peningkatan penjualan dengan melihat grafik penjualan yang menunjukkan kecenderungan (trenul) menaik. Berdasarkan grafik itu, ia dapat memperkirakan berapa jumlah barang yang akan diproduksi, berapa tingkat permintaan pasar, dan berapa jumlah barang yang akan terjual sehingga over production atau under production bisa dihindari. Dengan kata lain, penyajian data dalam bentuk tabel dan grafik akan membuat proses pengambilan keputusan lebih tepat cepat, dan akurat. Selain berupa angka-angka ringkasan (summary figures), penyajian data juga dapat berbentuk tabel dan grafik. Tabel merupakan kumpulan angka-angka yang disusun menurut kategori-kategori (misalnya, jumlah pegawai menurut pendidikan dan masa kerja: jumlah penjualan menurut jenis barang dan daerah penjualan; jumlah produksi menurut jenis barang dan kantor cabang dan lain sebagainya) sehingga memudahkan untuk pembuatan analisis data, Grafik merupakan gambar-gambar yang menunjukkan secara visual data berupa angka (mungkin juga dengan simbol-simbol) yang biasanya juga berasal dari tabel-tabel yang telah dibuat. Baik tabel maupun grafik bisa dipergunakan untuk menyajikan cross section data dan data berkala. (J. Supranto, 2000)



4



BAB III PERMASALAHAN 1. Permasalahan I Seorang pimpinan perusahaan XYZ ingin mengecek kinerja 30 pegawainya berdasarkan jumlah total jam kerja yang dihitung setiap minggu selama 2 bulan (8 minggu). Pada perusahaan XYZ, minimal total jam kerja pegawai adalah 40 jam per minggu. Pimpinan tersebut memerintahkan kepala bagian kepegawaian untuk menyiapkan data presensi kehadiran setiap minggu selama 2 bulan (8 minggu). Setelah dilakukan rekapitulasi, diperoleh data sebagai berikut: Tabel 3.1 Tabel permasalahan 1 Kode Pegawai



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26



1 43,00 39,25 40,50 49,25 45,50 40,50 46,75 36,75 53,00 54,25 43,00 44,25 45,50 45,50 43,00 51,75 43,00 50,50 51,75 51,75 48,00 38,00 48,00 54,25 49,25 48,00



Jumlah Jam Kerja Setiap Minggu (dihitung berdasarkan jam masuk sampai jam pulang) Minggu ke2 3 4 5 6 7 43,00 41,75 45,50 40,50 43,00 54,25 46,75 38,00 38,00 33,00 43,00 55,50 43,00 43,00 49,25 44,25 53,00 51,75 48,00 39,25 45,50 40,50 50,50 49,25 41,75 49,25 35,00 30,00 51,75 41,75 53,00 49,25 51,75 46,75 49,25 44,25 54,25 48,00 38,00 33,00 38,00 49,25 65,00 53,00 39,00 20,00 54,25 46,75 49,25 40,50 51,75 46,75 55,50 55,50 49,25 36,75 50,50 45,50 49,25 53,00 45,50 48,00 44,00 45,50 38,00 46,75 60,00 53,00 70,00 40,00 38,00 48,00 43,00 39,25 50,50 45,50 46,75 44,25 39,25 55,50 43,00 38,00 43,00 50,50 45,50 49,25 32,00 40,50 54,25 43,00 40,50 45,50 40,50 35,50 51,75 40,50 49,25 45,50 46,75 41,75 51,75 45,50 48,00 40,50 39,25 34,25 51,75 69,00 50,50 39,25 45,00 36,75 39,25 70,00 51,75 46,75 44,00 44,25 44,25 36,75 53,00 41,75 49,25 44,25 68,00 44,25 70,00 46,75 31,00 42,00 40,50 46,75 54,25 45,50 41,75 36,75 51,75 49,25 48,00 45,50 45,00 39,25 55,50 48,00 53,00 54,25 43,00 38,00 46,75 50,50 49,25 40,50 36,75 31,75 40,50 46,75 5



8 46,75 51,75 15,00 46,75 75,00 41,75 36,75 41,75 45,50 39,25 44,25 40,50 44,25 49,25 51,75 49,25 49,25 45,50 45,50 38,00 46,75 46,75 55,50 55,50 55,50 39,25



27 28 29 30



41,75 38,00 38,00 39,25



41,75 39,25 41,75 40,50



50,50 53,00 54,25 40,50



Berdasarkan data tersebut,



39,00 44,25 53,00 55,50 bagaimana



36,75 39,25 48,00 50,50 cara



50,50 55,50 36,75 45,50 kepala



40,50 50,50 39,25 38,00



50,50 54,25 36,75 53,00



bagian



kepegawaian untuk menjelaskan hasil rekapitulasi kepada pimpinan perusahaan menggunakan alat bantu RStudio dengan ketentuan. : a. Sari Numerik b. Box-Plot (berikan informasi numerik komponen Box-Plot) Petunjuk : jelaskan masing-masing informasi yang dihasilkan dan simpulkan. Catatan Tugas 1 :



Gambar 3.1 Contoh box plot permasalahan 1



6



Komponen dalam BoxPlot Penjelasan analisis visual sederhana dari Boxplot diatas adalah sebagai berikut : Posisi kotak utama (IQR / dq), Median (Q2), dan juga Rata-rata (Mean) setiap minggu menunjukan hasil yang berbeda. Visual tersebut dapat menggambarkan perbandingan karakteristik masing-masing minggu.



Komponen-komponen dari hasil Boxplot data keseluruhan dijelaskan sebagai berikut: 



Interquartile Range (IQR) atau bagian utama BoxPlot menggambarkan 50 % dari nilai data pengamatan. IQR dapat diperoleh dengan IQR = Q3 – Q1







Garis yang merupakan perpanjangan dari box (baik ke arah atas ataupun ke arah bawah) dinamakan dengan whiskers. 



Whiskers bawah menunjukkan nilai yang lebih rendah dari kumpulan data yang berada dalam IQR.







Whiskers atas menunjukkan nilai yang lebih tinggi dari kumpulan data yang berada dalam IQR







Nilai







Panjang whisker atas ≤ Q3 + (1.5 x IQR)







Panjang whisker bawah ≥ Q1 – (1.5 x IQR)



yang



berada



whisker



di



atas



atau



dibawah



dinamakan nilai outlier atau



ekstrim. 







Nilai outlier adalah nilai data yang letaknya diatas atau dibawah whisker 



Q3 + (1.5 x IQR) < Outlier Atas ≤ Q3 + (3 x IQR)







Q1 – (1.5 x IQR) > Outlier Bawah ≥ Q1 – (3 x IQR)



Nilai ekstrim adalah nilai-nilai yang letaknya diatas atau dibawah outlier 



Ekstrim bagian atas apabila nilainya > Q3 + (3 x IQR) dan







Ekstrim bagian bawah apabila nilainya < Q1 – (3 x IQR)



7



Berdasarkan penjelasan diatas, kita ambil contoh Boxplot pada minggu ke-7.



= 44,25 Q1 Q2 = 47,375 Q3 = 50,5 IQR Whisker Atas ≤ 50,5 + (1,5 x 6,25) = 59,875 Whisker Bawah ≥ 44,25 – (1,5 x 6,25) = 34,875



Batas Outlier A = 50,5 + (3 x 6,25) = 69,25 Batas Outlier B = 44,25 - (3 x 6,25) = 25,5



Gambar 3.2 Contoh box plot permasalahan 1



8



2. Permasalahan II Pak Budi merupakan salah satu pemilik perusahaan bus swasta Maju Lancar. Pak Budi ingin memperoleh informasi terkait jumlah penumpang armadanya pada minggu terakhir bulan desember 2019. Berdasarkan pendataan, diperoleh data sebagai berikut:



Tabel 3.2 Tabel permasalahan 2 Hari



Waktu 08.00 - 09.00 09.00 - 10.00 10.00 - 11.00 11.00 - 12.00 12.00 - 13.00 13.00 - 14.00 14.00 - 15.00 15.00 - 16.00 16.00 - 17.00 17.00 - 18.00



Senin 21 19 18 19 15 16 19 15 25 16



Selasa 32 28 32 27 24 20 28 32 28 27



Rabu Kamis Jumat Sabtu 54 35 19 50 43 23 18 51 55 32 17 50 40 29 24 67 44 28 18 74 28 24 17 70 39 34 24 42 37 35 16 55 50 28 19 66 48 33 17 53



Minggu 66 66 65 75 84 83 81 69 69 65



Bantulah Pak Budi untuk mendapatkan informasi terbaik yang dapat diperoleh dari data-data tersebut meliputi puncak penumpang bis, karakteristik setiap harinya, ada tidaknya jam-jam padat, dsb.



9



BAB IV PENYELESAIAN A. Permasalahan I 1. Sari Numerik 



Summary



Gambar 4.1 Tampilan sari numerik menggunakan perintah summary(nama_data)







Pastecs



Gambar 4.2 Tampilan sari numerik menggunakan perintah stat.desc(nama_data)



10







Hmisc



Gambar 4.3 Tampilan sari numerik menggunakan perintah describe(nama_data)



11







Skimr



Gambar 4.4 Tampilan sari numerik menggunakan perintah skim(nama_data)







Summarytools



Gambar 4.5 Tampilan sari numerik menggunakan perintah summarytools::descr(nama_data)



12



2. Box plot



Gambar 4.6 Tampilan box plot setiap minggu pada permasalahan tabel 1



Informasi data: a. Q1 = 40.5 b. Q2 = 45.5 c. Q3 = 49.25 d. IQR = 49.25 – 40.5 = 8.75 e. Whisker Atas = 49.25 + (1.5 x 8.75) = 62.375 f. Whisker Bawah = 40.5 – (1.5 x 8.75) = 27.375 g. Batas Outliner A = 49.25 + (3 x 8.75) = 75.5 h. Batas Outliner B = 40.5 – (4 x 8.75) = 14.25 i. Outliner Atas berada di antara 62.375 dan 75.5 j. Outliner Bawah berada di antara 27.375 dan 14.25



13



k. Ekstrim atas >75.5 l. Ekstrim bawah < 14.25



B. Permasalahan II 1. Sari Numerik 



Summary



Gambar 4.7 Tampilan sari numerik tabel 2 menggunakan perintah summary(nama_data)







Pastecs



Gambar 4.8 Tampilan sari numerik menggunakan perintah stat.desc(nama_data)







Skimr



Gambar 4.9 Tampilan sari numerik menggunakan perintah skim(nama_data)



14







Hmisc



Gambar 4.10 Tampilan sari numerik menggunakan perintah describe(nama_data)



15







Summarytools



Gambar 4.11 Tampilan sari numerik menggunakan perintah summarytools::descr(nama_data)



2. Histogram, plot, pie chart, dan box plot



Gambar 4.12 Tampilan histogram, plot, pie chart, dan box plot dari permasalahan tabel 2



16



Pembahasan: 1. Pada hari Senin penumpang bus yang paling banyak terjadi pada pukul 16.0017.00 dengan total 25 penumpang. Yang paling sedikit berjumlah 15 penumpang pada pukul 12.00-13.00 dan 15.00-16.00. 2. Pada hari Selasa penumpang bus yang paling banyak terjadi pada pukul 10.0011.00 total 32 penumpang. Yang paling sedikit berjumlah 20 penumpang pada pukul 13.00-14.00. 3. Pada hari Rabu penumpang bus yang paling banyak terjadi pada pukul 10.0011.00 total 55 penumpang. Yang paling sedikit berjumlah 28 penumpang pada pukul 14.00-15.00. 4. Pada hari Kamis penumpang bus yang paling banyak terjadi pada pukul 08.0009.00 dan 15.00-16.00 total 35 penumpang. Yang paling sedikit berjumlah 23 penumpang pada pukul 09.00-10.00. 5. Pada hari Jumat penumpang bus yang paling banyak terjadi pada pukul 11.0012.00 dan 14.00-15.00 total 24 penumpang. Yang paling sedikit berjumlah 16 penumpang pada pukul 15.00-16.00. 6. Pada hari Sabtu penumpang bus yang paling banyak terjadi pada pukul 12.0013.00 total 74 penumpang. Yang paling sedikit berjumlah 42 penumpang pada pukul 14.00-15.00. 7. Pada hari Minggu penumpang bus yang paling banyak terjadi pada pukul 12.0013.00 total 84 penumpang. Yang paling sedikit berjumlah 65 penumpang pada pukul 10.00-17.00.



17



BAB V KESIMPULAN 1. Dalam mencari sari numerik pada Rstudio dari suatu data tidak hanya menggunakan perintah summary, melainkan juga dapat menggunakan describe pada package hmisc, stat.desc pada package pastecs, skim pada package skimr, dan descr pada package summarytools. 2. Untuk menampilkan grafik dari suatu data tidak hanya berupa histogram, melainkan juga terdapat pie chart, box plot, dan plot. 3. Dapat menentukan nilai ukuran pemusatan, ukuran sebaran dan ukuran distribusi. 4. Dapat menampilkan hasil perhitungan Box-Plot, Histogram dan diagram Stem-Leaf dan lain sebagainya. 5. Dapat menentukan jenis Statistika Deskritif yang sesuai dengan permasakahan.



18



Daftar Pustaka Dr. M. Muchson, S. M. (2017). Statistik Deskriptif. Jakarta: Penerbit Guepedia. Dr. Vivi Silvia, S. M. (2017). Statistika Deskriptif. Jakarta: Penerbit Andi. J. Supranto, M. (2000). Statistik: Teori & Aplikasi, edisi 6, jilid 1. Jakarta: Erlangga. Wahyudi, S. T. (2017). Statistika Ekonomi Konsep, Teori dan Penerapan. Malang: Universitas Brawijaya Press, 2017.



19