Data Analysis With Python [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

Data Analysis with Python Tasya Amanda Adinegara



Analogi



Apa itu Exploratory Data Analysis (EDA)? EDA mengacu pada proses kritis dalam melakukan penyelidikan awal pada data untuk menemukan pola, untuk menemukan anomali, untuk menguji hipotesis dan untuk memeriksa asumsi dengan bantuan statistik ringkasan dan representasi grafis.



Mengapa EDA penting dalam Data Science?



Dimana EDA berada pada proses Data Science?



Data scientist menghabiskan sekitar 60-70% dari waktu mereka dalam sebuah proyek yang bekerja melalui data cleaning hingga feature engineering. Kira-kira 40–50% dari waktu itu dihabiskan di EDA.



Proses EDA



Sneak peek into the Data Kita bisa melakukan ini di notebook Jupyter dengan mengambil potongan data dalam format dan menggunakan libraries seperti Plotly, Matplotlib, Seaborn untuk wawasan awal. Kita juga bisa menggunakan Power BI atau Tableau. Dasbor berikut memberikan gambaran umum serta memberikan wawasan kepada pemangku kepentingan tentang bagaimana kinerja organisasi, sejauh mana tujuan analisis berkembang.



Data Validation Langkah ini memeriksa untuk melihat apakah data memiliki anomali, nilai yang hilang, atau pencilan. Dan memastikan tidak ada kesalahan pada tahap pendataan.



Univariate Analysis Visualisasi univariat dari setiap bidang dalam kumpulan data mentah, dengan statistik ringkasan.



Bivariate Analysis Visualisasi bivariat dan statistik ringkasan yang memungkinkan Anda menilai hubungan antara setiap variabel dalam kumpulan data dan variabel target yang Anda lihat.



Multivariate Analysis Ini dilakukan melalui plot multivariate seperti plot 3D untuk mengevaluasi hubungan antar fitur, dan terakhir, memahami fitur yang penting untuk latihan machine learning apa pun.



Study Case : Hospital Descriptive Analytics (?) Diagnostics Analytics (?) Predictive Analytics (?) Prescriptive Analytics (?)



Data Visualization in EDA



Alat EDA



Terimakasih