ADE Analisis Data Eksplorasi 1 2 [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

-1– PENDAHULUAN – PEMERIKSAAN POLA SEBARAN DATA (DATA BERSTRUKTUR TUNGGAL) Histogram, Diagram Dahan-Daun, Ringkasan Numerik, Diagram Kotak Garis (Box Plot)



D10F-3003 / 4 (3-1) SKS



ADE (Analisis Data Eksplorasi) Tim Teaching ADE



Materi ADE • •



• •



• •







Pendahuluan Pemeriksaan Pola Sebaran Data (Data Berstruktur Tunggal) – Histogram, Diagram Dahan-Daun, Ringkasan Numerik, Diagram Kotak Garis (Box Plot). Pembandingan Kelompok Data Transformasi Data – Transformasi Kesimetrisan Data – Transformasi Kehomogenan Varians Pemeriksaan Asumsi Sebaran Data Data Berpasangan dan Persamaan Garis Lurus : – Garis Resisten – Proses Iterasi dalam Garis Resisten – Transformasi untuk Meluruskan Garis Analisis Elementer : – Analisis Elementer Rata-Rata – Analisis Median Polish



ADE 1: Pemeriksaan Pola Sebaran Data



Page 2



Analisis Data Eksplorasi Proses analisis data pada dasarnya meliputi upaya penelusuran dan pengungkapan informasi yang relevan yang terkandung dalam data dan penyajian hasilnya dalam bentuk yang lebih ringkas dan sederhana, sederhana, yang pada akhirnya mengarah kepada keperluan adanya penjelasan dan penafsiran. penafsiran. Munculnya pendekatan analisis data eksplorasi dipelopori oleh J. W. Tukey sejak awal tahun 1970 1970--an dan menjadi populer dengan terbitnya buku mengenai teknik eksplorasi data (Tukey (Tukey,, 1977) ADE 1: Pemeriksaan Pola Sebaran Data



Page 3



Analisis Data Eksplorasi



(cont..)



• Munculnya pendekatan ini terutama disebabkan oleh dua hal, yaitu : A. Pola sebaran normal yang banyak melandasi teknikteknik statistika ternyata tidak selalu mencerminkan pola sebaran data yang dimiliki B. Anggapan bahwa pengamatan yang dilakukan merupakan sampel acak dari suatu populasi tertentu tidak selalu terpenuhi dalam pelaksanaannya. • Pada tahap awal, proses ini diusahakan tanpa terikat pada asumsi-asumsi yang ketat, agar supaya pengungkapan informasi dapat dilakukan dengan fleksibel dan lebih merangsang imajinasi yang sehat tanpa melupakan kaidah-kaidah ilmu maupun teori yang telah dikenal. ADE 1: Pemeriksaan Pola Sebaran Data



Page 4



Analisis Data Eksplorasi



(cont..)



• Analisis data yang bersifat eksploratif diawali dengan upaya penelusuran dan pengungkapan struktur dan pola yang dimiliki oleh data tanpa mengaitkan secara kaku pada asumsi-asumsi tertentu. • Dalam menelusuri struktur data, kita berusaha untuk memeriksa apakah data tersebut dapat diuraikan menjadi beberapa komponen dan apakah komponen tersebut bersifat aditif atau multiplikatif, atau merupakan komponen persamaan garis.



ADE 1: Pemeriksaan Pola Sebaran Data



Page 5



Analisis Data Eksplorasi



(cont..)



• Penelusuran pola data bertujuan untuk memeriksa bentuk atau pola sebaran data, yaitu apakah apakah data cenderung mengumpul di satu nilai tertentu atau pada beberapa nilai ? atau apakah beberapa nilai nampak agak jauh atau memencil dari kumpulannya? • Perubahan melalui transformasi data seringkali berhasil menyederhanakan struktur data atau mendapatkan pola sebaran yang dapat didekati oleh pola sebaran teoritik.



ADE 1: Pemeriksaan Pola Sebaran Data



Page 6



Analisis Data Eksplorasi



(cont..)



• Pemeriksaan hasil penguraian komponen data biasanya dilakukan dengan bantuan alat peraga berupa grafik, plot, tabel atau dalam bentuk ringkasan data. • Grafik menjadi alat peraga yang semakin penting peranannya dalam analsis data, baik sebagai ringkasan data maupun sebagai alat diagnosis kesesuaian model yang diduga.



ADE 1: Pemeriksaan Pola Sebaran Data



Page 7



Analisis Data Eksplorasi



(cont..)



• Keefektifan peranan analisis data sangat tergantung kepada kegigihan dalam mendapatkan model yang relevan dan menyingkap hal-hal yang masih tersembunyi. • Pemeriksaan terhadap residu dengan lebih seksama akan membawa ke arah model yang lebih baik atau ke arah metode pendugaan yang lebih sesuai.



ADE 1: Pemeriksaan Pola Sebaran Data



Page 8



Pemeriksaan Pola Sebaran • Kumpulan data yang berupa hasil pengukuran terhadap peubah tertentu pada umumnya bervariasi. Variasi atau keragaman nilai-nilai pengamatan, dapat dilihat melalui pola sebarannya. Pola sebaran sangat berguna dalam penentuan karakteristik data. • Pemeriksaan bentuk atau pola sebaran data dapat diawali dengan meringkas data. Yang kemudian dapat di sajikan berupa: – Histogram, – Diagram dahan daun (stem and leaf display), – Ringkasan numerik, – Diagram kotak-garis (box-plot). ADE 1: Pemeriksaan Pola Sebaran Data



Page 9



Meringkas Data Perhatikan Tabel 1.1 Angka kematian bunuh diri tahun 1971 Negara



L/p L Kanada P L Israel P L Jepang P L Austria P L Perancis P L Jerman P L Hongaria P L Italia P



25-34 21.6 7.8 9.4 7.6 21.5 14 28.8 8.4 16.4 6.6 28.3 11.3 48.2 12.7 7.1 3.5



35-44 27.3 11.5 9.8 4.2 18.7 10.3 40.3 16.4 25.2 8.9 34.6 15.6 65 18.4 8.3 3.7



45-54 31.1 14.8 10.2 6.7 21.1 13.2 52.3 22.4 36.1 13 41.3 24.2 84.1 26.9 10.8 5.5



ADE 1: Pemeriksaan Pola Sebaran Data



55-64 335 12.3 14 22.9 31.1 21 52.8 21.5 47.3 16.7 49.1 25.6 81.3 34.7 17.9 6.7



65-74 23.5 9.2 27.3 19.1 48.7 40.1 68.5 29.4 56 18.5 51.8 27.3 107.4 47.9 26.6 7.7



Negara



L/p L Belanda P L Polandia P L Spanyol P L Swedia P L Swiss P L Inggris P L USA P



25-34 7.8 4.7 26.2 4.4 4.1 1.4 27.6 13 21.7 10.4 9.6 5.1 19.6 8.6



35-44 10.6 8.2 29.1 4.7 7 1.6 40.5 17.5 33.6 15.9 12.7 6.5 22.2 12.1



45-54 17.9 10.5 35.9 6.6 9.6 3.8 45.7 19.6 41.1 18.2 14.6 10.7 27.8 12.5



55-64 20.2 15.8 32.3 7.3 13.7 5.4 51.2 22.4 50.3 20.1 17 13 32.8 11.4



65-74 28.2 17.3 27.5 7 21.9 5.7 35.1 17.1 50.8 20.6 21.7 14.1 36.5 9.3



Page 10



Meringkas Data (cont..) • Dalam data tersebut tampak banyak sekali informasi yang bisa dipetik. → Misalnya, tingkat bunuh diri dari pria ternyata lebih banyak dibandingkan dengan wanita. Negara dan umur tampaknya perlu diperhatikan juga. • Apabila diperhatikan, tabel tersebut tampak terlalu umum. Apabila peneliti ingin memperhatikan aspek khusus saja misalnya kematian pria pada usia termuda dan tertua, maka tabel di atas perlu dipecah menjadi: ADE 1: Pemeriksaan Pola Sebaran Data



Page 11



Negara



Pria 25-34



Pria 65-74



Asli



Dibulatkan



Asli



Dibulatkan



Kanada



21.6



22



23.5



24



Israel



9.4



9



27.3



27



Jepang



21.5



22



48.7



49



Austria



28.8



29



68.5



69



Perancis



16.4



16



56.0



56



Jerman



28.3



28



51.8



52



Hongaria



48.2



48



107.4



107



Italia



7.1



7



26.6



27



Belanda



7.8



8



28.2



28



Polandia



26.2



26



27.5



28



Spanyol



4.1



4



21.9



22



Swedia



27.6



28



35.1



35



Swiss



21.7



22



50.8



51



Inggris



9.6



10



21.7



22



USA



19.6



20



36.5



37



ADE 1: Pemeriksaan Pola Sebaran Data



Page 12



Meringkas Data (cont..) • Tampilan tabel diatas kemudian dapat disederhanakan agar lebih informatif, menjadi tabel distribusi frekuensi berikut: l



100-109



100-109



90-99



90-99



80-89



80-89



70-79



70-79



60-69



60-69



l



50-59



50-59



lll



40-49



l



30-39



ll llll ll



40-49



l



30-39 20-29



llll lll



20-29



10-19



ll



10-19



0-9



llll



0-9



ADE 1: Pemeriksaan Pola Sebaran Data



Page 13



1) HISTOGRAM • Digunakan sebagai langkah awal dalam mengorganisir data. Dalam pembuatannya, nilai-nilai pengamatan dikelompokkan menjadi beberapa kelas interval, kemudian frekuensi relatif untuk masing-masing kelas interval digambarkan sebagai tinggi kotak. Karena pengelompokan inilah, maka kita kehilangan informasi yang sebenarnya.



ADE 1: Pemeriksaan Pola Sebaran Data



Page 14



Batang & Daun Gabungan 2) Diagram (Steam and Leaf ) .



Laki-laki 25-34 10 9 8 7 6 5 4 3 2 1 0



8 22986820 60 9784



ADE 1: Pemeriksaan Pola Sebaran Data



Laki-laki 65-74 10 9 8 7 6 5 4 3 2 1 0



7



9 621 9 57 4778822



Page 15



Batang & Daun Gabungan 2) Diagram (Steam and Leaf ) .



Laki-laki 25-34



Laki-laki 65-74



10 9 8 7 6 5 8 4 3 22986820 60 9784 ADE 1: Pemeriksaan Pola Sebaran Data



7



9 621 9 57 477882 2 2 1 0 Page 16



Contoh lain dari Steam and Leaf Diketahui data yang berasal dari distribusi normal dengan ratarata 20 dan standar deviasi 5, sbb. : 16,8 13,1 14,6 22,6 24,4 – –



25,7 15,8 16,9 12,9 16,6



21,4 21,7 14,9 14,1 20,5



22,7 26,2 26,7 25,8 19,7



28,1 18,7 20,2 17,9 17,3



17,5 20,2 21,6 17,7 18,0



14,4 24,6 15,1 18,6 13,7



20,9 24,2 6,9 20,3 17,3



Akan dirinci atas angka satuan (sebagai digit utama untuk dahan) dan angka persepuluhan (sebagai digit penyerta untuk daun). Lajur DAHAN akan memiliki 24 buah baris yang ditandai dgn digit 6 – 28. Angka pertama, 16,8 shg DAHAN nya adalah 16 DAUNnya adalah 8. Angka berikutnya 25,7, dituliskan pada DAHAN 25 dan DAUN 7, dst. Tahapan ini dilanjutkan sampai data terakhir, sehingga akan didapat diagram DAHAN-DAUN sbb. :



ADE 1: Pemeriksaan Pola Sebaran Data



Page 17



Diagram Batang & Daun Gabungan .



Dahan



Daun 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28



9



• Secara tidak langsung kita telah melakukan urutan data. 9 17 1469 18 689 33579 67 7 22359 467 67 246 78 27



• Proses ini jauh lebih mudah jika dibandingkan dengan pengurutan secara langsung dari kumpulan data. • Hasil ini memberi gambaran pola sebaran datanya. • Jika diagram ini diputar, sehingga lajur dahannya tersusun secara horizontal, maka diagram ini tidak jauh berbeda dengan histogram.



1



ADE 1: Pemeriksaan Pola Sebaran Data



Page 18



Batang & Daun Gabungan 2) Diagram (Steam and Leaf ) .



• Dengan table seperti ini, akan terlihat bagaimana sebenarnya pola dari data. • Jadi tabel batang daun: – lebih informatif – memberikan informasi tentang pola data • Memperhatikan pola data maka pola data akan bergantung pada : dimana data tersebut berpusat dan bagaimana variasinya.



ADE 1: Pemeriksaan Pola Sebaran Data



Page 19



3) Ringkasan Numerik • Ringkasan numerik merupakan bilanganbilangan yang dapat memberikan gambaran mengenai sekelompok data (angkatan). • Dalam pendekatan eksploratif, ringkasan numerik yang penting adalah : ukuran pemusatan data dan ukuran penyebaran data. ADE 1: Pemeriksaan Pola Sebaran Data



Page 20



A. Ukuran Pemusatan Data (Pusat Angkatan)



– Jika skala pengukurannya interval atau rasio, maka ukuran yang tepat untuk mewakili kelompok data tersebut adalah Rata-rata (Mean). Tetapi rata-rata mempunyai kelemahan, yaitu “tidak tangguh” (tidak robust), karena terpengaruh oleh nilai ekstrim. Sehingga jika terdapat nilai data ekstrim, ganti ratarata oleh median (Me). Me merupakan pusat angkatan yang sangat tangguh, disebut : “resistant statistic”. Secara umum, Me lebih baik dari pada rata-rata untuk kepentingan eksplorasi karena Me “insensitive” terhadap outlier, tetapi Me masih ‘sensitive” terhadap satu atau dua observasi yang berada di tengah. ADE 1: Pemeriksaan Pola Sebaran Data



Page 21



A. Ukuran Pemusatan Data (Pusat Angkatan)



Jika terdapat outlier, sedangkan outlier tersebut tidak dikeluarkan dari data, maka sebagai pengganti nilai Rata-rata gunakan “M Estimator”, tetapi jika outlier tersebut dikeluarkan maka sebagai pengganti Rata-rata gunakan “Tri Mean” Cat : Tri Mean = TRI = (qA + qB + 2 Me)/4 – Jika skala pengukurannya paling sedikit ordinal, maka sebagai pusat angkatan, gunakan Me. – Jika skala pengukurannya nominal, maka sebagai pusat angkatan gunakan Modus. ADE 1: Pemeriksaan Pola Sebaran Data



Page 22



B. Ukuran Sebaran Data (Ukuran Dispersi)



– Untuk menyimpulkan sekumpulan data, tidak boleh hanya menggunakan ukuran pemusatannya saja (bisa keliru) tetapi harus dilengkapi dengan ukuran dispersinya. – Jika skala pengukurannya interval atau rasio, gunakan standar deviasi (jangan varians, karena varians dimensinya 2, misalnya orang2, kg2, dsb), atau rentang. Catatan : • Rentang mudah dihitung, tetapi tidak “robust”. Rentang hanya memperhatikan dua bilangan saja. • Untuk melihat keseragaman data ataupun variasi data : – Jika variabelnya sama dan satuan pengukurannya sama, boleh menggunakan standar deviasi. – Jika variabelnya berbeda dengan satuan pengukuran berbeda, maka gunakan Koefisien Variasi (KV). ADE 1: Pemeriksaan Pola Sebaran Data



Page 23



B. Ukuran Sebaran Data (Ukuran Dispersi)



– Jika skala pengukurannya ordinal, gunakan Rentang Antar Kuartil (RAK) RAK = Sebaran Tengah = d = qA - qB Catatan : RAK memberikan gambaran yang paling tepat dan tangguh untuk suatu angkatan. – Jika skala pengukurannya nominal, maka gunakan Indeks Dispersi



ADE 1: Pemeriksaan Pola Sebaran Data



Page 24



4) Diagram Kotak Garis (Box Plot atau Box and Wishker)



• Merupakan bentuk grafik hasil ringkasan numerik. • Ringkasan numerik yang diperlukan untuk mengkonstruksikan box plot adalah Median (Me), Kuartil Bawah (qB), Kuartil Atas (qA), Ekstrim Bawah (xB) dan Ekstrim Atas (xA). • Tukey, menuliskan ringkasan numerik secara sistematis sbb. : Me



TRI



qB



qA



qB



qA



xB



xA



xB



xA



ADE 1: Pemeriksaan Pola Sebaran Data



Page 25



4) Diagram Kotak Garis (Box Plot atau Box and Wishker)



• Bentuk kotak mencerminkan gambaran dari 50% data yang terletak di bag. tengah, sedangkan garis yang mencuat keluar dari kotak tsb. menggambarkan cakupan dari 25% data yang berada di ujung kumpulan data. • Gambar kotak ini dibatasi oleh nilai qB dan qA, sedang nilai Me ditunjukkan dg. garis di dalam kotak tersebut .



xA



qA Me



qB xB



4) Diagram Kotak Garis (Box Plot atau Box and Wishker)



Dalam stat. inferens sering diperlukan asumsi bahwa suatu angkatan berdistribusi normal. Dist. Normal memp. identifikasi khusus, yaitu simetris terhadap rata-rata juga Me dan mempunyai asimtot pada sumbu X (mempunyai ekor tipis).



ADE 1: Pemeriksaan Pola Sebaran Data



Page 27



4) Diagram Kotak Garis (Box Plot atau Box and Wishker)



• Secara eksploratif, hal ini dapat dideteksi melalui box plot dengan memperhatikan : a) Apakah garis di dalam kotak terletak ditengah-tengah?, secara numerik : Me = (qA + qB)/2 = (xA + xB) /2 = d/2 b) Apakah jarak antara xB dengan qB sama dengan jarak antara xA dan qA, atau : xA - qA = qB – xB Jika dipenuhi keduanya, maka angkatan (kelompok data) dikatakan simetris, tetapi jika hanya a) dipenuhi,maka dikatakan angkatan tidak jauh dari simetri ( karena bagian yang terpenting dari data terletak di tengah atau di dalam kotak). Jika tidak dipenuhi keduanya, maka angkatan dikatakan tidak simetri. ADE 1: Pemeriksaan Pola Sebaran Data



Page 28



4) Diagram Kotak Garis (Box Plot atau Box and Wishker)







Untuk mendeteksi pencilan (outlier): 1. Observasi luar (pencilan atau outlier): observasi yang berada di luar batas (inner fences): qB – 1,5 d dan qA + 1,5 d 2. Observasi jauh di luar : observasi yang berada jauh di luar batas (outer fences): qB – 3 d dan qA + 3 d







Harga ekstrim perlu diketahui,karena: – mungkin merupakan observasi yang salah,mis. salah pengukuran. – mungkin merupakan observasi yang memang lain dari yang lain, sehingga perlu mendapat perhatian khusus.



ADE 1: Pemeriksaan Pola Sebaran Data



Page 29