5 0 1 MB
-1– PENDAHULUAN – PEMERIKSAAN POLA SEBARAN DATA (DATA BERSTRUKTUR TUNGGAL) Histogram, Diagram Dahan-Daun, Ringkasan Numerik, Diagram Kotak Garis (Box Plot)
D10F-3003 / 4 (3-1) SKS
ADE (Analisis Data Eksplorasi) Tim Teaching ADE
Materi ADE • •
• •
• •
•
Pendahuluan Pemeriksaan Pola Sebaran Data (Data Berstruktur Tunggal) – Histogram, Diagram Dahan-Daun, Ringkasan Numerik, Diagram Kotak Garis (Box Plot). Pembandingan Kelompok Data Transformasi Data – Transformasi Kesimetrisan Data – Transformasi Kehomogenan Varians Pemeriksaan Asumsi Sebaran Data Data Berpasangan dan Persamaan Garis Lurus : – Garis Resisten – Proses Iterasi dalam Garis Resisten – Transformasi untuk Meluruskan Garis Analisis Elementer : – Analisis Elementer Rata-Rata – Analisis Median Polish
ADE 1: Pemeriksaan Pola Sebaran Data
Page 2
Analisis Data Eksplorasi Proses analisis data pada dasarnya meliputi upaya penelusuran dan pengungkapan informasi yang relevan yang terkandung dalam data dan penyajian hasilnya dalam bentuk yang lebih ringkas dan sederhana, sederhana, yang pada akhirnya mengarah kepada keperluan adanya penjelasan dan penafsiran. penafsiran. Munculnya pendekatan analisis data eksplorasi dipelopori oleh J. W. Tukey sejak awal tahun 1970 1970--an dan menjadi populer dengan terbitnya buku mengenai teknik eksplorasi data (Tukey (Tukey,, 1977) ADE 1: Pemeriksaan Pola Sebaran Data
Page 3
Analisis Data Eksplorasi
(cont..)
• Munculnya pendekatan ini terutama disebabkan oleh dua hal, yaitu : A. Pola sebaran normal yang banyak melandasi teknikteknik statistika ternyata tidak selalu mencerminkan pola sebaran data yang dimiliki B. Anggapan bahwa pengamatan yang dilakukan merupakan sampel acak dari suatu populasi tertentu tidak selalu terpenuhi dalam pelaksanaannya. • Pada tahap awal, proses ini diusahakan tanpa terikat pada asumsi-asumsi yang ketat, agar supaya pengungkapan informasi dapat dilakukan dengan fleksibel dan lebih merangsang imajinasi yang sehat tanpa melupakan kaidah-kaidah ilmu maupun teori yang telah dikenal. ADE 1: Pemeriksaan Pola Sebaran Data
Page 4
Analisis Data Eksplorasi
(cont..)
• Analisis data yang bersifat eksploratif diawali dengan upaya penelusuran dan pengungkapan struktur dan pola yang dimiliki oleh data tanpa mengaitkan secara kaku pada asumsi-asumsi tertentu. • Dalam menelusuri struktur data, kita berusaha untuk memeriksa apakah data tersebut dapat diuraikan menjadi beberapa komponen dan apakah komponen tersebut bersifat aditif atau multiplikatif, atau merupakan komponen persamaan garis.
ADE 1: Pemeriksaan Pola Sebaran Data
Page 5
Analisis Data Eksplorasi
(cont..)
• Penelusuran pola data bertujuan untuk memeriksa bentuk atau pola sebaran data, yaitu apakah apakah data cenderung mengumpul di satu nilai tertentu atau pada beberapa nilai ? atau apakah beberapa nilai nampak agak jauh atau memencil dari kumpulannya? • Perubahan melalui transformasi data seringkali berhasil menyederhanakan struktur data atau mendapatkan pola sebaran yang dapat didekati oleh pola sebaran teoritik.
ADE 1: Pemeriksaan Pola Sebaran Data
Page 6
Analisis Data Eksplorasi
(cont..)
• Pemeriksaan hasil penguraian komponen data biasanya dilakukan dengan bantuan alat peraga berupa grafik, plot, tabel atau dalam bentuk ringkasan data. • Grafik menjadi alat peraga yang semakin penting peranannya dalam analsis data, baik sebagai ringkasan data maupun sebagai alat diagnosis kesesuaian model yang diduga.
ADE 1: Pemeriksaan Pola Sebaran Data
Page 7
Analisis Data Eksplorasi
(cont..)
• Keefektifan peranan analisis data sangat tergantung kepada kegigihan dalam mendapatkan model yang relevan dan menyingkap hal-hal yang masih tersembunyi. • Pemeriksaan terhadap residu dengan lebih seksama akan membawa ke arah model yang lebih baik atau ke arah metode pendugaan yang lebih sesuai.
ADE 1: Pemeriksaan Pola Sebaran Data
Page 8
Pemeriksaan Pola Sebaran • Kumpulan data yang berupa hasil pengukuran terhadap peubah tertentu pada umumnya bervariasi. Variasi atau keragaman nilai-nilai pengamatan, dapat dilihat melalui pola sebarannya. Pola sebaran sangat berguna dalam penentuan karakteristik data. • Pemeriksaan bentuk atau pola sebaran data dapat diawali dengan meringkas data. Yang kemudian dapat di sajikan berupa: – Histogram, – Diagram dahan daun (stem and leaf display), – Ringkasan numerik, – Diagram kotak-garis (box-plot). ADE 1: Pemeriksaan Pola Sebaran Data
Page 9
Meringkas Data Perhatikan Tabel 1.1 Angka kematian bunuh diri tahun 1971 Negara
L/p L Kanada P L Israel P L Jepang P L Austria P L Perancis P L Jerman P L Hongaria P L Italia P
25-34 21.6 7.8 9.4 7.6 21.5 14 28.8 8.4 16.4 6.6 28.3 11.3 48.2 12.7 7.1 3.5
35-44 27.3 11.5 9.8 4.2 18.7 10.3 40.3 16.4 25.2 8.9 34.6 15.6 65 18.4 8.3 3.7
45-54 31.1 14.8 10.2 6.7 21.1 13.2 52.3 22.4 36.1 13 41.3 24.2 84.1 26.9 10.8 5.5
ADE 1: Pemeriksaan Pola Sebaran Data
55-64 335 12.3 14 22.9 31.1 21 52.8 21.5 47.3 16.7 49.1 25.6 81.3 34.7 17.9 6.7
65-74 23.5 9.2 27.3 19.1 48.7 40.1 68.5 29.4 56 18.5 51.8 27.3 107.4 47.9 26.6 7.7
Negara
L/p L Belanda P L Polandia P L Spanyol P L Swedia P L Swiss P L Inggris P L USA P
25-34 7.8 4.7 26.2 4.4 4.1 1.4 27.6 13 21.7 10.4 9.6 5.1 19.6 8.6
35-44 10.6 8.2 29.1 4.7 7 1.6 40.5 17.5 33.6 15.9 12.7 6.5 22.2 12.1
45-54 17.9 10.5 35.9 6.6 9.6 3.8 45.7 19.6 41.1 18.2 14.6 10.7 27.8 12.5
55-64 20.2 15.8 32.3 7.3 13.7 5.4 51.2 22.4 50.3 20.1 17 13 32.8 11.4
65-74 28.2 17.3 27.5 7 21.9 5.7 35.1 17.1 50.8 20.6 21.7 14.1 36.5 9.3
Page 10
Meringkas Data (cont..) • Dalam data tersebut tampak banyak sekali informasi yang bisa dipetik. → Misalnya, tingkat bunuh diri dari pria ternyata lebih banyak dibandingkan dengan wanita. Negara dan umur tampaknya perlu diperhatikan juga. • Apabila diperhatikan, tabel tersebut tampak terlalu umum. Apabila peneliti ingin memperhatikan aspek khusus saja misalnya kematian pria pada usia termuda dan tertua, maka tabel di atas perlu dipecah menjadi: ADE 1: Pemeriksaan Pola Sebaran Data
Page 11
Negara
Pria 25-34
Pria 65-74
Asli
Dibulatkan
Asli
Dibulatkan
Kanada
21.6
22
23.5
24
Israel
9.4
9
27.3
27
Jepang
21.5
22
48.7
49
Austria
28.8
29
68.5
69
Perancis
16.4
16
56.0
56
Jerman
28.3
28
51.8
52
Hongaria
48.2
48
107.4
107
Italia
7.1
7
26.6
27
Belanda
7.8
8
28.2
28
Polandia
26.2
26
27.5
28
Spanyol
4.1
4
21.9
22
Swedia
27.6
28
35.1
35
Swiss
21.7
22
50.8
51
Inggris
9.6
10
21.7
22
USA
19.6
20
36.5
37
ADE 1: Pemeriksaan Pola Sebaran Data
Page 12
Meringkas Data (cont..) • Tampilan tabel diatas kemudian dapat disederhanakan agar lebih informatif, menjadi tabel distribusi frekuensi berikut: l
100-109
100-109
90-99
90-99
80-89
80-89
70-79
70-79
60-69
60-69
l
50-59
50-59
lll
40-49
l
30-39
ll llll ll
40-49
l
30-39 20-29
llll lll
20-29
10-19
ll
10-19
0-9
llll
0-9
ADE 1: Pemeriksaan Pola Sebaran Data
Page 13
1) HISTOGRAM • Digunakan sebagai langkah awal dalam mengorganisir data. Dalam pembuatannya, nilai-nilai pengamatan dikelompokkan menjadi beberapa kelas interval, kemudian frekuensi relatif untuk masing-masing kelas interval digambarkan sebagai tinggi kotak. Karena pengelompokan inilah, maka kita kehilangan informasi yang sebenarnya.
ADE 1: Pemeriksaan Pola Sebaran Data
Page 14
Batang & Daun Gabungan 2) Diagram (Steam and Leaf ) .
Laki-laki 25-34 10 9 8 7 6 5 4 3 2 1 0
8 22986820 60 9784
ADE 1: Pemeriksaan Pola Sebaran Data
Laki-laki 65-74 10 9 8 7 6 5 4 3 2 1 0
7
9 621 9 57 4778822
Page 15
Batang & Daun Gabungan 2) Diagram (Steam and Leaf ) .
Laki-laki 25-34
Laki-laki 65-74
10 9 8 7 6 5 8 4 3 22986820 60 9784 ADE 1: Pemeriksaan Pola Sebaran Data
7
9 621 9 57 477882 2 2 1 0 Page 16
Contoh lain dari Steam and Leaf Diketahui data yang berasal dari distribusi normal dengan ratarata 20 dan standar deviasi 5, sbb. : 16,8 13,1 14,6 22,6 24,4 – –
25,7 15,8 16,9 12,9 16,6
21,4 21,7 14,9 14,1 20,5
22,7 26,2 26,7 25,8 19,7
28,1 18,7 20,2 17,9 17,3
17,5 20,2 21,6 17,7 18,0
14,4 24,6 15,1 18,6 13,7
20,9 24,2 6,9 20,3 17,3
Akan dirinci atas angka satuan (sebagai digit utama untuk dahan) dan angka persepuluhan (sebagai digit penyerta untuk daun). Lajur DAHAN akan memiliki 24 buah baris yang ditandai dgn digit 6 – 28. Angka pertama, 16,8 shg DAHAN nya adalah 16 DAUNnya adalah 8. Angka berikutnya 25,7, dituliskan pada DAHAN 25 dan DAUN 7, dst. Tahapan ini dilanjutkan sampai data terakhir, sehingga akan didapat diagram DAHAN-DAUN sbb. :
ADE 1: Pemeriksaan Pola Sebaran Data
Page 17
Diagram Batang & Daun Gabungan .
Dahan
Daun 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
9
• Secara tidak langsung kita telah melakukan urutan data. 9 17 1469 18 689 33579 67 7 22359 467 67 246 78 27
• Proses ini jauh lebih mudah jika dibandingkan dengan pengurutan secara langsung dari kumpulan data. • Hasil ini memberi gambaran pola sebaran datanya. • Jika diagram ini diputar, sehingga lajur dahannya tersusun secara horizontal, maka diagram ini tidak jauh berbeda dengan histogram.
1
ADE 1: Pemeriksaan Pola Sebaran Data
Page 18
Batang & Daun Gabungan 2) Diagram (Steam and Leaf ) .
• Dengan table seperti ini, akan terlihat bagaimana sebenarnya pola dari data. • Jadi tabel batang daun: – lebih informatif – memberikan informasi tentang pola data • Memperhatikan pola data maka pola data akan bergantung pada : dimana data tersebut berpusat dan bagaimana variasinya.
ADE 1: Pemeriksaan Pola Sebaran Data
Page 19
3) Ringkasan Numerik • Ringkasan numerik merupakan bilanganbilangan yang dapat memberikan gambaran mengenai sekelompok data (angkatan). • Dalam pendekatan eksploratif, ringkasan numerik yang penting adalah : ukuran pemusatan data dan ukuran penyebaran data. ADE 1: Pemeriksaan Pola Sebaran Data
Page 20
A. Ukuran Pemusatan Data (Pusat Angkatan)
– Jika skala pengukurannya interval atau rasio, maka ukuran yang tepat untuk mewakili kelompok data tersebut adalah Rata-rata (Mean). Tetapi rata-rata mempunyai kelemahan, yaitu “tidak tangguh” (tidak robust), karena terpengaruh oleh nilai ekstrim. Sehingga jika terdapat nilai data ekstrim, ganti ratarata oleh median (Me). Me merupakan pusat angkatan yang sangat tangguh, disebut : “resistant statistic”. Secara umum, Me lebih baik dari pada rata-rata untuk kepentingan eksplorasi karena Me “insensitive” terhadap outlier, tetapi Me masih ‘sensitive” terhadap satu atau dua observasi yang berada di tengah. ADE 1: Pemeriksaan Pola Sebaran Data
Page 21
A. Ukuran Pemusatan Data (Pusat Angkatan)
Jika terdapat outlier, sedangkan outlier tersebut tidak dikeluarkan dari data, maka sebagai pengganti nilai Rata-rata gunakan “M Estimator”, tetapi jika outlier tersebut dikeluarkan maka sebagai pengganti Rata-rata gunakan “Tri Mean” Cat : Tri Mean = TRI = (qA + qB + 2 Me)/4 – Jika skala pengukurannya paling sedikit ordinal, maka sebagai pusat angkatan, gunakan Me. – Jika skala pengukurannya nominal, maka sebagai pusat angkatan gunakan Modus. ADE 1: Pemeriksaan Pola Sebaran Data
Page 22
B. Ukuran Sebaran Data (Ukuran Dispersi)
– Untuk menyimpulkan sekumpulan data, tidak boleh hanya menggunakan ukuran pemusatannya saja (bisa keliru) tetapi harus dilengkapi dengan ukuran dispersinya. – Jika skala pengukurannya interval atau rasio, gunakan standar deviasi (jangan varians, karena varians dimensinya 2, misalnya orang2, kg2, dsb), atau rentang. Catatan : • Rentang mudah dihitung, tetapi tidak “robust”. Rentang hanya memperhatikan dua bilangan saja. • Untuk melihat keseragaman data ataupun variasi data : – Jika variabelnya sama dan satuan pengukurannya sama, boleh menggunakan standar deviasi. – Jika variabelnya berbeda dengan satuan pengukuran berbeda, maka gunakan Koefisien Variasi (KV). ADE 1: Pemeriksaan Pola Sebaran Data
Page 23
B. Ukuran Sebaran Data (Ukuran Dispersi)
– Jika skala pengukurannya ordinal, gunakan Rentang Antar Kuartil (RAK) RAK = Sebaran Tengah = d = qA - qB Catatan : RAK memberikan gambaran yang paling tepat dan tangguh untuk suatu angkatan. – Jika skala pengukurannya nominal, maka gunakan Indeks Dispersi
ADE 1: Pemeriksaan Pola Sebaran Data
Page 24
4) Diagram Kotak Garis (Box Plot atau Box and Wishker)
• Merupakan bentuk grafik hasil ringkasan numerik. • Ringkasan numerik yang diperlukan untuk mengkonstruksikan box plot adalah Median (Me), Kuartil Bawah (qB), Kuartil Atas (qA), Ekstrim Bawah (xB) dan Ekstrim Atas (xA). • Tukey, menuliskan ringkasan numerik secara sistematis sbb. : Me
TRI
qB
qA
qB
qA
xB
xA
xB
xA
ADE 1: Pemeriksaan Pola Sebaran Data
Page 25
4) Diagram Kotak Garis (Box Plot atau Box and Wishker)
• Bentuk kotak mencerminkan gambaran dari 50% data yang terletak di bag. tengah, sedangkan garis yang mencuat keluar dari kotak tsb. menggambarkan cakupan dari 25% data yang berada di ujung kumpulan data. • Gambar kotak ini dibatasi oleh nilai qB dan qA, sedang nilai Me ditunjukkan dg. garis di dalam kotak tersebut .
xA
qA Me
qB xB
4) Diagram Kotak Garis (Box Plot atau Box and Wishker)
Dalam stat. inferens sering diperlukan asumsi bahwa suatu angkatan berdistribusi normal. Dist. Normal memp. identifikasi khusus, yaitu simetris terhadap rata-rata juga Me dan mempunyai asimtot pada sumbu X (mempunyai ekor tipis).
ADE 1: Pemeriksaan Pola Sebaran Data
Page 27
4) Diagram Kotak Garis (Box Plot atau Box and Wishker)
• Secara eksploratif, hal ini dapat dideteksi melalui box plot dengan memperhatikan : a) Apakah garis di dalam kotak terletak ditengah-tengah?, secara numerik : Me = (qA + qB)/2 = (xA + xB) /2 = d/2 b) Apakah jarak antara xB dengan qB sama dengan jarak antara xA dan qA, atau : xA - qA = qB – xB Jika dipenuhi keduanya, maka angkatan (kelompok data) dikatakan simetris, tetapi jika hanya a) dipenuhi,maka dikatakan angkatan tidak jauh dari simetri ( karena bagian yang terpenting dari data terletak di tengah atau di dalam kotak). Jika tidak dipenuhi keduanya, maka angkatan dikatakan tidak simetri. ADE 1: Pemeriksaan Pola Sebaran Data
Page 28
4) Diagram Kotak Garis (Box Plot atau Box and Wishker)
•
Untuk mendeteksi pencilan (outlier): 1. Observasi luar (pencilan atau outlier): observasi yang berada di luar batas (inner fences): qB – 1,5 d dan qA + 1,5 d 2. Observasi jauh di luar : observasi yang berada jauh di luar batas (outer fences): qB – 3 d dan qA + 3 d
•
Harga ekstrim perlu diketahui,karena: – mungkin merupakan observasi yang salah,mis. salah pengukuran. – mungkin merupakan observasi yang memang lain dari yang lain, sehingga perlu mendapat perhatian khusus.
ADE 1: Pemeriksaan Pola Sebaran Data
Page 29