5 0 893 KB
STATISTIKA MULTIVARIAT ANALISIS DISKRIMINAN
OLEH:
NURUL AZIZAH MUZAKIR
(1611140003)
ZAENAL
(1611140006)
JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI MAKASSAR 2018
i
KATA PENGANTAR
Assalamuโalaikum wr.wb Segala puji dan syukur atas kehadirat Allah SWT atas segala nikmat dan karunia-Nya sehingga kami dapat menyelesaikan makalah ini dan disusun sebagai salah satu syarat untuk memperoleh nilai pada mata kuliah Statistika Multivariat. Di dalam makalah yang berjudul โAnalisis Diskriminanโ mungkin masih terdapat banyak kekurangan. Kami menyadari bahwa karya tulis ini masih jauh dari sempurna. Oleh karena itu, kami sangat membutuhkan kritik dan saran yang sifatnya membangun dari para pembaca guna perbaikan dan kesempurnaan makalah ini di masa yang akan datang. Wassalamuโalaikum wr.wb
Makassar, 26 September 2018
Penyusun
ii
DAFTAR ISI
HALAMAN JUDUL .............................................................................................. i KATA PENGANTAR ........................................................................................... ii DAFTAR ISI ......................................................................................................... iii BAB I PENDAHULUAN .......................................................................................1 A. Latar Belakang ............................................................................................1 B. Rumusan Masalah .......................................................................................2 C. Tujuan Penulisan ........................................................................................2 BAB II PEMBAHASAN ........................................................................................3 1. Definisi Analisis Diskriminan....................................................................3 2. Tujuan Analisis Diskriminan .....................................................................4 3. Asumsi Analisis Diskriminan ....................................................................4 4. Langkah-Langkah Analisis Diskriminan ...................................................7 5. Contoh Kasus Analisis Diskriminan ........................................................13 DAFTAR PUSTAKA ...........................................................................................19
iii
BAB I PENDAHULUAN
A. Latar Belakang Analisis statistika bisa dikelompokkan berdasarkan jumlah variabel yang dianalisis. Berdasarkan pengelompokkan jumlah variabel ini maka statistika dibagi menjadi analisis univariat (univariate), bivariat (bivariate) dan multivariat (multivariate). Analisis univariat berasal dari kata uni dan variate yaitu analisis satu variabel. Misalnya pengukuran rata-rata (mean) sebagai ukuran pusat dari sekelompok data. Analisis bivariat berasal dari akar kata bi dan variate yang merupakan analisis statistika yang berkaitan dengan dua variabel. Misalnya analisis korelasi yang mencari hubungan antara dua variabel. Sedangkan analisis multivariat dilihat dari akar katanya merupakan pengembangan lanjutan dari analisis univariat maupun bivariat. Analisis multivariat merujuk kepada teknik statistika tertentu yang menganalisis banyak variabel secara simultan. Analisis multivariat terdiri dari beberapa jenis, yaitu teknik dependen (dependent technique), teknik interdependen (interdependent technique), dan model struktural (stuctural model). Analisis multivariat yang termasuk ke dalam teknik dependen yaitu analisis regresi, analisis regresi logistik, analisis diskriminan, analisis konjoin, analisis kanonikal, dan analisis manova. Analisis diskriminan adalah metode teknik dependen dimana variabel dependennya bersifat non metrik. Analisis diskriminan merupakan kombinasi linear dari dua atau lebih variabel independen yang akan membedakan atau mendiskriminasikan dua objek atau lebih di dalam sebuah kelompok atau grup. Metode diskriminan bisa dikelompokkan ke dalam dua jenis yaitu metode diskriminan dengan dua kategori (Two-Group Discriminant Analysis) dan
1
metode diskriminan dengan lebih dari dua kategori (Multiple Discriminant Analysis). B. Rumusan Masalah Berdasarkan latar belakang, diperoleh rumusan masalah yaitu: 1. Apa yang dimaksud dengan analisis diskriminan? 2. Apa tujuan analisis diskriminan? 3. Apa asumsi yang harus dipenuhi di dalam analisis diskriminan? 4. Bagaimana langkah-langkah dalam melakukan analisis diskriminan?
C. Tujuan Penulisan Berdasarkan rumusan masalah yang diperoleh, tujuan penulisan yaitu: 1. Untuk mengetahui definisi analisis diskriminan. 2. Untuk mengetahui tujuan analisis diskriminan. 3. Untuk mengetahui asumsi yang harus dipenuhi di dalam analisis diskriminan. 4. Untuk mengetahui langkah-langkah analisis diskriminan.
2
BAB II PEMBAHASAN
1. Definisi Analisis Diskriminan Analisis diskriminan adalah metode teknik dependen dimana variabel dependennya bersifat non metrik. Analisis diskriminan merupakan kombinasi linear dari dua atau lebih variabel independen yang akan membedakan atau mendiskriminasikan dua objek atau lebih di dalam sebuah kelompok atau grup. Metode diskriminan bisa dikelompokkan ke dalam dua jenis yaitu metode diskriminan dengan dua kategori (Two-Group Discriminant Analysis) dan metode diskriminan dengan lebih dari dua kategori (Multiple Discriminant Analysis). Ide dasar dari analisis diskriminan sama dengan analisis regresi logistik. Pada awalnya analisis diskriminan dikembangkan untuk menganalisis variabel dependen yang bersifat non metrik atau non numerik dengan dua atau lebih kategori. Sebagai moteode untuk membedakan objek menjadi dua atau lebih grup, maka analisis diskriminan dapat dihitung dengan memberi timbangan kepada setiap variabel independen agar bisa memaksimalkan perbedaan antara grup yang ada. Formula persamaan analisis diskriminan ini seperti halnya regresi dapat ditulis dalam bentuk fungsi diskriminan sebagai berikut: D = a + b1X1 + b2X2 + ... + bnXn Dimana : D
= Nilai diskriminan
a
= intersep
b1...n
= koefisien diskriminan atau bobot
3
X1...n
= variabel independen
Analisis diskriminan ini merupakan teknik untuk menguji hipotesis apakah rata-rata grup dari beberapa variabel independen untuk dua atau lebih grup adalah sama atau tidak. Rata-rata grup yang diperoleh dari menghitung rata-rata skor diskriminan disebut centroid atau rata-rata skor diskriminan. Centroid menunjukkan pusat lokasi dari setiap anggota grup. Sedangkan perbandingan group centroid menunjukkan seberapa jauh grup di dalam fungsi diskriminan.
2. Tujuan Analisis Diskriminan Oleh karena bentuk multivariate dari analisis diskriminan adalah dependence, maka variabel dependen adalah variabel yang menjadi dasar analisis diskriminan. Variabel dependen bisa berupa kode grup 1 atau grup 2 atau lainnya, dengan tujuan diskriminan secara umum adalah : a) Untuk mengetahui apakah ada perbedaan yang jelas antar grup pada variabel dependen. Jika ada perbedaan, variabel independen mana pada fungsi diskriminan yang membuat perbedaan tersebut. b) Membuat fungsi atau model diskriminan yang pada dasarnya mirip persamaan regresi. c) Melakukan klasifikasi terhadap objek, apakah suatu objek (bisa nama orang, tumbuhan, benda, dan lainnya) termasuk pada grup 1 atau grup 2 atau lainnya.
3. Asumsi Analisis Diskriminan
Sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap perbedaan nilai rataan dari kelompok-kelompok tersebut. Dalam pengujian tersebut, asumsi analisis diskriminan yang harus dipenuhi adalah :
4
a) Variabel
independen
seharusnya
berdistribusi
normal
multivariat
(Multivariate Normality), jika data tidak berdistribusi normal, akan menyebabkan masalah pada ketepatan fungsi (model) diskriminan. b) Matriks varians kovarians grup dari semua variabel independen seharusnya sama. c) Tidak ada data yang sangat ekstrim (outlier) pada variabel independen, jika ada data ekstrim yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan klasifikasi dari fungsi diskriminan. d) Tidak ada korelasi yang kuat antar-variabel independen, jika dua variabel independen
mempunyai
korelasi
yang
kuat,
dikatakan
terjadi
multikolinieritas. Untuk mengetahui adanya multikolinieritas dapat dilakukan dengan melihat korelasi antar variabel independen (r) yaitu jika nilai r > 0.6 menunjukkan adanya multikolinieritas.
3.1. Uji Kenormalan Peubah Ganda (Multivariate Normality)
Menurut Johnson dan Wichern, untuk menguji kenormalan ganda (Multivariate Normality) adalah dengan mencari nilai jarak kuadrat untuk setiap pengamatan yaitu: di2 = (Xi -๐ฬ
)โS-1 (Xi - ๐ฬ
) dimana : di2 adalah dengan mencari nilai jarak kuadrat untuk setiap pengamatan ke-i Xi adalah pengamatan yang ke-i, dengan i = 1,2,3,...,n ๐ฬ
adalah rata-rata variabel bebas X S-1 adalah invers matriks varians kovarians S Kemudian di2 diurutkan dari yang paling kecil ke yang paling besar, selanjutnya dibuat plot di2 dimana i = urutan = 1, 2, ..., n . Bila hasil plot
5
dapat didekati dengan garis lurus, maka dapat disimpulkan bahwa peubah ganda menyebar normal. 3.2. Uji Kesamaan Matriks Varians Kovarians Untuk menguji kesamaan matriks varians kovarians kelompok I berhasil (S1) dan kelompok II gagal (S2) digunakan hipotesa : H0 : โ1 = โ2 =...=โk = โ, matriks varians kovarians kelompok adalah relatif sama. H1 : minimal ada satu โi โ โj , matriks varians kovarians kelompok adalah berbeda secara nyata. Terima H0 yang berarti matriks varians kovarians sama jika :
X2hit โค X2ฮฑ;
1 (k-1)p (p+1)
2
dengan : 1
1
2
2
X2hit = -2(1-C1)[ โ๐๐=1 ๐๐ ln|๐๐ | โ ln|๐| โ๐๐=1 ๐๐ ] k = banyaknya kelompok ( grup ) P = jumlah peubah pembeda (Y) dalam fungsi diskriminan = 1 S = matriks varians kovarians dalam kelompok gabungan. Si = matriks varians kovarians kelompok ke-i. i = 1,2, ... , k ni = jumlah responden pada kelompok ke- i dengan Vi = ni โ 1
S=
โ๐ ๐=1 ๐๐ ๐
๐
โ๐ ๐=1 ๐๐
6
C1 = [ โ๐ ๐=1
1 ๐๐
โ โ๐
1
๐=1 ๐๐
2๐2 +3๐โ1
] [6(๐+1)(๐โ1)]
4. Langkah-langkah Analisis Diskriminan Langkah-langkah dalam analisis diskriminan adalah sebagai berikut: 1. Pengecekan adanya kemungkinan hubungan linear antara variabel penjelas. Untuk point ini, dilakukan dengan bantuan matriks korelasi (pembentukan matriks korelasi sudah difasilitasi pada analisis diskriminan). Pada output SPSS, matriks korelasi bisa dilihat pada Pooled Within-Groups Matrices. 2. Uji Vektor Rata-Rata Antar Kelompok Pengujian terhadap vektor nilai rataan antar kelompok dilakukan dengan hipotesa: H0 : ๐0 = ๐1 = ๐2 = โฏ = ๐๐ H1 : paling tidak ada dua kelompok yang berbeda Statistik uji yang digunkan dalam pengujian hipotesis tersebut adalah statistik V-Barlettt yang menyebar mengikuti sebaran Chi-Square (X2) dengan derajat bebas p(k-1), apabila H0 diterima. Statistik V-Barlett diperoleh melalui: ๐ = โ[(๐ โ 1) โ (๐ + ๐)/2]๐๐โ Dimana: n = banyaknya pengamatan p = banyaknya peubah dalam fungsi diskriminan k = banyaknya kelompok โ=
|๐พ| |๐พ+๐ฉ|
= Wilksโ Lambda
Dalam hal ini W = matriks jumlah kuadrat dan hasil kali data dalam kelompok ฬ
ฬ
โ๐๐=1 โ๐๐ ๐=1(๐๐๐ โ ๐๐ )(๐๐๐ โ ๐๐ )โ B = matriks jumlah kuadrat dan hasil kali data antar kelompok
7
๐
โ ๐๐ (๐๐๐ โ ๐ฬ
) (๐๐๐ โ ๐ฬ
)โฒ ๐=1
๐๐๐ = pengamatan ke-j kelompok ke-i ๐ฬ
๐ = vektor rataan kelompok ke-i ๐๐ = jumlah pengamatan pada kelompok ke-i ๐ฬ
= vektor rata-rata total Titik keputusan: H0 = tidak ada perbedaan vektor nilai rataan antar kelompok H1 = ada perbedaan vektor nilai rataan antar kelompok 2 Jika ๐ โค ๐๐(๐โ1)(1โ๐ผ) maka H0 diterima 2 Jika ๐ > ๐๐(๐โ1)(1โ๐ผ) maka H0 ditolak
Bila dari hasil pengujian ada perbedaan vektor nilai rataan, maka fungsi diskriminan layak disusun untuk mengkaji hubungan antar kelompok serta berguna untuk mengelompokkan suatu objek ke salah satu kelompok tersebut. Diharapkan dalam uji ini adalah hipotesis nol ditolak, sehingga kita mempunyai informasi awal bahwa variabel yang sedang diteliti memang membedakan kedua kelompok.
3. Uji Kesamaan Matriks Varians Kovarians Dilanjutkan pemeriksaan asumsi homoskedastisitas dengan uji Boxโs M. Untuk menguji kesamaan matriks peragam (โ) antar kelompok digunakan hipotesis: ๐ป0 : โ0 = โ1 = โ2 = โฏ = โ๐ = โ ๐ป1 : sedikitnya ada dua kelompok yang berbeda Statistik uji yang digunakan adalah statistik Boxโs M, yaitu: ๐
๐ โ2๐๐๐โ = (๐ โ ๐)๐๐ | | โ โ(๐๐ โ 1)๐๐|๐๐ | (๐ โ ๐) ๐=1
(๐ โ1)/2
โ๐๐=1|๐๐ | ๐ ๐ = |๐/(๐ โ ๐)|(๐โ๐)/2 โ
Dimana: 8
k
= banyaknya kelompok
W/(n-k) = matriks ragam-peragam dalam kelompok gabungan Sj
= matriks ragam-peragam kelompok ke-j
Bila ๐ป0 diterima, maka (โ
2๐๐๐โ ๐
) akan mengikuti sebaran F
denganderajat bebas V1 dan V2 pada taraf signifikan ฮฑ, dimana: 1 ๐ฃ1 = ( ) (๐ โ 1)๐(๐ + 1) 2 ๐ฃ2 = (๐ฃ1 + 2)(๐2 โ ๐12 ) ๐ฃ1 ๐ = ๐ฃ1 /(1 โ ๐1 โ ) ๐ฃ2 ๐
2๐3 + 3๐ โ 1 1 1 ๐1 = [โ โ ] 6(๐ โ 1)(๐ + 1) (๐๐ โ 1) (๐ โ ๐) ๐=1
๐
(๐ โ 1)(๐ + 2) 1 1 ๐2 = [โ โ ] 2 6(๐ + 1) (๐๐ โ 1) (๐ โ ๐)2 ๐=1
๐ = jumlah peubah pembeda dalam fungsi diskriminan Asumsikan dalam uji ini hipotesis nol tidak ditolak ๐ป0 : โ0 = โ1 Hipotesis : ๐ป0 : matriks kovarians grup adalah sama ๐ป1 : matriks kovarins grup adalah berbeda secara nyata Jika (โ Jika (โ
2๐๐๐โ ๐ 2๐๐๐โ ๐
) > ๐น๐ฃ1, ๐ฃ2, ๐ผ berarti ๐ป0 diterima ) โค ๐น๐ฃ1, ๐ฃ2, ๐ผ berarti ๐ป1 diterima
Sama tidaknya grup kovarians matriks juga bisa dilihat dari tabel output Log Determinant pada software SPSS. Jika dalam pengujian ini ๐ป0 ditolak maka proses lanjutan seharusnya tidak bisa dilakukan.
4. Menentukan Signifikansi Fungsi Diskriminan H0 : ๐0 = ๐1 = ๐2 = โฏ = ๐๐ 9
H1 : ๐๐ โ ๐๐ ๐, ๐ = 1,2, โฆ , ๐ sedikitnya ada dua kelompok yang berbeda Jika kelompok sejumlah k maka fungsi diskriminan dapat dibentuk sebanyak k-1. Untuk mengetahui apakah k-1 fungsi diskriminan tersebut signifikan untuk membedakan k kelompok sehingga layak untuk digunakan untuk analisis selanjutnya, suatu uji dilakukan yaitu menggunakan statistik Barlett ๐๐ = {๐ โ 1โ1/2(๐ + ๐)}ln(1 + ๐๐) dengan N = โ NI akan mengikuti distribusi Chi Kuadrat dengan derajat bebas p(k-1) jika H0 benar. Dimana : ฮปi = 1/(1+ej) ej = akar karakteristik (eigen value) ke-j dari BW-1 B = variasi / jumlah kuadrat antar kelompok (between groups sum of squares) W = variasi / jumlah kuadrat dalam kelompok (within groups sum of squares)
5. Pembentukan model diskriminan a. Kriteria Fungsi Linier Fisher ๏ Pembentukan Fungsi Linier (teoritis) Fisher mengelompokkan suatu observasi berdasarkan nilai skor yang dihitung dari suatu fungsi linier Y = ฮป'X dimana ฮป' menyatakan vektor yang berisi koefisien-koefisien variabel independen yang membentuk persamaan linier terhadap variabel dependen, ฮป' = [ฮป1 , ฮป2 , โฆ , ฮป๐ ]. X=[
๐1 ] ๐2
Xk menyatakan matriks data pada kelompok ke-k 10
๐11๐ Xk =[ โฎ ๐๐1๐
โฏ โฑ โฏ
๐1๐๐ โฎ ] ๐๐๐๐
i = 1,2,...,n j = 1,2,...,p k = 1,2 Xijk menyatakan observasi ke-i variabel ke-j pada kelompok ke-k. Di bawah asumsi Xk ~ N(๐๐ , โ๐ ) ๐= [
๐1 ๐ธ(๐1 ) ]= [๐ ] dan โ๐ = ๐ธ(๐๐ โ ๐๐ )(๐๐ โ ๐๐ )' ; โ1 = โ2 =...= โ ๐ธ(๐2 ) 2
๐1๐ ๐๐ = [ โฎ ] ; ๐๐ adalah vektor rata-rata tiap variabel X pada kelompok ๐๐๐ ke-k. ๐11 โฎ โ=[ โฎ โฆ
๐12 ๐22 โฎ โฏ
โฏ โฏ โฏ โฏ
๐1๐ ๐2๐ โฎ ] ๐๐๐
Diagonal utama dari matriks menyatakan varians, dan selain diagonal utama menyatakan kovarians. Fisher mentransformasikan observasi-observasi x yang multivariate menjadi
observasi y yang univariate. Dari persamaan
Y = ฮป'X
diperoleh ๐๐๐ฆ = ๐ธ(๐๐ ) = ๐ธ(๐โฒX) = ๐โฒ๐๐ ; ๐๐2 = ๐ฃ๐๐(โโฒ๐) = โโฒโโ ๐๐๐ฆ adalah rata-rata Y yang diperoleh dari X yang termasuk ke dalam kelompok ke-k, ๐๐2 adalah varians Y yang diasumsikan sama untuk kedua kelompok. Kombinasi linear yang terbaik menurut Fisher adalah yang dapat memaksimumkan rasio antara jarak kuadrat rata-rata Y yang diperoleh 11
dari x dari kelompok 1 dan 2 dengan varians Y, atau dirumuskan sebagai berikut: (๐1๐ โ ๐2๐ )2 ) ๐โฒ(๐1 โ ๐2 )(๐1 โ ๐2 )โฒ๐ = 2 ๐โฒโ๐ ๐๐ Jika (๐1 โ ๐2 ) = ๐ฟ, maka persamaan di atas menjadi
(๐โฒ๐ฟ)2 ๐โฒโ๐
. Karena โ
adalah matriks definit positif, maka menurut teori pertidaksamaan Cauchy-Schwartz, rasio
(๐โฒ๐ฟ)2 ๐โฒโ๐
dapat dimaksimumkan jika
ฮปโฒ = ๐ โโ1 ๐ฟ = ๐ โโ1 (๐1 โ ๐2 )
Dengan memilih c = 1, menghasilkan kombinasi linear yang disebut kombinasi linear Fisher sebagai berikut: ๐ = ๐โฒ ๐ = (๐1 โ ๐2 ) โโ1 ๐ ๏ Pembentukan Fungsi Linier (dengan bantuan SPSS) Pada output SPSS, koefisien untuk tiap variabel yang masuk dalam model dapat
dilihat pada tabel Canonical Discriminant Function
Coefficient. Tabel ini akan dihasilkan pada output apabila pilihan Function Coefficient bagian Unstandardized diaktifkan. ๏ Menghitung discriminant score Setelah dibentuk fungsi liniernya, maka dapat dihitung skor diskriminan untuk tiap observasi dengan memasukkan nilai-nilai variabel independen.
๏ Menghitung cutting score Cutting score (m) dapat dihitung dengan rumus sebagai berikut: ๐=
๐1 ๐1๐ + ๐2 ๐2๐ ๐1 + ๐2
Dimana nk adalah jumlah sampel pada kelompok ke-k, k=1,2 12
Kemudian
nilai-nilai
dibandingkan dengan
discriminant
score
tiap
observasi
akan
cutting score, sehingga dapat diklasifikasikan
suatu observasi akan termasuk ke dalam kelompok yang mana. Suatu observasi dengan karakteristik x akan diklasifikasikan sebagai anggota kelompok kode 1 jika ๐ฆ = (๐1 โ ๐2 )โฒ โโ1 ๐ โฅ ๐, selain itu dimasukkan ke dalam kelompok 2 (kode nol). Penghitungan m dilakukan secara manual, karena SPSS tidak mengeluarkan output m. Namun, kita dapat menghitung m dengan bantuan tabel Function at Group Centroids dari output SPSS. ๏
Penghitungan Hit Ratio (dalam model regresi logistik disebut percentage correct) Setelah semua observasi diprediksi keanggotaannya, dapat
dihitung hit ratio, yaitu
rasio antara observasi yang tepat
pengklasifikasiannya dengan total seluruh observasi. b. Kriteria Posterior Probability Aturan pengklasifikasian yang ekivalen dengan model linier Fisher adalah berdasarkan nilai peluang suatu observasi dengan karakteristik tertentu (x) berasal dari suatu kelompok. Nilai peluang ini disebut posterior probability dan bisa ditampilkan pada sheet SPSS dengan mengaktifkan option probabilities of group membership pada bagian Save di kotak dialog utama.
5. Contoh Kasus Menggunakan SPSS Di sebuah laboratorium dilakukan penelitian untuk mengetahui apa saja yang membedakan bunga A dan bunga B yang masih satu species. Untuk itu, diambil sampel bunga A dan B masing-masing sebanyak 10 buah. Kedua bunga dihitung lebar kelopaknya (X1)dan lebar daunnya (X2). Diketahui juga bahwa kedua bunga dapat dijadikan indikator derajat keasaman suatu zat (pH), maka diteliti juga
pada trayek pH berapa saja kedua bunga sensitif untuk 13
mendeteksinya(X3). Data yang telah diperoleh akan dianalisis dengan menggunakan analisis diskriminan.
Untuk melakukan analisis diskriminan dengan bantuan SPSS, ikuti langkahlangkah berikut: ๏ Pada menu Analyze, pilih submenu Classify, lalu pilih Discriminant. ๏ Kemudian akan muncul kotak dialog.
14
๏ท
Bagian Grouping Variable diisi dengan variabel respon dan harus didefinisikan range- nya pada bagian Define Range.
๏ท
Bagian Minimum diisi dengan kode terkecil dan Maximum diisi dengan kode terbesar dari variabel respon.
๏ท
Bagian Independents diisi dengan variabel penjelas. Metode yang sering dipaparkan pada literatur-literatur
adalah
metode bertatar (stepwise), maka kali ini hanya akan diberi contoh penggunaan metode ini. Posterior probability yang dihasilkan dengan metode Enter dan Stepwise agak berbeda, sehingga
pada
metode
Stepwise
nilai
ketepatan
klasifikasinya juga akan berbeda. Berdasarkan literatur๏ท
literatur yang pernah dibaca, penulis lebih menyarankan untuk menggunakan metode Stepwise. Untuk menampilkan nilai hit ratio, pada bagian Classify klik Summary Table.
๏ท
Bagian Save memungkinkan kita untuk menampilkan nilainilai posterior probability
observasi untuk masuk ke
kelompok kode nol(dis1_2), nilai-nilai posterior probability observasi untuk masuk ke kelompok kode satu (dis2_2), nilai-nilai discriminant score (dis1_1), dan pengklasifikasian observasi oleh model (dis_1) pada Sheet SPSS. Misalnya untuk observasi pertama, nilai peluangnya untuk masuk ke dalam kelompok kode nol (1,00000) lebih besar daripada peluangnya untuk masuk dalam kelompok kode satu (0,00000), maka observasi ini akan dimasukkan oleh model ke dalam kelompok kode nol.
15
Sampai di sini pengisian kotak dialog dirasa cukup untuk analisis diskriminan. Selanjutnya, kita akan mulai interpretasikan outputoutputnya. ๏ Pengecekan multikolinieritas
Dari matriks korelasi di atas, tidak ada angka yang mencapai 0,5 atau di atasnya sehingga kita mengidentifikasi tidak ada multikolinieritas pada data. ๏ Uji Kesamaan vektor rata-rata
Dilihat dari nilai p-value nya, masing-masing variabel mempunyai rata-rata yang berbeda untuk kedua kelompok. Ingat, yang diuji adalah kesamaan rata-rata pada tiap kelompok (kelompok kode nol dan kode satu), bukan rata-rata antar variabel. ๏ Uji Kesamaan matriks varians-covarians (homoskedastisitas)
16
Tabel di atas memperlihatkan bahwa kita dapat menolak hipotesis nol karena nilai pvaluenya kurang dari 0,05 (dalam hal ini penelitian menggunakan tingkat kepercayaan 95%). Dari hasil pengujian ini, kita dapat mengatakan bahwa data kita berasal dari populasi yang mempunyai matriks varians-covarians yang sama ๏ Pembentukan fungsi linear
Dari tabel di atas, dapat kita bentuk fungsi liniernya sebagai berikut: Y= -13,988+1,935X1 +0,163X3 ๏ Perhitungan skor diskriminan Misalnya untuk observasi pertama, dengan memasukkan nilai X1=4,46209; dan X3=14,3488 maka diperoleh discriminant scorenya sebesar -5,117 ๏ Perhitungan cutting score
Dari tabel di atas, dapat dihitung cutting score nya 10(โ3,817)+10(3,817) 20
=0.
17
Untuk observasi pertama, karena discriminant score nya kurang dari cutting score, maka
dimasukkan ke dalam kelompok kode 0
(pengklasifkasian tepat karena sebenarnya observasi pertama sebelumnya memang termasuk ke dalam anggota kelompok nol atau bunga A). ๏ Hit ratio
Angka hit ratio di atas sudah mencapai 100% (pada kenyataannya sulit mencapai angka sebesar ini, ingat ini hanya data fiktif yang dibangitkan dengan bantuan komputer). ๏ Pengklasifikasian observasi baru Jika ada bunga dari species yang sama, dapat diprediksi akan termasuk dalam kelompok mana berdasarkan karakteristik yang dimilikinya dengan fungsi linier yang sudah terbentuk. Inilah yang menjadi tujuan pembentukan fungsi diskriminan
18
DAFTAR PUSTAKA Mintu, Shinta. 2012. Analisis Diskriminan untuk Mengkaji Misklasifikasi Pemilihan Jurusan. Skripsi. Fakultas Matematika dan Ilmu Pengetahuan Alam. Universitas Negeri Makassar: Makassar. Widarjono, Agus. 2010. Analisis Statistika Multivariat Terapan. UPP STIM YKPN. Yogyakarta.
19