Makalah Teori Tes Klasik [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

MAKALAH TUGAS KELOMPOK MATA KULIAH EVALUASI PENDIDIKAN JUDUL



“TEORI TEST KLASIK” OLEH



KELOMPOK 7 NAMA ANGGOTA : 1. YUSRIANA,A.Md.Keb 2. RATNASARI SYAHRIR,A.Md.Keb 3. SATRIANI RUSDIN,A.Md.Keb



BAB I PENDAHULUAN A. DESKRIPSI SINGKAT Teori tes klasik atau classical test theory (CTT) merupakan salah satu pendekatan yang digunakan dalam dunia pengukuran di bidang Psikologi,pendidikan dan ilmu sosial lainnya. Teori tes klasik dikenal juga dengan sebutan teori skor murni (true score theory). Teori tes klasik (CTT) adalah teori psikometri yang membolehkan kita untuk melakukan prediksi tentang hasil dari suatu ujian (tes), melalui kemampuan orang yang melakukan tes dan tingkat kesulitan soal yang dikerjakan. CTT merupakan teori psikometri yang populer dan banyak digunakan untuk berbagai disiplin ilmu (psikologi, pendidikan dan ilmu sosial lainnya). Dewasa ini ada dua macam teori tentang pengukuran, yakni Teori Tes Klasik dan Teori Tes Modern (Suryabrata, 2005) di dalam buku Azwar (2007) menambahakan Teori Skor Murni Kuat, teori ini mirip dengan Teori Tes Klasik mengenai nilai harapan skor tampak yang merupakan skor murni, akan tetapi dalam Teori Skor Murni Kuat terdapat asumsi-asumsi tambahan mengenai probabilitas skor tampak yang diperoleh seorang subjek yang merupakan skor murni tertentu sehingga kelayakkan Teori Skor Murni Kuat dapat diuji.



Teori Tes Klasik disebut juga dengan Classical True-Score Theory, dinamakan Teori Tes Klasik karena unsur-unsur teori ini sudah dikembangkan dan diaplikasikan sejak lama, namun tetap bertahan hingga sekarang (Suryabrata, 2005). Teori Tes Modern disebut juga dengan Latent-Trait Theory karena teori ini berasumsi bahwa performansi subjek dalam mengerjakan suatu tes dapat diprediksi dari kemampuannya yang bersifat laten atau menetap. Teori Tes Modern juga sering disebut dengan Item Response Theory, artinya respon subjek terhadap suatu aitem menunjukkan kemampuan kognitifnya. Teori Tes Modern muncul untuk menjawab keterbatasan dari Teori Tes Klasik yakni, parameter dalam Teori Tes Klasik merupakan karakteristik aitem tergantung pada kelompok sampel yang digunakan untuk menghitungnya selain itu Teori Tes Klasik juga memerlukan kesetaraan eror pengukuran bagi semua subjek yang dikenai tes, definisi paralel dalam Teori Tes Klasik juga sangat sulit untuk dipenuhi dalam prakteknya, dengan hadirnya Teori Tes Modern dapat menjawab semua keterbatasan ini, namun perlu diingat bahwa Teori Tes Modern ini tidak praktis, dari semua keterbatasan Teori Tes Klasik tersebut perlu dilihat juga kelebihan dari Teori Tes Klasik yakni, Teori Tes Klasik telah dikembangkan sejak dulu sehingga telah berhasil dalam meletakkan konsep-konsep dasar pengukuran, selain itu Teori Tes Klasik juga memiliki nilai praktis yang tinggi sehingga dalam penelitian ini akan menggunakan pendekatan Teori Tes Klasik dalam proses analisis yang dilakukan.



B. MANFAAT MATA KULIAH Kegunaan utama dari CTT ( classical test theory ) adalah untuk mendapatkan skor mentah dari satu ujian yang didapat, yang menunjukkan kemampuan seseorang



dalam mengerjakan ujian. Dari skor mentah ini maka berbagai analisis dan interpretasi bisa dihasilkan sesuai dengan keperluan studi yang dilakukan. 1. Statistik deskriptif.



Saat data sudah diperoleh, maka nilai rata-rata dan



keragaman (varian)  suatu informasi yang berharga untuk didapatkan. Hal ini akan memberikan info secara langsung butir soal mana yang berguna dan mana yang tidak; misalnya jika keragam dari satu soal rendah, maka menunjukkan tidak beragamnya hasil dari soal tersebut dan menunjukkan soal yang mungkin tidak bagus. 2. Tingkat kesulitan. Proporsi dari individu yang dapat mengerjakan soal atau menyetujui satu pernyataan dari satu ujian dinamakan tingkat kesulitan. Tingkat kesulitan mempunyai nilai terendah 1,0 dimana semua peserta tes dapat menjawab dengan betul; sedangkan tingkat kesulitan soal 0,0 berarti tidak ada satupun yang bisa menjawab dengan benar. Kedua jenis soal begini tidak berguna karena tidak bisa membedakan kemampuan individu. Sehingga tingkat kesulitan 0,50, yaitu 50% dari anggota kelompok yang diuji lulus, merupakan tingkat kesulitan yang baik dimana soal tersebut mempunyai tingkat pembedaan kemampuan tertinggi untuk peserta tes. 3. Indeks diskriminasi. Selain tingkat kesulitan soal yang membandingkan keseluruhan soal yang diberikan, dalam konteks CTT indeks diskriminasi juga dapat dihitung berdasarkan dikotomi butir soal yang diberikan. Biasanya, tingkat kesulitan 0,5 akan menyumbang pada bagusnya nilai indeks diskriminasi, yang makin besar nilai indeksnya menunjukkan makin bagus.



4. korelasi antara butir soal dengan total. Bentuk lain dari pengujian butir soal dalam CTT adalah melalui perhitungan korelasi Pearson. Cara yang dilakukan adalah memilih butir soal tertentu dari tia-tiap individu, kemudian dilakukan korelasi dengan total skor mentah yang didapat; dengan cara ini bila didapat nilai korelasinya kecil, maka mengindikasikan hal ini tidak berhubungan dengan butir soal lain yang diberikan (standarnya nilai korelasi lebih besar dari 0,5). 5. Pembobotan butir soal. Umumnya dalam konteks CTT, skor untuk tiap butir soal diberikan sama (misal 1,0 untuk jawaban betul), pembobotan skor diberlakukan bila satu soal yang diberikan mempunyai bobot yang berbeda untuk menghasilkan total skor mentah. Terdapat banyak cara untuk memberikan pembobotan, misal melalui relibilitas soal, dimana soal dengan reliabilitas tinggi menyumbang bobot lebih besar dan sebaliknya; melalui nilai korelasi butir soal; regresi kriteria soal yang diberikan; ataupun dengan faktor analisis. Fungsi Evaluasi : 



Sebagai alat pengukur ketercapaian tujuan mata pelajaran







Sebagai alat pengukur tujuan proses belajar megajar







Mengetahui kelemahan siswa, dapat menyelesaikan kesulitan belajar siswa dan dapat mendata permasalahan yang dihadapi siswa dan alternatif bimbingan dan penyuluhannya



Tujuan Evaluasi Pembelajaran :



1. Menentukan angka kemajuan atau hasil belajar pada siswa. Untuk mengetahui kadar pemahaman peserta didik terhadap materi pelajaran. Fungsinya sebagai laporan kepada orangtua siswa, penentuan kenaikan kelas, penentuan kelulusan siswa. 2. Untuk melatih keberanian dan mengajak peserta didik untuk mengingat kembali materi yang telah diajarkan dan untuk mengetahui tingkat perubahan prilakunya. 3. Mengenal latar belakang siswa yang berguna baik bagi penempatan maupun penentuan sebab-sebab kesulitan belajar para siswa. Berfungsi sebagai masukan bagi tugas Bimbingan dan Penyuluhan (BP). 4. Sebagai umpan balik untuk guru yang dapat digunakan untuk memperbaiki proses belajar mengajar dan program remedial untuk siswa. Manfaat dilaksanakan Evaluasi Pembelajaran adalah : 1. Membuat keputusan berkenaan dengan pelakasanaan dan hasil pembelajaran 2. Memperoleh



pemahaman



pelaksanaan



dan



hasil



pembelajaran



yang



telah



dilaksanakan oleh guru 3. Meningkatkan kualitas proses dan hasil pembelajaran dalam rangka upaya meningkatkan kualitas Langkah-Langkah dalam Evaluasi Hasil Belajar : 1. Menyusun rencana evaluasi hasil belajar, ada 4 jenis kegiatan : 



Merumuskan tujuan dilaksanakannya evaluasi







Menetapkan aspek-aspek yang akan dievaluasi







Memilih dan menentukan teknik yang akan digunakan pada saat melaksanakan evaluasi







Menyusun soal soal tes sebagai alat pengukur hasil belajar peserta didik



2. Mengumpulkan data merupakan pelaksanakan pengukuran, misalnya dengan menyelenggarakan tes hasil belajar. 3. Melakukan verifikasi dan memisahkan data yang baik dengan data yang kurang baik. 4. Mengolah dan Menganalisis data 5. Tindak lanjut terhadap hasil evaluasi serta menarik kesimpulan dan mengambil keputusan untuk merumuskan kebijakan-kebijakan yang perlu sebagai tindak lanjut dari kegiatan evaluasi tersebut.



BAB II PENYAJIAN A. TEORI TES KLASIK Bagian ini menjelaskan evolusi yang terjadi dalam disiplin ilmu pengukuran (measurement). Teori test klasik (atau clasical test theory, CTT) adalah cikal bakal yang nantinya berkembang menjadi teori respon butir (Item response theory,  IRT) yang mana pengukuran  pemodelan Rasch (Rasch Model Measurement) merupakan komponen utamanya. Penjelasan tentang CTT akan memberikan gambaran tentang komponen utamanya dan keterbatasan pengukuran dengan teori ini, dan IRT dikembangkan untuk memperbaiki hal ini. Teori tes klasik (CTT) adalah teori psikometri yang membolehkan kita untuk melakukan prediksi tentang hasil dari suatu ujian (tes), melalui kemampuan orang yang melakukan tes dan tingkat kesulitan soal yang dikerjakan. CTT digagas oleh Charles Spearman pada tahun 1904, dan merupakan teori psikometri yang populer dan banyak digunakan untuk berbagai disiplin ilmu (psikologi, pendidikan dan ilmu sosial lainnya). Asumsi dasardari CTT adalah, skor yang diamati (atau skor mentah yang didapat) dilambangkan dengan X, terdiri dari skor murni (T) dan skor kesalahan (skor galat) (E), sehingga persamaannya:



X=T+E hal yang perlu dicatat adalah,



skor mentah (X) adalah satu-



satunya skor yang nyata; sedangkan skor murni (T) dan skor kesalahan (E) bersifat tersembunyi (latent), tidak bisa diamati secara langsung. Informasi yang didapat dari skor pengamatan dapat digunakan untuk menguji konsistensi tes (reliability). Asumsi lain yang perlu diketahui adalah skor kesalahan (E) dalam CTT bersifat acak dan tidak berkorelasi dengan X maupun T, dan perkiraan nilainya adalah 0 (nol). Teori Tes klasik berkembang sedikit demi sedikit melalui unsur-unsur yang kemudian secara akumulatif merupakan bangunan teori yang utuh. Inti Teori Tes Klasik adalah asumsi-asumsi yang dirumuskan secara sistematis serta dalam jangka waktu yang lama. Skor tampak disimbolkan dengan huruf X merupakan nilai performansi individu pada alat tes yang dinyatakan dalam bentuk angka, skor murni yang dilambangkan dengan huruf T merupakan performansi individu sesungguhnya yang tidak pernah dapat kita ketahui besarnya karena tidak dapat diungkap secara lansung oleh alat tes, dan eror pengukuran yang diberi simbol huruf E (Azwar, 2015).



B. ASUMSI TEORITIK MENGENAI SKOR Seperti yang dijelaskan sebelumnya, teori tes klasik memiliki banyak asumsi di dalamnya. Performasi subjek pada suatu skala pengukuran dinyatakan dalam angka yang disebut skor. Skor ini merupakan skor perolehan pengukuran yang selanjutnya disebut sebagai skor tampak atau dilambangkan dengan X. Di dalam skor tampat terdapat skor murni (T) dan error pengukuran (E) yang tidak pernah dapat diketahui besarannya (Azwar, 2015). Teori tes



klasik bekerja pada tataran skor tampak dengan menggunakan model linier dalam menjelaskan model skor. Beberapa asumsi yang mendasar skor dalam teori tes klasik diantaranya sebagai berikut (disarikan dari Azwar, 2015).  



Asumsi ini menyatakan bahwa hubungan Skor tampak (X), skor murni (T), dan eror pengukuran (E) bersifat aditif. Skor tampak (X) yang diperoleh individu merupakan akumulasi dari skor murni (T) dan eror pengukuran (E).



Asumsi ini menyatakan bahwa skor murni merupakan nilai harapan X. Karena besar skor murni diasumsikan tetap dalam setiap pengukuran, maka besar varians skor tampak akan tergantung pada variasi eror pengukuran.



Korelasi antara eror pengukuran dan skor murni adalah nol. Menurut asumsi ini, bagi suatu kelompok populasi subjek yang dikenai tes distribusi eror pengukuran dan distribusi skor murni adalah independen satu sama lain. variasi eror tidak tergantung pada variasi skor murni.



Bila e1 adalah eror pengukuran tes pertama dan e2 adalah eror pengukuran tes kedua, maka asumsi ini menyatakan bahwa distribusi eror kedua tes tersebut tidak berkorelasi satu sama lain.



Asumsi kelima menyatakan bahwa eror pada suatu tes tidak berkorelasi degan skor murni pada tes lain.



BAB III PENUTUP A. KESIMPULAN Seperti dijelaskan sebelumnya, teori skor klasik bukan satu-satunya pendekatan dalam psikometri. Sumintono & Widhiarso (2015) memberikan catatan penggunaan skor mentah/raw score sebagai ukuran prestasi yang memiliki beberapa kelemahan, di antaranya sebagai berikut. 1. Skor mentah pada dasarnya bukanlah hasil pengukuran. Lebih tepatnya skor mentah adalah jumlah jawaban benar dari soal yang dikerjakan siswa. 2. Skor mentah adalah informasi awal. Skor mentah juga biasanya dinyatakan dalam persentase (%) yang tidak lain hanyalah ringkasan data berupa angka, tetapi tidak memberikan data dari suatu pengukuran. 3. Skor mentah memiliki makna kuantitatif yang lemah. Makna kuantitatif dari skor mentah yang didapat akan berbeda, bergantung pada banyaknya soal, sedangkan persentase jawaban betul selalu bergantung pada tingkat kesulitan soal. 4. Skor mentah tidak menunjukkan kemampuan seseorang terhadap tugas tertentu. Skor mentah juga tidak bisa banyak menjelaskan tingkat kesulitan soalnya. 5. Skor mentah dan persentase jawaban benar tidak selalu bersifat linier. Dalam sebuah tes yang bersifat linier, siswa yang memiliki skor 15 (skala 0 hingga 100) selalu



memiliki kemampuan lebih tinggi dibanding yang memiliki skor 10. Namun, secara empirik terkadang keduanya memungkinkan memiliki kemampuan yang sama. Meskipun secara sekilas teori tes klasik memiliki banyak keterbatasan, namun bukan berarti pendekatan ini tidak memiliki kelebihan. Beberapa kelebihan teori tes klasik dibandingkan teori respon butir diantaranya adalah terkait dengan analisis yang lebih sederhana dan mudah dipahami. Teori ini memiliki nilai praktis yang tinggi dalam menerangkan masalah reliabilitas dan validitas, disamping pemahamannya yang tidak menuntut pengetahuan mendalam mengenai fungsi distribusi statistik dan model-model matematiknya (Azwar, 2011). Selain itu dalam melakukan analisis, sampel yang diperlukan bisa lebih sedikit jika dibandingkan dengan pendekatan teori respon butir, sehingga sangat cocok dilakukan untuk penilaian di kelas dan perbaikan evaluasi pembelajaran. B. SARAN Keseragaman penerapan tes secara nasional perlu dipertimbangkan lebih arif, mengingat tingkat kemampuan yang beragam sesuai lingkungan tempat tinggal peserta tes. Walaupun penerapan kurikulum berlaku secara nasional, namun faktor lingkungan tempat sekolah juga perlu dipertimbangkan. Konsep utama teori responsi butir adalah adanya kesesuaian tingkat kesukaran suatu tes dengan kemampuan siswa yang menjawab adalah sesuatu yang tidak dapat diabaikan. Harus diingat bahwa nilai  (daya pembeda soal) yang tinggi, dan nilai  (tebakan jawaban) yang rendah, tanpa dibarengi nilai b (tingkat kesukaran soal) yang mendekati kemampuan  akan memberikan nilai fungsi informasi butir tes yang rendah. Pemanfaatan program komputer dalam menganalisis hasil tes sudah saatnya digunakan terutama untuk mengatasi berbagai kesalahan yang mungkin dilakukan secara



manual, sehingga akurasi hasil analisis dapat dipertanggung jawabkan. Untuk masa yang akan datang disarankan Ujian Nasional sudah dapat melaksanakan ujian dengan sistem individual tes dengan menggunakan Computer Adaptive Test (CAT). Dengan menggunakan CAT permasalahan-permasalahan yang dihadapi dalam pelaksanaan tes secara kelompok klasikal seperti yang dilaksanakan dalam Ujian Nasional sekarang ini dapat dihindari. Soal-soal Ujian Nasional harus dikembangkan berdasarkan bank soal yang sudah dikalibrasi dengan konsep teori responsi butir. Pada akhirnya keberhasilan siswa tidak hanya ditentukan oleh faktor hasil ujian hasil belajar saja, akan tetapi faktor-faktor lain, seperti kerajinan, kehadiran, hasil ujian bulanan, pengerjaan pekerjaan rumah, dan faktor-faktor lain seharusnya menjadi pertimbangan lain dalam menentukan kelulusan peserta didik.



REFERENSI



Azwar, S. (2015). Dasar-dasar Psikometri. Yogyakarta: Pustaka Pelajar Salkind, N. J. (2007). Encyclopedia of measurement and statistics volume 1. California: SAGE Publications, Inc. Sumintono, B., & Widhiarso, W. (2015). Aplikasi Pemodelan Rasch Pada Assessment Pendidikan. Bandung: Trim Komunikata Buku tentang Rasch Model dan Item Response Theory (IRT) 1. Bond, T.G. and Fox, C.M. (2015). Applying The Rasch Model, Fundamentals  Measurement in the Human Sciences. 3rd edition. New York: Routledge. 2.  Andrich, D. (1988). Rasch Model for Measurement. (series: Quantitative Application in the Socials Sciences). Newburry Park, California: Sage Publication. 3. Azrilah Abdul Aziz (2010). Rasch Model Fundamentals: scale construct and measurement structure. Kuala Lumpur: Integrated Advance Planning.



4. Alagumalai, S., Curtis, D.D. and Hungi, N. (editors) (2005). Applied Rasch Measurement: book of exemplars. papers in honour of John P. Keeves. Dordrecth: Springer. 5. Boone, W. J., Staver, J.R. and Yale, M.S. (2014). Rasch Analysis in the Human Sciences. Dordrecth: Springer. 6. Cavanagh, R.F. and Waugh, R.F. (editors) (2011). Application of Rasch Measurement in Learning Environments Research. Rotterdam:  Sense Publishers. 7. Englehard, G.  (2013). Invariant Measurement, using rasch models in the Social, Behavioral, and Health Sciences. New York: Routledge 7. von Danier, M. and Carstensen, C.H. (2007). Multivariate and Mixture Distribution Rasch Model. Dordrecth: Springer. 8. Wilson, M. (2005). Constructing Measures, an item response modeling approach. New Jersey: Lawrence Erlbaum Associates. 9. Hambleton, R.K. and Swaminathan, H. (1985). Item Response Theory: principles and application. Boston: Kluwer. 10.  Andrich, D. and Marais, I. (2019). A Course in Rasch Measurement Theory, Measuring in the Educational, Social and Health Sciences. Dordrecth : Springer. 11. Boone, W. J. and Staver, J.R. (2020). Advances in Rasch Analyses in the Human Sciences. Dordrecht: Springer. 12. Engelhard, G. and Wind, S. (2018). Invariant Measurement with Raters and Rating Scales. New York: Routledge.



13. Khin, M. S. (ed.). (2020). Rasch Measurement, Applications in Quantitative Educational Research. Dordrecht: Springer. A2. Buku Metoda Riset 1. Punch, K. F. (2009). Introduction to Research Methods in Education. Los Angeles: SagePublication. 2. Creswell, J.C. (2012). Education Research, Planning, Conducting and Evaluating Quantitative and Qualitative Research. 4th edition. Boston: Pearson B. Artikel 1. Azrilah Abdul Azis dan Mohd Saidfudin Masodi. (no date). Instrument Construct: Designing and Effective Questionnaire as valid measurement instrument based on Rasch Model. Kuala Lumpur, Malaysia 2. Michell, J. (1997). Quantitative science and the definition of measurement in psychology. British Journal of Psychology, 88, 355-383. 3.  Michell, J. (2002). Stevens’s theory of scales of measurement and its place in modern psychology. Australian Journal of Psychology, 54(2), 99-104. C.  Laman Web (Websites) 1. http://www.rasch.org  [Institute of objective measurement] 2. http://www.winsteps.com/ministep.htm [perangkat lunak gratis: ministep] 3. http://www.winsteps.com [perangkat lunak berbayar: winsteps]



4. http://en.wikipedia.org/wiki/Rasch_model [pengantar tentang Rasch model di wikipedia]