Yusrizal Buku3 [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up

Yusrizal Buku3 [PDF]

Pengukuran & Evaluasi Hasil Dan Proses Belajar @Prof. Dr. Yusrizal, M.Pd Editor : Mukhlisuddin Ilyas Desain sampul/Tata

6 0 4 MB

Report DMCA / Copyright

DOWNLOAD FILE


File loading please wait...
Citation preview

Pengukuran & Evaluasi Hasil Dan Proses Belajar @Prof. Dr. Yusrizal, M.Pd Editor : Mukhlisuddin Ilyas Desain sampul/Tata Letak: Musthafa.Net Diterbitkan oleh: Penerbit Pale Media Prima Jln. Melati No171, Sembilegi Baru Kidul Maguwoharjo, Depok, Sleman Daerah Istimewa Yogyakarta Tlp. ((0274) 4332233 Fax: (0274) 485222 Email: [email protected]



Cetakan Pertama Oktober 2016 Ukuran : 13.5 x 21 cm (a5) Halaman: xii+264



HAK CIPTA DILINDUNGAN UNDANG-UNDANG All Rights Reserved. Dilarang mengutip atau memperbanyak sebagian atau seluruh isi buku ini tanpa ada izin ini dari Penerbit.



Hak cipta dilindungi Undang-undang All Right Reserved Undang-Undang No. 19 tahun 2002 Tentang Hak Cipta 1. Barang siapa sengaja melanggar dan tanpa hak melakukan perbuatan sebagaimana dimaksud dalam pasal (2) Ayat (1) atau pasal 49 Ayat (1) dan Ayat (2) dipidana dengan pidana penjara masing-masing paling singkat 1 bulan dan/atau denda paling sedikit Rp. 1.000.000,- (satu juta rupiah) atau pidana penjara paling lama 7 (tujuh) tahun dan/atau denda paling banyak Rp. 500.000.000 (lima ratus juta rupiah) 2. Barang siapa dengan sengaja menyiarkan, memamerkan, mengedarkan, atau menjual kepada umum suatu ciptaan atau barang hasil pelanggaran hak ciptaan atau hak terkait sebagai pada Ayat (1) dipidanan dengan pidana penjara paling lama 5 (lima) tahun dan/atau denda paling banyak Rp.500.000.000 (lima ratus juta rupiah)



| Pengukuran & Evaluasi Hasil Dan Proses Belajar



iii



Prof. Dr. Yusrizal, M.Pd



iv



| Pengukuran & Evaluasi Hasil Dan Proses Belajar



PRAKATA



Puji syukur kami panjatkan ke hadirat Allah SWT, atas berkat rahmad, taufik, serta hidayah-NYA penulisan buku “Tanya Jawab Seputar Pengukuran, Penilaian dan Evaluasi Pendidikan” ini dapat diselesaikan. Selawat dan salam semoga dilimpahkan oleh Allah SWT kepada junjungan kita Nabi Muhammad SAW yang senantiasa kita jadikan contoh dan suru teladan dalam kehidupan kita.



Dalam Permendiknas No 16 Tahun 2007 tentang Kualifikasi Akademik dan Standar Kompetensi Guru disebutkan bahwa salah satu kompetensi inti guru adalah menyelenggarakan pengukuran dan evaluasi baik hasil maupun proses belajar. Namun, dari pengalaman mengajar mata kuliah Evaluasi Pendidikan pada berbagai program studi magister pendidikan PPs Unsyiah sejak | Pengukuran & Evaluasi Hasil Dan Proses Belajar



v



Prof. Dr. Yusrizal, M.Pd



tahun 2008 menunjukkan bahwa hampir semua mahasiswa yang umumnya guru, pengetahuan tentang evaluasinya belum memuaskan.



Berdasarkan alasan tersebut buku Pengukuran & Evaluasi Hasil dan Proses Belajar ini disusun. Buku ini terdiri atas Enam Unit yang urutannya sebagai berikut: Unit I.Pengukuran dan Evaluasi, Unit II.Taksonomi Bloom dan Ranah Hasil Belajar, Unit III. Instrumen Evaluasi dan Teknik Penilaian, Unit IV. Kualitas Instrumen, Unit V. Penyusunan Soal dan Penskoran, dan UnitVI. Pengukuran dan Penilaian Ranah Afektif.



Sebagai suatu usaha awal, penulis berharap buku ini dapat bermanfaat dalam membantu para guru dan calon guru memahami dan menggunakannya dalam proses pembelajaran. Tiada gading yang tak retak, demikian juga buku ini mengandung banyak kekurangan dan kekurangsempurnaan. Karenaya, penulis menerima dengan hati terbuka berbagai saran dan kritik-kritik konstruktif yang dapat dijadikan dasar perbaikan dalam penerbitan berikutnya,



vi



Banda Aceh, Agustus 2016



| Pengukuran & Evaluasi Hasil Dan Proses Belajar



DAFTAR ISI



PRAKATA DAFTAR ISI UNIT I. PENGUKURANDAN EVALUASI BAB 1.Sejarah Pengukuran dan Evaluasi A. Pengembangan Tes Inteligensi B. Pengembangan Tes Prestasi C. Pengembangan tes Karakter dan Kepribadian



BAB 2. Konsep Pengukuran, Penilaian dan Evaluasi A. Pengertian Pengukuran B. Skala Pengukuran C. Pengertian Penilaian D. Penilaian Tradisional dan Penilaian Alternatif E. Pengertian Evaluasi F. Jenis Evaluasi G. Prinsip-Pinsip Evaluasi H. Fungsi Pengukuran dan Evaluasi BAB.III. Belajar dan Hasil Belajar A. Belajar, Prestasi dan Hasil Belajar B. Pengukuran dan Evaluasi Hasil Belajar C. Instrumen Dalam Evaluasi



UNIT II.TAKSONOMI BLOOM DAN RANAH HASIL BELAJAR BAB 4 . Ranah Kognitif A. Taksonomi Bloom Original B. Taksonomi Bloom Revisi | Pengukuran & Evaluasi Hasil Dan Proses Belajar



.



vii



Prof. Dr. Yusrizal, M.Pd



BAB 5. Taksonomi Tujuan Afektif dan Psikomotor A. Taksonomi Ranah Afektif B. Taksonomi Ranah Psikomotor UNIT III. INSTRUMEN EVALUASI DAN TEKNIK PENILAIAN BAB 6. Instrumen Tes A. Pengertian Tes B. Tujuan Tes C. Klasifikasi Tes D. Jenis-Jenis Tes E. Bentuk-Bentuk Tes Hasil Belajar F. Keterbatasan Tes Sebagai Alat Ukur G. Fungsi Tes H. Karakteristik Tes Yang Baik BAB 7. Bentuk Tes Hasil Belajar A. Tes Objektif B. Tes Esai



BAB 8. Instrumen Nontes A. Konsep Nontes B. Kuesioner (Angket) C. Wawancara (Interview) D. Daftar Cocok (Check List) E. Skala Penilaian (Rating Scale) F. Pengamatan/Observasi G. Jurnal H. Inventori viii



| Pengukuran & Evaluasi Hasil Dan Proses Belajar



.



I. Penilaan Diri J. Penilaian Oleh Teman Sejawat



BAB 9.Teknik Penilaian A. Penilaian Kinerja B. Penilaian Produk C. Penilaian Proyek D. Penilaian Portofolio



UNIT IV KUALITAS INSTRUMEN DAN ANALISIS BUTIR BAB 10. Validitas Tes A.Konsep Val B. Macam-Macam Validitas C. Pengujian Validitas D. Faktor-Faktor Yang Mempengaruhi Validitas BAB 11. Reliabilitas Tes A. Pengertian Reliabilitas B. Jenis-Jenis Reliabilitas C. Mengestimasi Koefisien Reliabilitas D. Kesalahan Pengukuran Standar E. Faktor-Faktor Yang Mempengaruhi Reliabilitas F. Hubungan Antara Reliabilitas dan Validitas BAB 12. Analisis Butir Tes A. Pengertian Analisis Butir Tes B. Manfaat Analisis Butir Tes



| Pengukuran & Evaluasi Hasil Dan Proses Belajar



ix



.



.



Prof. Dr. Yusrizal, M.Pd



UNIT V. PENYUSUNAN SOAL DAN PENSKORAN BAB 13. Penyusunan dan Penulisan Soal A. Penysunan Tes B. Kaidah Penulisan Soal C. Penulisan Soal Penalaran Tinggi BAB 14. Penskoran Hasil Tes A. Penskoran Hasil Tes B. Konversi Skor



UNIT VI.PENGUKURAN DAN PENILAIAN AFEKTIF. BAB 15. Bentuk-Bentuk Skala Pengukuran A.Skala Pengukuran B. Pengukuran dan Penilaian Sikap C. Metode Pengukuran Sikap BAB 16. Pengembangan Instrumen Afektif A. Prosedur Pengembangan Instrumen B. Penulisan Butir Instrumen BAB 17. Contoh Pengembangan Instrumen Kinerja Guru A. Instrumen Kinerja Guru B. Analisis Hasil Ujicoba DAFFTAR PUSTAKA



x



| Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



UNIT I PENGUKURAN DAN EVALUASI Pengukuran dan evaluasi merupakan bagian penting dalam siklus pendidikan. Hasil pengukuran dan evaluasi sangat berpengaruh dalam pembuatan keputusan oleh pihak yang terkait seperti guru. Oleh karena itu, pengukuran dan evaluasi merupakan salah satu kegiatan utama yang harus dilakukan oleh seorang guru dalam kegiatan pembelajaran. Dengan pengukuran dan evaluasi, guru akan mengetahui perkembangan hasil belajar, intelegensi, bakat, minat, hubungan sosial, sikap dan kepribadian siswa serta secara umum dapat mengetahui berhasil dan tidaknya program pembelajaran. 1 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Pengukuran dan evaluasi hasil belajar siswa yang menjadi tanggung jawab guru di sekolah merupakan bagian integral dari keseluruhan proses pendidikan. Melalui kegiatan pengukuran, dapat diperoleh informasi mengenai efektivitas pembelajaran, tingkat pencapaian/ keberhasilan belajar siswa, dan daya serap materi pengajaran yang telah diberikan. Dalam setiap pelaksanaan pengukuran hasil pembelajaran, guru harus memperhatikan secara seksama alat ukur maupun kondisi obyektif yang akan diukur, sehingga hasil pengukuran benar-benar dapat memberikan gambaran obyektif dan akurat tentang performa siswa yang diukurnya. Agar evaluasi dapat berhasil dengan baik diperlukan alat evaluasi yang tepat dan telah teruji dengan baik. Alat evaluasi harus juga dapat menghasilkan data yang diperlukan sesuai dengan tujuan evaluasi. Dalam pembelajaran, guru membutuhkan data yang berkaitan dengan perkembangan belajar siswa, oleh karena itu guru melakukan serangkaian pengukuran sesuai dengan jenis penilaian dan evaluasi. Secara umum dikenal ada dua macam alat evaluasi, yaitu tes dan nontes. Secara khusus di dalam kelas alat ukur yang dominan digunakan untuk mengukur hasil belajar ranah kognitif adalah tes. Nontes lazimnya digunakan untuk mengukur dan menilai ranah afektif dan psikomotor.



2 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 1 SEJARAH PENGUKURAN



DAN EVALUASI Pengukuran pendidikan berkembang melalui proses evolusi, yang dimulai dari konsep-konsep sederhana mengkuantifikasi dan menafsirkan perilaku tertentu, tes dan pengukuran telah berkembang menjadi proses yang kompleks meliputi seluruh ukuran kepribadian dan ukuran bermacam-macam sistem kerja dan operasinya. Gagasan tentang bagaimana pengukuran asal mula tidak dapat diketahui secara pasti. Namun, dari sedikit 3 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



fakta yang ada yang dibuat oleh beberapa ahli psikologi dapat disimpulkan bahwa konsep-konsep tes dan pengukuran diawali dengan pengembangan bermacammacam tes psikologis.



A. Pengembangan Tes Inteligensi Jean Etienne Esquirol, Psikiatris Perancis yang pertama kali melakukan usaha-usaha untuk menggambarkan perbedaan-perbedaan diantara kekurangan dan ketololan mental. Dia juga memperhitungkan sejumlah pengembangan mendatang dalam studi mengenai keterlambatan mental. Esquirol menggunakan kemampuan berbahasa sebagai kriteria dari perasaan-perasaan dalam mencoba mengelompokkan individu-individu keterlambatan mental. Pada 1838, dia menulis buku pertamanya Des maladies mentalis, dimana dia menjelaskan suatu pandangan objektif dan rasional tentang gangguan mental. Dia dikenal sebagai “Bapak Psikologi Abnormal”. Wilhelm Wundth, ahli Filsafat dan Psikologi Jerman mendirikan laboratorium pertama di dunia, tempat dia melakukan eksperimen Psikologi di Leipzig, Jerman dalam 1879. Laboratorium ini diperuntukkan bagi mahasiswamahasiswanya yang berminat dalam psikollogi. Kesibukan utamanya adalah tentang pengukuran perbedaan dayadaya sesnsori, yang menghasilkan pengetahuan psikofisik. Dia dikenal sebagai “Bapak Psikologi Eksperimental” dan “Pendiri Psikologi Modern” 4 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Hernann Ebbinghaus, ahli Psikologi Eksperimental Jerman, membuat tes melengkapi kata, yang sampai sekarang masih digunakan dalam tes-tes inteligensi. Dia menyelidiki penglihatan warna dan kapasitas mental. Dia merupakan salah seorang yang pertama mendemonstrasikan bahwa belajar dan memori dapat dipelajari secara eksperimen. Meskipun beberapa tekniknya tentang demonstrasi ini mendapat kritikan, sumbangan-sumbangannya untuk studi kuantitatif tentang proses-proses mental lebih tinggi, termasuk tes-tes inteligensi menjadi penting. Dia dikenal sebagai “Pendiri Studi Memori Kuantitatif” Francis Galton, ahli psikologi Inggris, tercatat sebagai orang paling awal yang menerapkan analisis statistik pada gejala perilaku dan mental. Dia adalah seorang peninjau dan penanya inteligensi manusia. Dia merupakan orang pertama yang menggunakan metode kuesioner dan survey dalam menyelidiki perbedaan mental kelompok-kelompok berbeda. Akibatnya, dia mampu memperbaiki tes-tes pendidikan mental. Karl Pearson, ahli matematika Inggris yang mengembangkan teknik-teknik statistik modern. Pada awal tahun1900-an dia tertarik pada kerja Francis Galton yang berkeinginan menemukan hubungan-hubungan statistik untuk menjelaskan bagaimana cirri-ciri biologis diturunkan ke generasi-generasi. Pearson memperluas ide-ide regesi Galton dan mengembangkan metode-metode korelasi yang dikenal “ Koefisien Korelasi Product Moment Pearson” Sebagian karyanya menjadi dasar statistik abad ke 20. Pearson adalah mahasiswa Galton. 5 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Charles Spearman, ahli Psikologi Inggris, yang terpengaruh selama belajar oleh karya-karya Francis Galton. Berbekal pengetahuan statistiknya yang kuat, dia membuat suatu estimasi inteligensi sekelompok anak-anak. Dia akhirnya mengembangkan teori dua faktor inteligensi. Seperti Pearson, dia mengembangkan metode korelasi yang dikenal sebagai “Koefisien Korelasi Perbedaan Rank Spearman. Spaerman adalah juga mahasiswa Galton. Edward L.Thorndike, ahli Psikologi Amerika yang mengembangkan psikologi Conecsionis. Thorndike dan mahasiswa-mahasiswanya menggunakan pengukuranpengukuran inteligensi pada manusia sejak 1903. Selama 1920-an dia mengembangkan sebuah tes inteligensi yang terdiri dari melengkapi, ilmu hitung, kata-kata, dan petunjuk-petunjuk tes yang dikenal sebagai “CAVD”. Tes nya menjadi dasar tes-tes inteligensiu modern . James McKeen Cattell, adalah ahli Psikologi Amerika, yang menganggap penting gambar-gambar dalam psikologi dan dalam mempelajari inteligensi manusia. Menggunakan metode-metode statistik dan kuantifikasi datanya, dia membantu pengembangan Psikologi Amerika sebagai sains eksperimental. Dia merupakan ahli psikologi pertama di Amerika yang menekankan pentingnya kuantifikasi, rankin, dan rating. Karena sumbangan-sumbangannya yang signifikan, dia diakui sebagai “ Bapak Tes Mental” Clark Wissler, ahli Antropolgi Amerika, yang menggunakan faktor korelasi untuk menemukan kesalahan empiris metode testing inteligensi J.M.Cattel. Setelah belajar di bawah Cattel, dia menilai hasil-hasil usaha Cattel mengukur kemampuan mental dari siswa-siswa dengan 6 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



cara mengukur waktu reaksi mereka, waktu gerakan, dan proses-prosen sensori serta mental sederhana lainnya. Dia mendapatkan korelasi yang sangat kecil diantara keadaan akademik dan tes-tes. Alfred Binet, ahli Psikologi Perancis, yang mulai belajar sains pada 1878. Penelitian Binet bersama puteriputerinya membantuut mengembangkan konsepsi tentang inteligensi, terutama pentingnya rentang perhatian dan saran dalam pengembangan intelektual. Sementara memimpin Laboratorium Psikologi Eksperimental, Theodore Simon melakulan penelitian doktoral di bawah supervisi Binet. Kedua mereka mengembangkan Skala Binet-Simon. Binet dan Simon merupakan peneliti-peneliti pertama yang menggunakan umur mental sebagai ukuran inteligensi, namun ide mereka diperbaiki oleh penelitipeneliti pada tahun-tahun berikutnya. Walter V. Bingham, ahli Psikologi Terapan Amerika, yang mempercayai bahwa inteligensi adalah sesuatu yang rumit yang dapat diukur dengan melihat sikap-sikap individu kepada matematis, lisan, mekanis, dan keahlian sosial. Dia percaya bahwa faktor keturunan adalah paling penting dalam pengembangan intelektual, dan bahwa pengaruh-pengaruh lingkungan hanya mengubah apa yang sudah ada di dalam diri individu. Henry Herbert Goddard, ahli Psikologi Amerika, pada 1010 mendirikan laboratorium pertama untuk studi psikologis orang-orang lambat secara mental. Dia menerjemahkan Skala Binet-Simon ke dalam Bahasa Inggris. Pandangan-pandangannya tentang inteligensi adalah berasal atau diturunkan dari genetik Mendelian. Dia 7 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



mempercayai bahwa feeblemindedness disebabkan oleh transmisi dari gen recessive tunggal. Dia dikenal sebagai ´Bapak Testing Inteligensi” di Amerika. William Stern, ahli Psikologi Jerman yang mencoba mengelompokkan orang menurut jenis, norma, dan aberasi.Terinspirasi oleh kerja Binet, Stern mengembangkan ide yang memperlihatkan hasil-hasil tes inteligensi dalam bentuk angka tunggal,yaitu Inteligensi Quotion (IQ). Dia menggambarkan inteligensi sebagai umur mental dibagi dengan umur kronologis. Dalam bentuk persamaan:



. Lewis Madison Terman, ahli Psikologi Kognitif Amerika, yang melihat apakah tes-tes mental dapat membedakan siswa-siswa terbelakang. Akhir 1906, ketika di Standford, Terman menerbitkan suatu revisi sempurna skala Binet-Simon yang dikenal sebagai “ Standford-Binet” yang merupakan tes inteligensi individu terbaik yang tersedia. Kemudian, pada 1916, Terman menyatakan mengubah persamaan inteligensi quotient dengan mengalikannya angka 100 untuk menyingkirkan desimaldesimal. Hasilnya adalah persamaan inteligensi quotient sebagaai berikut:



.



8 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Robert Mearns Yerkes adalah seorang ahli Psikologi Komparatif Amerika, yang segera setelah Amerika terlibat Perang Dunia Pertama, mendesak Perkumpulan Psikologi Amerika untuk menyumbang keahlian psikologi untuk usaha perang. Yerkes bekerjasama dengan Goodard, Terman, dan Bingham mengembangkan tes inteligensi kelompok yang dapat mengenali tentera baru berinteligensi rendah dan mengizinkan Tentera mengakui orang-orang yang berpakaian sangat baik untuk tugastugas sekolah latihan. Mereka membuat tes verval dan tes nonverbal yang masing-masing dikenal sebagai Army Alpha dan Army Beta, untuk tentera baru yang buta huruf dan tidak bisa berbicara bahasa Inggris, Bentuk bentuk akhir tes-tes Army Alpha dan Army Beta dipublikasin pada 1919., David Wechsler, seorang ahli Psikologi Ameriak, memahami inteligensi lebih dari suatu efek dari pada suatu sebab. Untuk dalam perbandingan dengan rata-rata individu menentukan suatu tuntutan penting dari inteligensi orang dewasa,dia memperkenalkan Deviasi Quotien, suatu IQ dihitung dengan mempertimbangkan kemampuan mental individu dibanding dengan umur individu rata-ratanya Dia adalah orang yang mengembangkan sebuah tes inteligensi individu orang dewasa menjadi lampiran pada tes Standford-Binet Tes ini pada 1939..dikenal sebagai Wechsler Adult Intelligence Scale disingkat dengan WAIS (Skala Inteligensi Orang Dewasa Wechsler). Pada 1949, dia mempublikasikan tes inteligensi lain yang disebut sebagai Wechsler Intelligence



9 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Scale for Children, disingkat WISC atau tes inteligensi Wechsler untuk anak-anak. Joy Paul Guilford, seorang ahli Psikologi Amerika yang membuat banyak sumbangan untuk studi kemampuan-kemampuan intelektual manusia. Model inteligensi manusianya dikenal sebagai “ Struktur Intelek” yang rumit, model inteligensi tiga dimensi yang dapat digunakan untuk panduan pengajaran pendidikan. Banyak tes-tesnya diodefikasi dan dikembangkan dibawah bimbingannya dengan menggunakan analisis faktor.



B. Pengembangan Tes Prestasi Horace Mann yang memperkenalkan ujian tulis pada sekolah-sekolah di Boston karena kelemahan tes lisan. Sekolah Normal untuk Guru-Guru didirikan di Lexington, Massachusetts pada 1839 atas usaha-usaha Mann. Karena sumbangan-sumbangannya itu, dia dikenal sebagai “Bapak Pendidikan Sekolah Umum Amerika”. Rev. George Fisher, seorang kepala sekolah Inggris, yang menciptakan dan menggunakan ukuran objektif prestasi murid-murid. Pada 1864, dia menciptakan sebuah instrument yang dinamakan “ Buku Skala”. Buku Skalanya dibuat untuk mengukur prestasi siswa pada pokok materi sekolah berbeda, seperti skala tulisan tangan, mengeja, matematika, tata bahasa, komposisi, dan lainnya. Tes-tes ini (Buku Skala) masih agak kasar, namun menjadi awal dari tes-tes keahlian modern saat ini.



10 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



J.M. Rice, yang dikenal sebagai penemu pertama tes objektif komparatif di Amerika. Pada 1894, dia membuat sebuah daftar ejaan (spelling) kata-kata untuk mengukur perbedaan-perbedaan diantara kelompok-kelompok siswa yang diajarka secara berbeda. Rice menemukan bahwa siswa-siswa yang belajar spelling selama tiga puluh menit setiap hari selama delapan tahun tidak menunjukkan lebih baik kemampuan spellingnya dari pada siswa-siswa yang belajar spelling hanya lima belas menit setiap hari selama delapan tahun. Dia juga mempersiapkan tes-tes serupa untuk bahasa dan ilmu hitung. Tes-tes ini merupakan awal dari tes-tes objektif di sekolah-sekolah berbeda. Dr. Edward L. Thorndike, telah mengembangkan metode untuk mengukur bermacam-macam kemampuan dan prestasi menjelang Amerika ambil bagian dalam Perang Dunia I. Buku pertamanya yang dikenal sebagai “Pengukuran Mental dan Sosial” diterbitkan pada 1904. Isi buku tersebut menjadi dasar prosedur-prosedur dan prinsip-prinsip statistik pada teknik-teknik statistik dan tes-tes hari ini. Dia yang pertama kali mengkonstruksi skala menulis tangan untuk mengukur menulis tangan anak-anak pada 1909, yang menunjukkan nilai-nilai kualitatif untuk kualitas menulis tangan. Skala ini dikenal sebagai Skala Menulis tangan Thorndike”. Dia juga dipandang sebagai “Bapak Pengukuran Pendidikan”. Cliff W. Stone, seorang mahasiswa Thorndike, mengkonstruksi dua macam tes, pertama, mengenai empat operasi dasar dalam ilmu hitung dan yang kedua, tes nalar ilmu hitung pada 1908. Stone dipandang sebagai orang pertama yang mempublikasikan tes prestasi standar dalam 11 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



ilmu hitung. Tes ini dikenal sebagai Tes Ilmu Hitung Stone pada 1908. Tes nalar ilmu hitung merupakan sumbangan Stone untuk testing dan pengukuran pendidikan. S.A.Curtis, adalah juga mahasiswa Thorndike lainnya, sama seperti Stone, Curtis tertarik dalam mengukur pertumbuhan murid-murid dalam ilmu hitung dan dalam menetapkan sebuah norma pencapaian untuk setiap tingkat (grade). Dia mengembangkan serangkaian tes-tes standar dalam ilmu hitung untuk digunakan pada 1909. Konsep kata benda (nouns) dan standar-standar diawali oleh Curtis. Tes yang dikonstruksinya dikenal sebagai “Rangkaian Tes Ilmu Hitung Curtis” M.Hillegas, juga seorang mahasiswa Thorndike, mengkonstruksi serangkaian tes-tes standar dalam Skala Komposisi berdasarkan prinsip-prinsip dalam konstruksi Skala Menulis Tangan Thorndike pada 1912. Skala ini dikenal sebagai “Skala Komposisi Hillegas” dan tes ini menjadi dasar skala komposisi hari ini. Ayres, Mahasiswa Thorndika juga, yang mengembangkan skala-skala ejaan (spelling) standar pada 1915. Skala ini dikenal sebagai “ Skala Ejaan Ayres” William A.McCall, mempublikasikan buku pionirnya berkaitan dengan adaptasi tes pada 1924. Jenis tes yang dikonstruksinya merupakan jenis baru tes yang meluas digunakan hari ini. Raph. W. Tyler menyadari perlu ada perluasan tes prestasi untuk hasil-hasil pengajaran yang tidak dapat diukur secara akurat seperti sikap, apresiasi, minat, gagasan, dan lainnya. Sumbangan Tyler jugamembawa kekonsep testing modern. 12 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



C. Pengembangan Tes Karakter dan Kepribadian Fernand adalah terkenal sebagai orang pertama yang mengukur karakter dengan menggunakan tes, sementara Voelker, orang yang menciptakan situasi-situasi sebenarnya untuk testing (pengujian) karakter. Percival Symonds, seorang ahli psikologi yang mengembangkan studi ilmiah tentang kepribadian. Herman Rorschach, memperkenalkan sebuah tes multi dimensi kepribadian yang dikenal sebagai tes Rorschach pada 1921. Tes ini terdiri atas 10 noda tinta yang digunakan sebagai teknik proyektif untuk menilai aspek-aspek global kepribadian. Siswa merespons dengan cara melapurkan apa yang dilihat dalam noda tinta, dan reaksi-reaksinya menentukan variable-variabel kepribadiannya seperti sifat impulsif, sensitivitas, dan stabilitas emosi. Raymond B, Cattel, seorang ahli Psikologi Amerika dan Inggris, penyumbang dan pemakai teknik-teknik statistik lanjut. Dia mencari teori teori komprehensif perilaku manusia melalui analisis multi faktor sejak awal karirnya dan dia tertarik dengan analisis faktor C. Spearman. Hobinya tentang teori komprehensif perilaku melalui metode analisis faktor telah menghasilkan bermacam-macam model teoritis dan instrumeninstrumen psikometrik. Pengembangan teorinya dalam pengukuran kepribadian dengan pertanyaan diwujudkan dalam 16 faktor kepribadian. 13 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



14 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 2 KONSEP PENGUKURAN, PENILAIAN DAN EVALUASI A. Pengertian Pengukuran Beberapa definisi yang dikemuka kan para ahli tentang pengertian pengukuran adalah sebagai berikut : 1.Measurement is the assignment of numerals to objects or events according to rules that give numeral quantitative meaning”, Pengukuran adalah pengalihan dari angka ke objek atau peristiwa sesuai dengan aturan yang memberikan makna angka secara kuantitatif (Wiersma and Jurs,1990)



15 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



2.Measurement is a procedure for assigning numbers (ussualy called scores) to a specified attribute or characteristic of persons in such a manner as to maintain the real world relationships among the persons with regard to the attribute being measured. Pengukuran adalah prosedur pemberian angka (biasa disebut skor) untuk suatu atribut tertentu atau karakteristik orang-orang sedemikian rupa untuk menjaga hubungan dunia nyata antara orang-orang berkaitan dengan atribut yang diukur (Lord and Novick, 1974). 3.Measurement. is the assign of numbers to the results of a test or other type of assessment according to a specific rule. Pengukuran adalah pemberian angka pada hasil suatu tes atau jenis penilaian lain menurut aturan tertentu (Gronlund and Linn, 1995) 4.Measurement defined as the process of assigning numerals to objects according to rules. Maksudnya pengukuran didefinisikan sebagai proses penetapan bilangan-bilangan pada objek menurut aturan (Dizney, 1971) Dari sejumlah pengertian di atas, pengukuran dapat diartikan sebagai kegiatan atau upaya yang dilakukan untuk memberikan angka-angka pada suatu gejala atau peristiwa, atau benda, sehingga hasil pengukuran akan selalu berupa angka. Menurut Zainul dan Nasution (2005) pengukuran memiliki dua karakteristik utama, yaitu: 1)



16 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



penggunaan angka atau skala tertentu, 2) menurut suatu aturan atau formula tertentu. Melalui pengukuran, atribut atau karakteristik yang terdapat dalam obyek yang diukur ditransfer menjadi bentuk angka sehingga lebih mudah untuk dinilai. Aspekaspek yang terdapat dalam diri manusia seperti kognitif, afektif dan psikomotor dirubah menjadi angka. Adapun proses pengukuran menurut Koyan (2012) dapat dilihat pada Gambar 2.1 berikut. Sasaran ukur: Atribut orang, objek Peristiwa ↓ Alat Ukur (Skala Ukur) ↓ Cara Ukur ↓ Responden: orang, objek, peristiwa ↓ Skor (Data): Bilangan Gambar 2.1. Proses Pengukuran Makna gambar tersebut di atas dapat dijelaskan sebagai berikut. 1) Sasaran ukur pada responden adalah atribut orang (hasil belajar mahapeserta didik, sikap karyawan), atribut objek (tinggi meja, kedalaman ilmu), peristiwa



17 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



2) 3)



4)



5) 6)



(kecepatan pengolahan data); biasanya berbentuk variable. Alat ukur (skala ukur) dibuat, diuji coba, diperbaiki, dan harus cocok dengan sasaran ukur dan responden Skala ukur adalah besaran pada alat ukur (Misalnya: satuan ukur) yang digunakan untuk memperoleh skor atau data. Cara ukur adalah cara alat ukur diberikan kepada responden untuk memperoleh skor; dalam hal ini perlu diperhatikan sifat alat ukur, sifat responden, dan kualitas skor. Skor adalah bilangan yang diberikan kepada atribut orang, objek, atau peristiwa. Nilai adalah arti dari skor sebagai hasil pengukuran; skor ditransformasi menjadi nilai.



Dalam dunia pendidikan, yang dimaksud pengukuran (measurement) adalah proses pemberian angka atau usaha memperoleh deskripsi numerik dari suatu tingkatan di mana seorang siswa telah mencapai karakteristik tertentu. Sebagai contoh, guru melakukan pengukuran terhadap proses dan hasil belajar yang hasilnya berupa angka-angka yang mencerminkan capaian dari proses dan hasil belajar tersebut. Angka 40, 65, atau 100 yang diperoleh dari hasil pengukuran proses dan hasil pembelajaran tersebut bersifat kuantitatif dan belum dapat memberikan makna apa apa, karena belum menyatakan tingkat kualitas dari apa yang diukur. Angka hasil pengukuran masih disebut skor mentah. Angka hasil pengukuran baru mempunyai makna bila dibandingkan 18 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



dengan kriteria atau patokan tertentu, yang disebut penilaian. Hasil penilaian dapat berupa nilai kualitatif (pernyataan naratif dalam kata-kata) dan nilai kuantitatif (berupa angka) Pengukuran dapat menggunakan tes dan non-tes. Pengukuran yang menggunakan tes seperti tes pilihan ganda, tes benar-salah, tes menjodohkan, tes melengkapi, dan tes esai yang terstruktur. Pengukuran yang menggunakan non tes, misalnya skala sikap, skala penilaian atau skala motivasi.



B. Skala Pengukuran Skala pengukuran adalah seperangkat aturan yang diperlukan untuk mengkuantitatifkan data pengukuraan dari suatu variable (Djaali & Muljono, 2008). Dalam pengukuran terdapat karakteristik utama, yaitu penggunaan angka atau skala tertentu Skala atau angka dalam pengukuran dapat diklasifikasikan ke dalam 4 (empat) kategori, yaitu: skala nominal, skala ordinal, skala interval, dan skala rasio. 1. Skala Nominal Nominal scales classify people or objects into categories, classes, or sets (Reynolds, at.all, 2009) Skala nominal adalah pengukuran yang sematamata hanya membedakan satu atau lebih kategori dengan kategori lainnya. Kategori-kategori tersebut bersifat 19 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



terpisah dan masing-masing kategori diberi nomor untuk membedakannya. Misalnya, variabel ”jenis kelamin”, nilai 1 untuk pria dan 2 untuk wanita. Variabel ”agama”dapat diberi nomor 1 untuk Islam, 2 untuk kristen, 3 untuk Hindu, dan 4 untuk Budha. Angka 1, 2, 3, 4 hanya sebagai label saja. Angka atau nomor yang ditetapkan dalam skala nominal hanya berfungsi sebagai identitas anggota suatu kategori. Angka atau nomor yang terdapat pada baju para pemain bola adalah contoh skala nominal. Jadi tidak dapat dikatakan bahwa pemain dengan nomor baju 4 adalah pemain yang selalu lebih baik daripada pemain dengan baju nomor 8. Angka atau nomor baju pemain bola hanya sebagai lambang atau simbol kategori saja. Meskipun ada pemberian nomor atau angka, namun dalam skala nominal tidak dapat menggunakan operasioperasi perhitungan penambahan, pengurangan, pembagian, atau perkalian. Menurut Djaali (2008) tes yang menggunakan skala nominal sebenarnya bukan kegiatan pengukuran, melainkan lebih pada pengkategorisasian, pemberian nama, dan menghitung fakta-fakta atau obyek yang sedang diukur. 2. Skala Ordinal Ordinal scales rank people or objects according to the amount of characteristic they display or possess (Reynolds, at.all, 2009)



20 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Skala ordinal adalah skala yang di samping membedakan antara satu kategori dengan kategori lainnya, juga mempunyai ranking atau tingkatan kategorinya. Data dapat disusun dari yang terendah ke yang tertinggi, atau sebaliknya. Sebagai contoh skala ordinal adalah ranking prestasi yang dicapai siswa di sekolah berdasarkan hasil tesnya. Skor siswa dapat diurut mulai dari ranking pertama, kedua, ketiga, dan seterusnya. Contoh lainnya adalah variabel ”kecantikan” yang dapat diurut menjadi kategori sangat cantik diberi nilai 3, cantik diberi nilai 2, dan kurang cantik diberi nilai 1, atau sebaliknya. Data yang diperoleh dengan pengukuran skala ordinal disebut data ordinal, yaitu data yang berjenjang di mana jarak antara satu data dengan data lainnya tidak sama. Skala ordinal dapat menggunakan operasi logika yaitu > (lebih besar), atau < (lebih kecil), namun tidak dapat diketahui tingkat perbedaan atau jarak intervalnya. Karena itu prosedur statistika tidak dapat digunakan pada skala ini. Operasi tambah, kurang, kali dan bagi juga tidak dapat digunakan pada skala ordinal. 3. Skala Interval Interval scales rank people or objects like an ordinal scales, but on a scale with equal units (Reynolds, at.all 2009) Skala interval memiliki ciri yang sama dengan skala ordinal. Bedanya pada skala interval mempunyai jarak 21 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



yang sama antara satu data dengan data yang lain. Pada skala interval hubungan urutan dan jarak antara angkaangka itu mempunyai arti. Misalnya, pada variabel ”temperatur” yang memiliki perbedaan antara 50 dan 51 derajat Celcius sama dengan perbedaan antara 30 dan 31 derajat Celcius. Tetapi tidak dapat menyatakan bahwa 50 derajat Celcius itu sama dengan dua kali lebih panas dari 25 derajat Celcius, karena pada skala interval tidak ada titik nol mutlak. Contoh lain dari skala interval adalah mengurutkan kualitas kinerja guru: sangat tinggi (5), tinggi (4), cukup tinggi (3), rendah (2), rendah sekali (1). Operasi hitung seperti tambah, kurang. kali dan bagi dapat digunakan pada skala interval. Hal lain juga yang diingat adalah bahwa pada skala interval tidak dikenal adanya nilai 0 (nol) mutlak, jadi, jika misalnya seorang siswa hasil tesnya mendapat skor nol, bukan berarti siswa tersebut tidak memiliki pengetahuan sama sekali. 4. Skala Rasio Ratio scales have the properties of interval scales plus a true zero point (Reynolds, at.all, 2009) Skala rasio adalah skala pengukuran yang mempunyai nilai nol mutlak dan mempunyai jarak yang sama. Menurut Sofian Effendi (1989) skala rasio adalah suatu bentuk interval yang jaraknya (interval) tidak dinyatakan sebagai perbedaan nilai antar responden, tetapi antara seorang responden dengan nilai nol absolut. 22 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Contoh data skala rasio adalah gaji pegawai atau karyawan. Gaji nol rupiah berarti pegawai atau karyawan tersebut tidak menerima uang sedikitpun. Karena adanya nol mutlak maka semua operasi matematik dapat diterapkan pada skala rasio ini. Tabel 2.1. Skala pengukuran Skala Nominal Ordinal Interval Rasio



Ciri-ciri Mempunyai nilai pembeda saja Mempunyai nilai pembeda dan peringkat Mempunyai nilai pembeda, peringkat dan mempunyai jarak yang sama Mempunyai nilai pembeda, peringkat, jarak yang sama, dan mempunyai titik nol mutlak



C. Pengertian Penilaian Agar lebih jelas dan lebih memperluas wawasan tentang pengertian penilaian, kita dapat melihat beberapa pengertian penilaian atau asesmen yang dikemukakan para ahli berikut ini: 1. Assessment is any of a variety of procedures used to obtain information about student performance. Penilaian adalah salah satu prosedur yang digunakan untuk memperoleh informasi mengenai kinerja siswa (Miller, Linn & Gronlund, 2009)



23 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



2. Assessment is any systematic prosedure for collecting information that can be used to make inferences about the characteristics of people or objects. Penilaian adalah salah satu prosedur sistematik untuk mengumpulkan informasi yang dapat digunakan untuk membuat kesimpulan mengenai karakteristik orang atau objek (Reynolds, at all, 2009) 3. Assessment is “the’ collection, synthesis, and interpretation of information to aid the teacher in decision making. Penilaian merupakan 'pengumpulan, sintesis, dan menafsirkan informasi untuk membantu pengajar dalam pengambilan keputusan (Airasian, 1997) 4. Assessment is the act of collecting information about individuals or groups of individuals in order to better understand them. Penilaian adalah tindakan mengumpulkan informasi tentang individu atau kelompok untuk lebih memahami mereka (Buttler and McMunn, 2006) 5. Penilaian adalah proses untuk menentukan nilai dari suatu obyek atau peristiwa dalam suatu konteks situasi tertentu, dimana proses penentuan nilai berlangsung dalam bentuk interpretasi yang kemudian diakhiri dengan suatu "Judgment" (Sudjana ,2004)



24 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



6. Penilaian mencakup semua cara yang digunakan untuk menilai kerja individu, yaitu prestasi belajar yang dicapai peserta didik. Proses penilaian melalui bukti-bukti tentang pencapaian belajar peserta didik (Mardapi, 2008) Menurut Griffin & Nix (1991) penilaian merupakan suatu pernyataan berdasarkan sejumlah fakta untuk menjelaskan karakteristik seseorang atau sesuatu. Senada dengan Griffin & Nix, Salvia dan Ysseldike (1994) mengemukakan bahwa penilaian atau asesmen adalah suatu proses mengumpulkan data dengan tujuan agar dapat dilakukan keputusan mengenai suatu objek. Oleh karena itu, kegiatan penilaian tidak terbatas hanya pada karakteristik siswa saja, tetapi juga mencakup karakteristik metode mengajar, kurikulum, fasilitas, dan administrasi sekolah. Penilaian juga diartikan sebagai kegiatan menafsirkan data hasil pengukuran atau kegiatan untuk memperoleh informasi tentang pencapaian kemajuan belajar siswa. Jadi, penilaian (assessment) adalah penerapan berbagai cara dan penggunaan beragam alat penilaian untuk memperoleh informasi tentang sejauh mana hasil belajar siswa atau ketercapaian kompetensi siswa. Penilaian menjawab pertanyaan tentang sebaik apa hasil atau prestasi belajar seorang siswa. Pengukuran dan penilaian mempunyai hubungan yang erat dan bertingkat. Kita tidak dapat melaksanakan penilaian sebelum melakukan pengukuran terlebih dahulu terhadap sesuatu. Sebaliknya, pengukuran tidak akan 25 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



berguna apabila kita tidak mengadakan penilaian terhadap sesuatu yang telah kita ukur itu. Penilaian merupakan langkah lanjutan setelah dilakukan pengukuran. Informasi yang diperoleh dari pengukuran selanjutnya dideskripsikan dan ditafsirkan. Karenanya, jika seorang guru ingin melakukan penilaian, maka haruslah terlebih dahulu melakukan pengukuran. Mardapi (1999) menyatakan bahwa penilaian adalah kegiatan menafsirkan atau mendeskripsikan hasil pengukuran Penilaian merupakan proses kegiatan untuk mengambil keputusan berdasarkan informasi yang diperoleh dari pengukuran hasil belajar baik melalui instrumen tes maupun non tes. Penilaian dilakukan setelah siswa menjawab soa-soal yang terdapat pada tes. Hasil jawaban siswa tersebut ditafsirkan dalam bentuk nilai. Jadi penilaian adalah suatu proses pengumpulan dan pengelohan data dari hasil pengukuran menjadi bentuk yang dapat dijelaskan.



D. Penilaian Tradisional dan Penilaian Alternatif Gabel (1993) mengelompokkan asesmen (penilaian) ke dalam dua kelompok, yaitu penilaian tradisional (traditional assessment) dan penilaian alternatif (alternative assessment). Dalam beberapa literatur, asesmen alternatif ini kadang-kadang disebut sebagai asesmen autentik (authentic assessment), asesmen



26 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



portofolio (portfolio assessment) atau asesmen kinerja (performance assessment). (Herman, 1997; Popham, 1995). Penilaian yang tergolong tradisional adalah penilaian yang menggunakan tes Benar-Salah, tes Pilihan Ganda, tes melengkapi, dan tes jawaban terbatas. Sedangkan penilaian alternatif atau autentik menurut Mueller (2008) adalah suatu bentuk tugas yang menghendaki pembelajar untuk menunjukkan kinerja di dunia nyata secara bermakna yang merupakan penerapan esensi pengetahuan dan keterampilan. Penilaian autentik memuat instrumen yang mengharuskan siswa untuk mempertunjukkan kinerja, bukan menjawab atau memilih jawaban dari sederetan kemungkinan jawaban yang sudah tersedia.



E. Pengertian Evaluasi Agar lebih jelas dan lebih memperluas wawasan tentang pengertian penilaian, kita dapat melihat beberapa pengertian penilaian atau asesmen yang dikemukakan para ahli berikut ini: Menurut pengertian bahasa, kata evaluasi berasal dari bahasa Inggris evaluation yang berarti penilaian atau penaksiran (Echols dan Shadily,1989). Beberapa pengertian atau batasan evaluasi yang dikemukakan para ahli adalah adalah sebagai berikut. 1. Evaluation refer to the act or process to determining the value of samething. Artinya, evaluasi adalah suatu tindakan



27 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



atau suatu proses untuk menentukan nilai dari sesuatu (Wind and Brown, 1975). 2. Evaluation is the process of delineating, obtaining, and providing useful, information for judging decision alternatives. Maksudnya, evaluasi merupakan proses menggambarkan, memperoleh dan menyajikan informasi yang berguna untuk menilai alternatif keputusan (Stufflebeam et.al, 1974). 3. Evaluation be defined as the systematic process of collecting, analizing, and interpreting information to determine the extent to which pupils are achieving instructional objectives” artinya, evaluasi merupakan proses pengumpulan informasi, analisis dan interpretasi informasi yang sistematis untuk menentukan sejauhmana siswa mencapai tujuan pembelajaran (Grounlund dan Linn, 1995). 4. Evaluation a systematic process of determining the extent to which instructional objective are achieved by pupils”, artinya, evaluasi adalah sebuah proses sistematis yang menentukan sejauhmana tujuan pembelajaran dicapai oleh siswa (Anastasi 1997) Dari pandangan-pandangan di atas, kita dapat melihat bahwa esensi dari evaluasi adalah suatu proses sistematis untuk mengumpulkan informasi, mengadakan pertimbangan-pertimbangan mengenai informasi, serta mengambil keputusan berdasarkan pertimbangan yang telah dilakukan. Menurut Kumano (2001) evaluasi adalah 28 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



penilaian terhadap data yang dikumpulkan melalui kegiatan asesmen. Dalam konteks pembelajaran di kelas, evaluasi dilakukan untuk mengetahui kemajuan dan hasil belajar peserta didik, mendiagnosis kesulitan belajar, memberikan umpan balik/perbaikan proses belajar mengajar, dan penentuan kenaikan kelas. Melalui evaluasi dapat diperoleh informasi yang akurat tentang penyelenggaraan pembelajaran dan keberhasilan belajar peserta didik, guru, serta proses pembelajaran itu sendiri. Dengan demikian maka informasi yang diperoleh pada evaluasi harus relevan, akurat, dan secara komprehensif mencerminkan hasil belajar peserta didik. Evaluasi merupakan suatu proses yang mempunyai peranan sangat penting dalam dunia pendidikan karena hasil evaluasi merupakan informasi yang dapat digunakan sebagai landasan pengambilan bermacam-macam keputusan. Evaluasi menentukan tingkat perbedaan antara ”apa yang dihasilkan” dengan ”apa yang diharapkan” dari suatu program pendidikan. Kegiatan evaluasi selalu didahului dengan kegiatan pengukuran, yaitu proses penetapan angka menurut aturan tertentu, kemudian dilanjutkan penilaian dan diakhiri evaluasi. Penilaian diartikan sebagai suatu kegiatan menafsirkan data hasil pengukuran. Dengan demikian evaluasi merupakan suatu kegiatan yang kompleks dan terus menerus untuk mengetahi manfaat suatu kegiatan untuk selanjutnya digunakan sebagai pertimbangan dalam menentukan suatu keputusan. Griffin & Nix (1991) menyatakan pengukuran, asesmen, dan evaluasi adalah 29 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



hirarki. Maksudnya kegiatan dilakukan secara berurutan, dimulai dengan pengukuran, kemudian penilaian, dan terakhir evaluasi.



F. Jenis Evaluasi Terdapat tiga jenis evaluai prestasi siswa dalam kaitan dengan pembelaajaran ruang kelas. Ketiga jenis evaluasi tersebut yaitu evaluasi diagnostik, evaluasi formatif dan evaluasi sumatif. Evaluasi diagnostik mengacu pada evaluasi yang dilakukan sebelum pembelajaran. Tujuan utama evaluasi diagnostik adalah untuk mengidentifikasi kekuatan dan kelemahan siswa, atau untuk mengetahui kesulitan belajar yang dihadapi siswa, termasuk kesalahan pemahaman konsep. Evaluasi diagnostik dilaksanakan kalau sebagian besar siswa gagal dalam mengikuti proses pembelajaran pada mata pelajaran tertentu. Dari hasil evaluasi diagnostik akan diketahui konsep-konsep apa saja yang belum dipahami dan yang telah dipahami siswa. Dari bukti nilai yang diperoleh melalui tes, guru dapat memperbaiki kelemahan pengajarannya yang memastikan siswa menguasai sesuatu pengetahuan dan ketrampilan sebelum pengetahuan dan ketrampilan yang lebih tinggi dilanjutkan. Biasanya soal-soal untuk evaluasi diagnostik berisi materi yang dirasa sulit oleh siswa. Evaluasi formatif bertujuan untuk memperoleh informasi atau masukan mengenai tingkat keberhasilan pelaksanaan pembelajaran. Informasi ini berguna bagi guru



30 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



untuk memperbaiki strategi mengajarnya. Evaluasi formatif dilakukan secara periodik sepanjang semester. Evaluasi formatif bukan untuk menentukan keberhasilan belajar siswa, tetapi untuk mengetahui keberhasilan proses pembelajaran. Evaluasi formatif dapat dilakukan dengan kuiz-kuiz. Materi soal dipilih berdasarkan tujuan pembelajaran tiap pokok materi atau sub pokok materi. Evaluasi sumatif diberikan pada akhir suatu pelajaran, atau akhir semester. Hasilnya untuk menentukan keberhasilan belajar siswa. Tingkat keberhasilan ini dinyatakan dengan skor atau nilai, pemberian sertifikat, dan sejenisnya. Tingkat kesukaran soal pada evaluasi sumatif bervariasi, sedang materinya harus mewakili bahan yang telah diajarkan (Mardapi, 2004).



G. Prinsip-Prinsip Evaluasi Pelaksanaan evaluasi agar akurat dan bermanfaat baik bagi siswa, pendidik ataupun pihak yang berkepentingan, maka harus memperhatikan prinsip-prisip sebagai berikut: a. Valid. Evaluasi harus mengukur apa yang seharusnya diukur dengan menggunakan jenis tes yang terpercaya dan sahih. Artinya harus ada kesesuaian antara alat ukur dengan fungsi pengukuran dan sasaran pengukuran.



31 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



b. Berkelanjutan/Berkesinambungan (kontinuitas). Evaluasi harus dilakukan secara terus menerus dari waktu ke waktu untuk mengetahui secara menyeluruh perkembangan siswa, sehingga kegiatan dan untuk kerja siswa dapat dipantau melalui evaluasi. c. Menyeluruh (Komprehensif). Evaluasi harus dilakukan secara menyeluruh, yakni meliputi berbagai aspek kompetensi yang akan dievaluasi. Evaluasi yang menyeluruh meliputi ranah pengetahuan (kognitif), keterampilan (psikomotor), sikap dan nilai (afektif) yang direfleksikan dalam kebiasaan berfikir dan bertindak. d. Bermakna. Evaluasi diharapkan mempunyai makna yang signifikan bagi semua pihak. Oleh karena itu, maka evaluasi hendaknya mudah difahami dan dapat ditindaklanjuti oleh pihak-pihak yang berkepentingan. e. Adil dan objektif. Evaluasi harus mempertimbangkan rasa keadilan bagi siswa dan objektif berdasarkan kenyataan yang sebenarnya, tidak boleh dipengaruhi oleh hal-hal yang bersifat emosional dan irasional.



32 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



f. Terbuka. Evaluasi hendaknya dilakukan secara terbuka bagi berbagai kalangan sehingga keputusan tentang keberhasilan siswa jelas bagi pihak-pihak yang berkepentingan, tanpa ada rekayasa atau sembunyisembunyi yang dapat merugikan semua pihak. g. Ikhlas. Evaluasi harus dilakukan dengan niat dan yang bersih, dalam rangka efisiensi tercapainya tujuan pendidikan dan bai kepentingan siswa. h. Praktis. Evaluasi dilakukan dengan mudah dimengerti dan dilaksanakan dengan beberapa indikator, yaitu: a) hemat waktu, biaya dan tenaga; b) mudah diadministrasikan; c) mudah menskor dan mengolahnya; dan d) mudah ditafsirkan. i. Sistematis. Evaluasi dilakukan secara berencana dan bertahap untuk memperoleh gambaran tentang perkembangan belajar peserta didik sebagai hasil kegiatan belajarnya. j. Mendidik. Evaluasi harus mampu memberikan sumbangan positif terhadap peningkatan pencapaian belajar siswa. Hasil penilaian harus dapat memberikan



33 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



umpan balik dan memotivasi peserta didik untuk lebih giat belajar.



H. Fungsi Pengukuran dan Evaluasi Menurut Assad dan Hailaya (2005) ada lima fungsi pengukuran dan evaluasi hasil belajar yaitu: a. Mengukur pencapaian siswa. Melalui melakukan pengukuran, hasil belajar siswa dalam kelas dapat ditentukan. Selain itu, gambaran apakah siswa telah tercapai tujuan atau tidak dapat dinilai melalui pengukuran. b. Memotivasi siswa untuk belajar. Pengukuran dapat membuat siswa untuk lebih giat belajar. Minat siswa untuk mempelajari materi atau pelajaran tertentu bangkit. Sebagai contoh, seorang siswa yang mendapat skor tinggi dalam suatu tes hasil belajar akan termotivasi untuk mempertahankan skor itu, bahkan ia berharap untuk mendapatkan skor yang lebih tinggi dalam tes berikutnya, dan berharap dapat menjadi juara kelas. Sebaliknya, jika perolehan skor hasil belajarnya rendah, dia terhalang untuk berusaha dan memperbaiki skornya pada ujian berikutnya. c. Meramalkan keberhasilan siswa. Keberhasilan dan kegagalan siswa dalam kelas dan kelas-kelas lebih tinggi berikutnya dapat diprediksi melalui pengukuran. Guru dapat membedakan apakah sesorang siswa tertentu mempunyai kesempatan 34 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



untuk lulus dan dapat dinaikkan ke kelas berikutnya. Misalnya, seorang siswa yang selalu mendapat skor tinggi dalam banyak pelajaran dapat diprediksi akan naik kelas atau lulus. Sebaliknya, seorang siswa yang setiap waktu memperoleh skor hasil belajarnya rendah dapat prediksi akan gagal dan tinggal kelas. d. Mendiagnosis kesulitan siswa. Melalui pengukuran, kelemahan siswa dalam kelas dapat diidentifikasi dan diremidiasi.Hasil-hasil pengukuran juga dapat digunakan untuk memperbaiki pembelajaran dan kinerja siswa dalam kelas. e. Mengevaluasi pengajaran. Pengukuran dapat menilai pembelajaran. Melalui pengukuran yang merupakan bagian tak terpisahkan dari proses, umpan balik tentang pembelajaran, yang menjadi dasar penting untuk perbaikan dan peningkatan dalam kelas terungkap. Sebagai contoh, Perolehan skor-skor yang tinggi dari kebanyakan siswa dalam tes hasil belajar (pencapaian) secara tidak langsung menunjukkan efektifnya pembelajaran di kelas. Berdasarkan hasil ini, seorang guru dapat lebih jauh memikirkan peningkatan aktivitas dalam pelajaran untuk memperkuat pembelajaran siswa. Sebaliknya, bila tes hasil belajar kebanyakan siswa rendah, menunjukkan tidak efektifnya pembelajaran. Dengan informasi ini, guru dapat memikirkan perbaikan medode pengajaran dalam kelas atau melakukan remedial pengajaran.



35 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



36 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 3 BELAJAR DAN HASIL BELAJAR



A. Belajar, Prestasi dan Hasil Belajar Bodger dan Seaborne (2001) menyatakan bahwa belajar itu adalah …….. “ anymore or less permanent change of behavior or which is their result of experience”. artinya segala sesuatu atau perubahan tetap tingkah laku atau hasil dari pada pengalaman. Menurut Hamalik (1983) “Belajar adalah suatu bentuk pertumbuhan atau perubahan dalam diri seseorang yang dinyatakan dalam cara-cara bertingkah laku baru berkat pengalaman dan latihan”. Muhammad (1999) mengatakan bahwa belajar adalah pekerjaan yang 37 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



harus dikerjakan sendiri, diusahakan sendiri dan tidak dapat menugaskan orang lain untuk mengerjakannya. Belajar dapat didefinisikan sebagai upaya yang dilakukan untuk menambah pengetahuan yang telah dimiliki (Maskul, 1998). Jadi Belajar adalah suatu proses usaha yang dilakukan seseorang untuk memperoleh suatu perubahan tingkah laku yang baru secara keseluruhan sebagai hasil pengalamannya sendiri dalam interaksi dengan lingkungannya. Proses belajar dapat melibatkan aspek kognitif, afektif dan psikomotorik. Pada belajar kognitif, prosesnya mengakibatkan perubahan dalam aspek kemampuan berpikir, pada belajar afektif mengakibatkan perubahan dalam aspek kemampuaan merasakan, sedang belajar psikomotorik memberikan hasil belajar berupa keterampilan. Kata prestasi berasal dari Bahasa Belanda prestatie, kemudian di dalam bahasa Indonesia disebut prestasi, diartikan sebagai hasil usaha. Prestasi banyak digunakan di dalam berbagai bidang dan diberi pengertian sebagai kemampuan, keterampilan, sikap seseorang dalam menyelesaikan sesuatu (Arifin, 2009). Menurut Djamarah (1994) “prestasi adalah hasil dari suatu kegiatan yang telah dikerjakan, atau diciptakan secara individu maupun secara kelompok. Prestasi belajar menurut Kamus Besar Bahasa Indonesia (2005) berarti: a) penguasaan pengetahuan atau keterampilan yang dikembangkan oleh mata pelajaran, lazimnya ditunjukkan dengan nilai tes atau angka nilai yang diberikan guru, b) kemampuan yang sungguh38 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



sungguh ada atau dapat diamati (actual ability) dan yang dapat diukur langsung dengan tes tertentu. Menurut Azwar (2010) “prestasi belajar adalah performa maksimal seseorang dalam menguasai bahan-bahan atau materi yang telah diajarkan atau telah dipelajari”.



Dari pendapat di atas dapat disimpulkan bahwa prestasi belajar adalah hasil usaha siswa yang dapat dicapai berupa penguasan pengetahuan, kemampuan kebiasaan dan keterampilan serta sikap setelah mengikuti proses pembelajaran yang dapat dibuktikan dengan hasil tes. Jadi, prestasi itu baru ada setelah melakukan kegiatan. Hasil belajar atau prestasi belajar adalah suatu hasil yang telah dicapai oleh siswa setelah melakukan kegiatan belajar.



Sudjana (2003) menyatakan bahwa hasil belajar siswa pada hakikatnya adalah perubahan tingkah laku dan sebagai umpan balik dalam upaya memperbaiki proses belajar mengajar. Belajar adalah suatu proses perubahan tingkah laku sebagai hasil interaksi individu dengan lingkungannya dalam memenuhi kebutuhan hidupnya . Menurut Habeyb (1983) hasil belajar ialah apa yang telah didapat, diciptakan atau hasil yang menyenangkan hati yang diperoleh dengan jalan keuletan belajar. Nawawi (2001) mengemukakan bahwa hasil belajar ialah tingkat keberhasilan anak didik dalam mempelajari pelajaran di sekolah yang dinyatakan dengan nilai yang diperoleh dari hasil tes mengenai sejumlah materi tertentu. Selanjutnya, Purwanto (1992) menyatakan bahwa hasil belajar ialah hasil pencapaian belajar oleh anak didik pada jangka waktu tertentu. Dengan demikian dapat disimpulkan bahwa hasil belajar adalah tingkat penguasaan siswa terhadap materi 39 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



pelajaran sebagai akibat dari perubahan perilaku setelah mengikuti proses belajar mengajar berdasarkan tujuan pengajaran yang ingin dicapai. Hasil belajar sering digunakan sebagai ukuran untuk mengetahui seberapa jauh seseorang menguasa bahan yang sudah diajarkan. Untuk mengetahui hasil belajar tersebut diperlukan serangkaian pengukuran yang menggunakan alat-alat ukur yang memenuhi syarat.



B. Pengukuran dan Evaluasi Hasil Belajar Tujuan pembelajaran pada hakikatnya adalah perubahan tingkah laku yang diinginkan pada diri peserta didik atau siswa yang tercermin pada ‘hasil belajar’ siswa setelah mendapatkan serangkaian pengalaman belajar (proses pengajaran). Tingkah laku sebagai hasil belajar bisa meliputi kawasan kognitif, afektif, dan psikomotor Untuk mengetahui hasil belajar siswa dilakukan evaluasi. Tujuannya yaitu untuk memperoleh informasi tentang sejauh mana hasil belajar siswa atau ketercapaian kompetensi (rangkaian kemampuan) siswa. Penilaian hasil belajar merupakan aktivitas yang sangat penting dalam proses pendidikan. Semua proses di lembaga pendidikan formal pada akhirnya akan bermuara pada hasil belajar yang diwujudkan secara kuantitatif berupa nilai. Penilaian menjawab pertanyaan tentang sebaik apa hasil atau prestasi belajar seorang peserta didik. Jadi penilaian dilakukan untuk mengetahui sejauh mana perubahan yang terjadi melalui kegiatan belajar mengajar.



40 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Hasil belajar merupakan tingkat kemampuan yang dimiliki seseorang dalam mencerna informasi yang diperoleh dalam proses belajar mengajar. Hasil belajar dapat dilihat melalui kegiatan pengukuran yang bertujuan untuk mendapatkan data yang menunjukkan tingkat kemampuan siswa dalam mencapai tujuan pembelajaran. Menurut Widoyoko (2009:1), hasil belajar terkait dengan pengukuran, kemudian akan terjadi suatu penilaian dan menuju evaluasi, baik menggunakan tes maupun non-tes. Hasil belajar tidak lain adalah pengukuran hasil yang sudah dicapai oleh setiap siswa dalam ranah kognitif, afektif dan psikomotor yang diperoleh sebagai akibat usaha kegiatan belajar dan dinilai dalam periode tertentu. Hasil belajar seorang siswa sering disajikan dalam bentuk simbol berupa angka, huruf maupun kalimat yang menceritakan hasil yang sudah dicapai oleh setiap siswa pada suatu periode tertentu. Hasil belajar yang merupakan hasil pengukuran terhadap siswa meliputi aspek kognitif (pengetahuan), afektif (sikap) dan psikomotor (keterampilan) dapat diketahui setelah diadakan evaluasi yang disebut tes hasil belajar (achievement test). Sudjana (2005) mengemukakan bahwa “di antara ketiga ranah tersebut, ranah kognitiflah yang paling banyak dinilai oleh para guru di sekolah karena berkaitan dengan kemampuan para siswa dalam menguasai isi bahan pengajaran”



41 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



C. Instrumen dalam Evaluasi Ditinjau dari instrumen atau alat ukur yang digunakan untuk melakukan pengukuran, secara umum dibedakan menjadi dua, yaitu berbentuk tes dan non-tes (Payne dalam Nasoetion, 2006). Alat pengukuran yang berbentuk tes bisa dibedakan menjadi tiga macam, yaitu tes lisan, test tertulis, dan tes perbuatan. Tes lisan bisa diselenggarakan secara individual atau kelompok. Tes tertulis bisa berbentuk esai (uraian) atau obyektif. Sedangkan tes perbuatan bisa dilaksanakan secara individual atau juga kelompok. Alat pengukuran (penilaian) yang non-tes, yang biasanya menyertai dalam pelaksanaan proses belajar mengajar sangat banyak macamnya. Di antaranya bisa disebutkan adalah observasi (baik dengan cara langsung, tak langsung, maupun partisipasi), wawancara (terstruktur atau bebas), angket (tertutup atau terbuka), sosiometri, checklist, concept map, portfolio, student journal, pertanyaanpertanyaan, dan sebagainya. Dilihat dari wilayah atribut



yang diungkap, secara umum alat ukur dapat dikategorikan menjadi dua wilayah yaitu wilayah kognitif dan wilayah non kognitif (Suryabrata, 2000)



42 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



UNIT II TAKSONOMI BLOOM DAN RANAH HASIL BELAJAR Kata taksonomi berasal dari dua kata dalam bahasa Yunani yaitu tassein yang berarti mengklasifikasi dan nomos yang berarti aturan. Jadi Taksonomi berarti hierarkhi klasifikasi atas prinsip dasar atau aturan. Istilah ini kemudian digunakan oleh Benjamin Samuel Bloom, seorang psikolog bidang pendidikan yang melakukan penelitian dan pengembangan mengenai kemampuan berpikir dalam proses pembelajaran. Bloom, lahir pada tanggal 21 Februari 1913 di Lansford, Pennsylvania dan



43 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



berhasil meraih doktor di bidang pendidikan dari The University of Chicago pada tahun 1942. Taksonomi tujuan pendidikan ini, atau yang terkenal dengan nama taksonomi Bloom terdapat dalam buku yang berjudul Taxonomy of Educational Objectives: The Classification of Educational Goals. Handbook I: Cognitive Domain yang terbit pada tahun 1956. Taksonomi Bloom adalah struktur hierarkhi yang mengidentifikasikan skills mulai dari tingkat yang rendah hingga yang tinggi. Bloom meninggal pada 13 September 1999. Dalam kerangka konsep, tujuan pendidikan ini oleh Bloom dibagi menjadi tiga domain/ranah kemampuan intelektual (intellectual behaviors) yaitu kognitif, afektif dan psikomotorik.



44 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 4 RANAH KOGNITIF A. Taksonomi Bloom Original Taksonomi tujuan pendidikan (the taxonomy of educational objective) Benjamin Bloom (Bloom, 1956) mengelompokkan tujuan dan standar-standar penddikan. Bloom, dan rekan-rekannya berhasil mengembangkan dan mengenalkan kerangka konsep kemampuan berpikir yang dinamakan Taxonomy Bloom, meliputi tiga ranah (domain), yaitu kognitif (cognitive), psikomotor (psychomotor), dan sikap (affective). Taksonomi Bloom BUKAN suatu ukuran dari level kesulitan sebuah soal, ia merupakan kerangka untuk mengklasifikasi pernyataan-pernyataan yang 45 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



digunakan untuk mempredikasi kemampuan siswa dalam belajar sebagai hasil dari kegiatan pembelajaran. Benjamin S. Bloom dan rekan-rekannya menyadari bahwa ada perbedaan tingkatan dalam perilaku berpikir (thinking behavior) yang berguna untuk keperluan pembelajaran di sekolah. Structure of the Original Taxonomy 1. Knowledge (a) Knowledge of spesifics Knowledge of terminology Knowledge of spesific fact (b) Knowledge of ways and means of dealing with spesifics Knowledge of conventions Knowledge of trends and sequences Knowledge of classifications and categories Knowledge of criteria Knowledge of methodology (c) Knowledge of universals and abstraction in a field Knowledge of principles and generalizations Knowledge of theories and structures 2. Comprehension (a) Translation (b) Interpretation (c) Extrapolation 3. Application 4. Analysis (a) Analysis of elements (b) Analysis of relationship



46 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(c) Analysis of organizational principles 5. Synthesis (a) Production of a unique communication (b) Production of a plan, or proposed set of operations (c) Derivation of a set of abstract relation 6. Evaluation (a) Evaluation in terms of internal evidence (b) Judgments in terms of external criteria



Menurut taksonomi Bloom, ranah kognitif mengurutkan keahlian berpikir sesuai dengan tujuan yang diharapkan. Proses berpikir menggambarkan tahap berpikir yang harus dikuasai oleh siswa agar mampu mengaplikasikan teori ke dalam perbuatan. Ranah kognitif ini terdiri atas enam level, yaitu: (1) knowledge (pengetahuan), (2) comprehension (pemahaman atau persepsi), (3) application (penerapan), (4) analysis (penguraian atau penjabaran), (5) synthesis (pemaduan), dan (6) evaluation (penilaian). Taksonomi ini dikenal sebagai taksonomi Bloom (original taxonomy), dan menjadi model taksonomi tujuan pembelajaran yang digunakan sebagai acuan dalam sistem pendidikan di Indonesia. Level taksonomi Bloom original diperlihatkan dalam gambar 4.1 .



47 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Gambar 4.1 . Level Kognitif Bloom original a. Pengetahuan ( knowledge) Knowledge: remembering or recalling appropriate, previously learned information to draw out factual (usually right or wrong) answers. Pengetahuan merupakan tingkat kemampuan yang hanya meminta peserta didik atau siswa untuk mengenal atau mengetahui adanya konsep, fakta, atau istilah-istilah tanpa harus mengerti atau dapat menilai atau menggunakannya. Dalam hal ini biasanya siswa menjawab saja soal secara hafalan tanpa banyak berfikir. Di antara kata kerja soal tes yang sesuai untuk tujuan tingkat pengetahuan adalah:  Menyebutkan  Menyusun daftar  Mendefinisikan 48 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



 Mengenali  Mendefinisikan  Mendapatkan  Membedakan Soal tes untuk tingkat (level) pengetahuan meminta siswa untuk mengingat kembali apa yang sudah dipelajarainya, Pertanyaan untuk pngetahuan (a) Berikan definisi .........? (b) Siapa yang mencipta....? (c) Kutub magnet biasanya dinamakan........... b. Pemahaman (comprehension) Comprehension: grasping or understanding the meaning of informational materials Pemahaman (C2) merupakan tingkat kemampuan yang mengharapkan peserta didik atau siswa mampu memahami arti atau konsep, situasi, serta fakta yang diketahuinya. Dalam hal ini siswa tidak hanya hafal secara verbal akan tetapi juga memahami konsep dari masalah atau fakta yang ditanyakan dan dapat melihatnya dari beberapa segi.



Soal tes pada tingkat pemahaman menghendaki siswa untuk menyatakan masalah dengan kata-katanya sendiri, memberi contoh suatu prinsip atau konsep. Di antara kata kerja yang sesuai dengan untuk soal untuk mengukur pemahaman adalah:



49 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



      



Menjelaskan Merumuskan Merangkum Memberi contoh Memperkirakan Menerangkan Membedakan



Pertanyan untuk pemahaman (a) Terangkan....... (b) Uraikan dengan perkataan anda.......... (c) Jika turun hujan maka........................... c. Penerapan (application) Application: applying previously learned information (or knowledge) to new and unfamiliar situations. Penerapan (C3) merupakan tingkat kemampuan yang menuntut atau meminta siswa menggunakan atau menerapkan informasi yang telah diperoleh pada situasi baru. Soal tes pada tingkat penerapan menghendaki siswa menggunakan informasi yang yang telah dipelajarinya untuk menyelesaikan masalah. Di antara kata kerja yang sesuai untuk soal menguji penerapan adalah:  Menerapkan  Menghubungkan  Menghitung  Menyelesaikan  Mengembangkan 50 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



 



Menggunakan Menghasilkan



Pertanyaan untuk penerapan (a) .Jika A dan B diketahui, bagaimana mencari C ? (b) Cari angka yang ke tujuh dalam urutan: 12, 7, 2,.................. d. Analisis (analysis) Analysis: breaking down information into parts, or examining (and trying to understand the organizational structure of) information. Analisis (C4) merupakan tingkat kemampuan yang meminta siswa untuk menganalisis atau menguraikan suatu integritas atau situasi tertentu ke dalam komponenkomponen atau unsur-unsur pembentuknya. Diharapkan siswa dapat memahami dan sekaligus mampu memilahmilahnya menjadi bagian-bagian, termasuk juga menguraikan bagaimana proses terjadinya sesuatu, cara bekerjanya sesuatu, atau mungkin juga sistematikanya. Pada tingkat analisis: siswa diminta untuk menguraikan informasi ke dalam beberapa bagian, menemukan asumsi, membedakan fakta dan pendapat, dan menemukan hubungan sebab dan akibat. Di antara kata kerja soal tes untuk mengukur tingkat analisis adalah:  Membedalan  Menemukan



51 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



    



Membandingkan Membagi Menganalisis Memperinci Mengkategorikan



Pertanyaan untuk analisis (a) Apakah bukti yang menunjukkan bahwa es itu lebih ringan daripada air? (b) Yang mana fakta dan yang mana opini? e. Sintesis (synthesis) Synthesis: applying prior knowledge and skills to combine elements into a pattern not clearly there before. Sintesis (C5) merupakan tingkat kemampuan yang meminta siswa untuk mengintegrasikan bagian-bagian yang terpisah menjadi suatu keseluruhan yang terpadu, atau menggabungkan bagian-bagian (unsur-unsur) sehingga terjelma pola yang berkaitan secara logis, atau mengambil kesimpulan dari peristiwa-peristiwa yang ada hubungannya satu dengan lainnya.



Pada tingkat sintesis: siswa dituntut menghasilkan suatu cerita, komposisi, hipotesis, atau teorinya sendiri, dan mengsintesiskan pengetahuan. Soal sintesis soal yang menuntut pembuatan cerita, menghasilkan karangan, hipotesis dengan memadukan berbagai pengetahuan atau ilmu.



52 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Di antara kata kerja soal tes untuk mengukur tingkat sintesis adalah:  Menceriterakan  Menyusun  Menyatukan  Memodifikasikan  Menghasilkan  Mengorganisir  Membandingkan Pertannyaan untuk sintesis (a) Rencanakan................. (b) Gubahlah sebuah puisi tentang................ f. Evaluasi (evaluation) Evaluation: judging or deciding according to some set of criteria, without real right or wrong answers. Evaluasi (C6) merupakan tingkat kemampuan yang meminta siswa mengevaluasi informasi, seperti bukti sejarah, editorial, teori-teori, dan termasuk di dalamnya melakukan judgement terhadap hasil analisis untuk membuat kebijakan. Soal evaluasi: merupakan soal yang menuntut pembuatan keputusan dan kebijakan, dan penentuan “nilai” informasi. Evaluasi merupakan tingkat kemampuan tertinggi, Soal evaluasi meminta siswa membuat pertimbangan tentang sesuatu, atau menafsirkan berdasarkan kriteria tertentu.



53 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Di antara kata kerja yang sesuai untuk menguji tingkat evaluasi adalah:  Membuktikan  Memperhitungkan  Menilai  Menyesuaikan  Mengkritik  Mempertimbangkan  Membandingkan Pertanyaan untuk evaluasi (a) Beri alasan mengapa anda lebih suka memilih baju putih ? (b) Apakah tes objektif lebih baik dari pada tes uraian ? B. Taksonomi Bloom Revisi Pada tahun 1990-an Lorin Anderson bersama David Krathwohl, mengkaji kembali taksonomi Bloom dan menyusun ulang ranah kognitif, untuk dapat mengadopsi perkembangan dunia pendidikan abad 21. Hasilnya dikenal dengan sebutan taksonomi Bloom revisi (Krathwohl, D. R, 2002). Adapun perubahan dari kerangka pikir taksonomi Bloom asli ke taksonomi Bloom revisi diilustrasikan pada Gambar 4.2.



54 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Dimensi tersendiri Pengetahuan



Dimensi Pengetahuan



Mengingat Kata Kerja



Pemahaman



Memahami



Penerapani



Menerapka n



Analisis



Mengaalisis



Sintesis



Mengevalu asi



Evaluasi



Mencipta



Dimensi Proses Kognitif



Gambar 4.2. Perubahan dari kerangka pikir taksonomi Bloom asli ke taksonomi Boom revisi Pada Taksonomi Bloom revisi dilakukan pemisahan yang tegas antara dimensi pengetahuan (knowledge dimension) dengan dimensi proses kognitif (cognitive process). Kalau pada taksonomi Bloom asli dimensi pengetahuan dimasukkan pada jenjang paling bawah (Pengetahuan), sedangkan pada taksonomi yang baru pengetahuan benar-benar dipisah dari dimensi proses kognitif. Pemisahan ini dilakukan sebab dimensi pengetahuan berbeda dari dimensi proses kognitif. Pengetahuan merupakan kata benda (noun) sedangkan proses kognitif merupakan kata kerja( verb). Secara singkat 55 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



dapat dikatakan bahwa pada taksonomi Bloom revisi ada dua dimensi yang terpisah, yaitu “knowledge dimension” dan “cognitive process dimension.” Lihat Tabel 4.1 berikut. Tabel 4.1 Tabel Taksonomi Bloom Revisi Dimensi Pengetahuan



Dimensi Proses Kognitif



1. Pengetahuan Faktual a. Pengetahuan ttg terminologi b. Pengetahuan ttg bagian detail dan unsur- unsur 2. Pengetahuan Konseptual a. Pengetahuan ttg klasifikasin dan kategori b. Pengetahuan ttg prinsip dan generalisasi c. Pengetahuan ttg teori, model & struktur 3. Pengetahuan Prosedural a. Pengetahuan ttg keterampilan khusus yg berhubungan dng suatu bidang tertentu dan pengetahuan algoritma b. Pengetahuan ttg teknik dan metode c. Pengetahuan ttg kriteria penggunaan suatu prosedur 4. Pengetahuan Metakognitif a. Pengetahuan strategik b. Pengetahuan ttg operasi kognitif c. Pengetahuan ttg diri sendiri



C.1. Mengingat (Remember) 1.1. Mengenali (recognizing) 1.2. Mengingat (recalling) C.2. Memahami (Understand) 1.3. Menafsirkan (interpreting) 1.4. Memberi contoh (exampliying) 1.5. Meringkas (summarizing) 1.6. Menarik inferensi (inferring) 1.7. Membandingkan (compairing) 1.8. Menjelaskan (explaining) C.3. Mengaplikasikan (Apply) 1.9. Menjalankan (executing) 1.10. Mengimplementasikan (implementing) C.4. Menganalisis (Analyze) 1.11. Menguraikan (diffrentiating) 1.12. Mengorganisir (organizing) 1.13. Menemukan makna tersirat (attributing) C.5. Evaluasi (Evaluate) 1.14. Memeriksa (checking) 1.15. Mengritik (Critiquing) C.6. Membuat Create) 1.16. Merumuskan



56 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(generating) 1.17. Merencanakan (planning) 1.18. (Memproduksi (producing)



a. Dimensi Pengetahuan Dimensi pengetahuan merupakan dimensi tersendiri dalam Taksonomi Bloom revisi. Ada empat jenis kategori pengetahuan, yaitu: pengetahuan faktual, pengetahuan konseptual, pengetahuan prosedural, dan pengetahuan metakognitif. Jenis-jenis pengetahuan menunjukkan penjenjangan dari yang sifatnya konkret (faktual) hingga yang abstrak (metakognitif). Anderson, et.all (2001) menunjukkan kategori dimensi pengeta- huan seperti pada Tabel 4.2 berikut. Tabel 4.2. Kategori dimensi pengetahuan Mayor Types and Subtypes Examples 1. Factual knowledge- the basic element student must know to beaquainted with a discipline or solve problems in it 1.1 Knowledge of Technical vocabulary, musical terminology symbols 1.2 knowledge of specific Major matural resources, details and elements reliable soyrces of information 2. Conceptual Knowledge- the interrelationships among the basic elements within a larger structure that enable them to function together 2.1 knowledge of Period of geological time, forms classification and categories of business ownership 2.2 knowledge of principles Pythagorean theorem, law of and generalizations supply and demand 57 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



2.3 knowledge of theories, Theory of evaluation, structure models and structures of congrees 3. Procedural Knowledge- how ti do something, methods of inquiry, and criteria for using skills, algorithms, techniques, and methods 3.1 knowledge of subjectSkills used in painting with specific skills and water colors, whole number algoritms division algorithm 3.2 knowledge of subjectInterviewing techniques, specific techniques and scientific method methods 3.3 knowledge of criteria for Criteria used to determine determining when to use when to apply a procedure appropriate procedures involving Newton’s second law, criteria used to judge the feasibility of using a particular method to estimate business costs 4. Metacognitive knowledge- knowledge of cognitif in general as well as awarenness and knowledge of one’s own cognition 4.1 Strategic knowledge Knowledge of outlining as a means of capturing the structure of unit of subject matter in a textbook, knowledge of the use of heuristics 4.2 knowledge about Knowledge of the types of tests cognitive task, including particular teachers administer, appropriate contextual and knowledge of the cognitive conditional knowledge demands of different tasks 4.3 self-knowledge Knowledge that critiquing essays is a personal streght, whereas writing essays is a personal weakness, awarenees of one’s own knowledge level



58 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Dari Tabel 4.2 di atas dapat dijelaskan sebagai berikut; 1) Pengetahuan Faktual (Factual knowledge): Pengetahuan faktual meliputi elemen-elemen dasar yang harus diketahui siswa ketika akan mempelajari disiplin ilmu atau menyelesaikan masalah dalam disiplin ilmu tersebut. Pengetahuan faktual pada umumnya merupakan abstraksi tingkat rendah. Pengetahuan faktual terbagi menjadi dua subjenis yaitu: (1) pengetahuan tentang terminologi; dan (2) pengetahuan tentang detail-detail dan elemenelemen yang spesifik. a) Pengetahuan tentang terminologi (knowledge of terminology):Pengetahuan ini melingkupi pengetahuan tentang label dan simbol verbal dan nonverbal (misalnya, kata, angka, tanda dan gambar). b) Pengetahuan tentang bagian detail dan unsur-unsur (knowledge of specific details and element): Pengetahuan tentang detail-detail dan elemen-elemen yang spesifik. merupakan pengetahuan tentang peristiwa, lokasi, orang, tanggal, sumber informasi dan semacamnya. Pengetahuan ini meliputi informasi yang mendetail dan spesifik.



59 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



2) Pengetahuan knowledge)



konseptual



(conceptual



Pengetahuan konseptual mencakup pengetahuan tentang kategori, klasifikasi dan hubungan antar dua atau lebih kategori atau klasifikasi pengetahuan yang lebih kompleks dan tertata. Pengetahuan konseptual meliputi skema, model mental, atau teori yang implisit atau eksplisit dalam beragam model psikologi kognitif. Pengetahuan konseptual terdiri dari tiga subjenis yaitu: (1) pengetahuan tentang klasifikasi dan kategori; (2) pengetahuan tentang prinsip dan generalisasi; dan (3) pengetahuan tentang teori, model, dan struktur. a) Pengetahuan tentang kelasifikasi dan kategori: Pengetahuan tentang klasifikasi dan kategori meliputi kelas, kategori, divisi, dan susunan yang spesifik dalam disiplin-disiplin ilmu. Setiap disiplin ilmu memiliki serangkaian kategori yang digunakan untuk menemukan dan mengkaji elemen-elemen baru. Klasifikasi dan kategori menciptakan hubungan-hubungan antara elemen-elemen. b) Pengetahuan tentang prinsip dan generalisasi: Prinsip dan generalisasi merupakan abstraksi dari sejumlah fakta, kejadian, dan saling keterkaitan antara sejumlah fakta. Prinsip dan generalisasi biasanya cenderung sulit untuk dipahami siswa apabila 60 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



siswa belum sepenuhnya menguasai fenomenafenomena yang merupakan bentuk yang “teramati” dari suatu prinsip atau generalisasi. c) Pengetahuan tentang teori, model, dan struktur: Pengetahuan ini meliputi pengetahuan tentang prinsip dan generalisasi serta antara keduanya yang menghadirkan pandangan yang jelas, utuh dan sistemik tentang sebuah fenomena, masalah, atau materi kajian yang kompleks. 3) Pengetahuan prosedural: Pengetahuan tentang bagaimana cara melakukan sesuatu. Pengetahuan ini mencakup pengetahuan tentang keterampilan, algoritma, teknik, dan metode, yang semuanya disebut dengan prosedur (Alexander, dkk., 1991), Seringkali pengetahuan prosedural berisi langkah-langkah atau tahapan yang harus diikuti dalam mengerjakan suatu hal tertentu. Pengetahuan prosedural berkaitan dengan pertanyaan “bagaimana”. Pengetahuan prosedural terbagi atas tiga sub jenis yaitu: pengetahuan tentang keterampilan dalam bidang tertentu dan algoritma, (2) pengetahuan tentang teknik dan metode dalam bidang tertentu, dan (3) pengetahuan tentang kriteria untuk menentukan kapan harus menggunakan prosedur yang tepat.



61 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



a) Pengetahuan tentang keterampilan khusus yang berhubungan dengan suatu bidang tertentu dan pengetahuan tentang algoritme: adalah pengetahuan tentang keterampilan khusus yang diperlukan untuk bekerja dalam suatu bidang ilmu atau tentang algoritme yang harus ditempuh untuk menyelesaikan suatu permasalahan. b) Pengetahuan tentang teknik dan metode yang berhubungan dengan suatu bidang tertentu: adalah pengetahuan yang pada umumnya merupakan hasil konsensus, perjanjian, atau aturan yang berlaku dalam disiplin ilmu tertentu. Pengetahuan tentang teknik dan metode lebih mencerminkan bagaimana ilmuwan dalam bidang tersebut berpikir dan memecahkan masalah yang dihadapi. c) Pengetahuan tentang kriteria untuk menentukan kapan suatu prosedur tepat untuk digunakan: adalah pengetahuan tentang kapan suatu teknik, strategi, atau metode harus digunakan. Siswa dituntut bukan hanya tahu sejumlah teknik atau metode tetapi juga dapat mempertimbangkan teknik atau metode tertentu yang sebaiknya digunakan dengan mempertimbangkan situasi dan kondisi yang dihadapi saat itu.



62 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



4) Pengetahuan metakognitif Pengetahuan metakognitif adalah pengetahuan tentang kognisi secara umum dan pengetahuan tentang diri sendiri. Metakognitif adalah “knowledge and awareness about cognitive processes – or our thought about thinking” (Margaret W. Matlin dalam Desmita, 2006). Penelitian-penelitian tentang metakognitif menunjukkan bahwa seiring dengan perkembangannya siswa menjadi semakin sadar akan pikirannya dan semakin banyak tahu tentang kognisi, dan apabila siswa bisa mencapai hal ini maka mereka akan lebih baik lagi dalam belajar. Sebagai contoh pengetahuan metakognitif, yaitu pengetahuan tentang langkah-langkah penelitian, rencana kegiatan dan program kerja ; pengetahuan tentang jenis metode, tes yang harus digunakan dan dikerjakan guru ; dan pengetahuan tentang sikap, minat, karakteristik yang harus dikuasai untuk menjadi seorang guru yang baik. Pengetahuan metakognitif terbagi menjadi tiga subjenis yaitu: (1) pengetahuan strategik; (2) pengetahuan tentang tugas-tugas kognitif yang meliputi pengetahuan kontekstual dan kondisional; dan (3) pengetahuan diri. a) Pengetahuan strategik: adalah pengetahuan tentang strategi-strategi belajar dan berpikir serta pemecahan masalah. Subjenis pengetahuan ini mencakup pengetahuan tentang berbagai strategi yang dapat digunakan siswa untuk 63 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



menghafal materi pelajaran, mencari makna teks, atau memahami apa yang mereka dengar dari pelajaran di kelas atau yang dibaca dalam buku dan bahan ajar lain. b) Pengetahuan tentang tugas kognitif, termasuk di dalamnya pengetahuan tentang konteks dan kondisional: adalah pengetahuan tentang jenis operasi kognitif yang diperlukan untuk mengerjakan tugas tertentu serta pemilihan strategi kognitif yang sesuai dalam situasi dan kondisi tertentu. c) Pengetahuan tentang diri sendiri: adalah pengetahuan tentang kelemahan dan kemampuan diri sendiri dalam belajar. Salah satu syarat agar siswa dapat menjadi pembelajar yang mandiri adalah kemampuannya untuk mengetahui dimana kelebihan dan kekurangan serta bagaimana mengatasi kekurangan tersebut. Keempat kategori pada dimensi pengetahuan dianggap kontinum dari yang kongkrit sampai yang abstrak. Konseptual dan prosedural mempunyai tingkat keabstrakan yang berurutan, misalkan pengetahuan prosedural lebih konkret ketimbang pengetahuan konseptual yang paling abstrak (Anderson dan Krathwohl, 2001).



64 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



b. Dimensi proses kognitif Dalam dimensi proses kognisi (cognitive process dimension) terdapat enam kategori (Anderson dan Krathwohl, 2001) sebagaimana pada taksonomi Bloom lama; tetapi ada perubahan: kategori pengetahuan (knowledge) diganti dengan ingatan (remember), pemahaman (comprehension) diganti nama pengertian (understand). Penerapan (application), analisis (analysis), dan evaluasi (evaluation) dipertahankan, tetapi berganti sebutan “application” diganti dengan “apply,” “analysis” diganti dengan “analyze,” dan “evaluation” diganti dengan “evaluate.” Sintetis (synthesis) bertukar tempat dengan evaluasi dan berganti sebutan mencipta (create). Perubahan mendasar terletak pada level 5 dan 6. Adapun urutan atau level taksonomi Bloom revisi adalah seperti dalam gambar 4.3 berikut.



Gambar 4.3. Level kognitif Bloom revisi



65 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



1) Mengingat (Remember) Remembering. Can the student recall or remember the information? (define, duplicate, list, memorize, recall, repeat, and reproduce state) Mengingat adalah kemampuan memperoleh kembali pengetahuan yang relevan dari memori jangka panjang. Kategori Remember terdiri dari proses kognitif Recognizing (mengenal kembali) dan Recalling (mengingat). Untuk menilai Remember, siswa diberi soal yang berkaitan dengan proses kognitif Recognizing (mengenal kembali) dan Recalling (mengingat). Contoh bentuk soal yang sering digunakan untuk proses kognitif ini adalah soal ”benar-salah”, pilihan ganda, menjodohkan, dan mengisi titik-titik. Mengenali kembali (Recognizing): mencakup proses kognitif untuk menarik kembali informasi yang tersimpan dalam memori jangka panjang yang identik atau sama dengan informasi yang baru. Bentuk tes yang meminta siswa menentukan betul atau salah, menjodohkan, dan pilihan berganda merupakan tes yang sesuai untuk mengukur kemampuan mengenali. Mengingat (Recalling): menarik kembali informasi yang tersimpan dalam memori jangka panjang apabila ada petunjuk (tanda) untuk melakukan hal tersebut. Tanda di sini seringkali berupa pertanyaan. Istilah lain untuk mengingat adalah menarik (retrieving).



66 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Pertanyaan untuk mengingat:  Apa yang terjadi setelah ... ?  Berapa banyak...?  Siapakah yang ... ?  Dapatkah Anda menamakan ... ?  Temukan arti dari……..  Jelaskan apa yang terjadi setelah .....  Siapa yang berbicara kepada ... ?  Dapatkah Anda memberitahu mengapa ... ?  Cari makna ... ?  Apa yang...?  Manakah yang benar atau salah ... ?



2) Memahami (Understand ) Understanding Can the student explain ideas or concepts? (classify, describe, discuss, explain, identify, locate, recognize, report, select, translate, and paraphrase) Memahami adalah kemampuan merumuskan makna dari pesan pembelajaran dan mampu mengkomunikasikannya dalam bentuk lisan, tulisan maupun grafik. Siswa mengerti ketika mereka mampu menentukan hubungan antara pengetahuan yang baru diperoleh dengan pengetahuan mereka yang lalu. Kategori memahami mencakup tujuh proses kognitif: menafsirkan (interpreting), memberikan contoh (exemplifying), mengkelasifikasikan (classifying), meringkas (summarizing), menarik inferensi (inferring), 67 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



membandingkan (comparing), dan menjelaskan (explaining). Menafsirkan (interpreting): mengubah dari satu bentuk informasi ke bentuk informasi yang lainnya, misalnya dari dari kata-kata ke grafik atau gambar, atau sebaliknya, dari kata-kata ke angka, atau sebaliknya Memberikan contoh (exemplifying): memberikan contoh dari suatu konsep atau prinsip yang bersifat umum. Memberikan contoh menuntut kemampuan mengidentifikasi ciri khas suatu konsep dan selanjutnya menggunakan ciri tersebut untuk membuat contoh. Mengkelasifikasikan (classifying): Mengenali bahwa sesuatu (benda atau fenomena) masuk dalam kategori tertentu. Termasuk dalam kemampuan mengkelasifikasikan adalah mengenali ciri-ciri yang dimiliki suatu benda atau fenomena. Meringkas (summarising): membuat suatu pernyataan yang mewakili seluruh informasi atau membuat suatu abstrak dari sebuat tulisan. Meringkas menuntut siswa untuk memilih inti dari suatu informasi dan meringkasnya. Menarik inferensi (inferring): menemukan suatu pola dari sederetan contoh atau fakta. Untuk dapat melakukan inferensi siswa harus terlebih dapat menarik abstraksi suatu konsep/prinsip berdasarkan sejumlah contoh yang ada Membandingkan (comparing): mendeteksi persamaan dan perbedaan yang dimiliki dua objek, ide, ataupun situasi. Membandingkan mencakup juga menemukan kaitan antara unsur-unsur satu objek atau 68 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



keadaan dengan unsur yang dimiliki objek atau keadaan lain. Istilah lain untuk membandingkan adalah Menjelaskan (explaining): mengkonstruk dan menggunakan model sebab-akibat dalam suatu system. Termasuk dalam menjelaskan adalah menggunakan model tersebut untuk mengetahui apa yang terjadi apabila salah satu bagian sistem tersebut diubah Pertannyaan untuk memahami  Dapatkah Anda menulis dengan kata-kata Anda sendiri ... ?  Dapatkah Anda menulis keterangan singkat ... ?  Bagaimana Anda akan menjelaskan…..?  Dapatkah Anda menulis sebuah garis-garis besar yang jelas……..?  Menurut Anda, apa yang akan terjadi kemudian ... ?  Apa yang kamu pikirkan...?  Apa ide utama ... ?  Dapatkah Anda mengilustrasikan ... ?  Dapatkah Anda memberikan contoh dari apa yang Anda maksud ... ?  Dapatkah Anda memberikan definisi untuk ... ? 3) Menerapkan (Apply) Applying Can the student use the information in a new way? (choose, demonstrate, dramatize, employ, illustrate, interpret, operate, schedule, sketch, solve, use, and write) Menerapkan adalah kemampuan menggunakan prosedur untuk menyelesaikan masalah. Siswa 69 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



memerlukan latihan soal sehingga siswa terlatih untuk mengetahui prosedur apa yang akan digunakan untuk menyelesaikan soal. Kategori menerapkan (Apply) terdiri dari proses kognitif: kemampuan melakukan (Executing) dan kemampuan menerapkan (Implementing). Menjalankan (executing): menjalankan suatu prosedur rutin yang telah dipelajari sebelumnya. Langkahlangkah yang diperlukan sudah tertentu dan juga dalam urutan tertentu. Apabila langkah-langkah tersebut benar, maka hasilnya sudah tertentu pula. Mengimplementasikan (implementing): memilih dan menggunakan prosedur yang sesuai untuk menyelesaikan tugas yang baru. Karena diperlukan kemampuan memilih, siswa dituntut untuk memiliki pemahaman tentang permasalahan yang akan dipecahkannya dan juga prosedur-prosedur yang mungkin digunakannya. Apabila prosedur yang tersedia ternyata tidak tepat benar, siswa dituntut untuk bisa memodifikasinya sesuai keadaan yang dihadapi. Pertanyaan untuk menerapkan:  Apakah Anda mengetahui kejadian lain yang ... ?  ini terjadi di ... ?  Dapatkah Anda mengelompok sesuai ciri-cirinya seperti ... ?  Faktor-faktor manakah yang akan Anda ubah apabila ... ?  Pertanyaan apa yang akan Anda tanyakan tentang…..?



70 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd







Dari informasi ysng diberikan, dspstksh Anda mengembnngkn serangkaian arahan tentang….?



4) Menganalisis (Analyze) Analyzing Can the student distinguish between the different parts? (appraise, compare, contrast, criticize, differentiate, discriminate, distinguish, examine, experiment, question, test assemble, construct, create, design, develop, formulate, and write long familiar Bloom's Taxonomy) Menganalisis meliputi kemampuan untuk memecah suatu kesatuan menjadi bagian-bagian dan menentukan bagaimana bagian-bagian tersebut dihubungkan satu dengan yang lain atau bagian tersebut dengan keseluruhannya. Analisis menekankan pada kemampuan merinci sesuatu unsur pokok menjadi bagian-bagian dan melihat hubungan antar bagian tersebut. Di tingkat analisis, seseorang akan mampu menganalisa informasi yang masuk dan membagi-bagi atau menstrukturkan informasi ke dalam bagian yang lebih kecil untuk mengenali pola atau hubungannya dan mampu mengenali serta membedakan faktor penyebab dan akibat dari sebuah skenario yang rumit. Ada tiga macam proses kognitif yang tercakup dalam menganalisis: membedakan (differentiating), mengorganisir (organizing), dan menemukan pesan tersirat (attributting) Membedakan (differentiating): membedakan bagian-bagian yang menyusun suatu struktur berdasarkan relevansi, fungsi dan penting tidaknya. Oleh karena itu 71 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



membedakan (differentiating) berbeda dari membandingkan (comparing). Membedakan menuntut adanya kemampuan untuk menentukan mana yang relevan/esensial dari suatu perbedaan terkait dengan struktur yang lebih besar. Mengorganisir (organizing): mengidentifikasi unsur-unsur suatu keadaan dan mengenali bagaimana unsur-unsur tersebut terkait satu sama lain untuk membentuk suatu struktur yang padu. Menemukan pesan tersirat (attributting): menemukan sudut pandang, bias, dan tujuan dari suatu bentuk komunikasi. Contoh: menganalisis mengapa seseorang menulis di surat kabar bahwa hutan di Jawa Barat masih cukup luas. Pertanyan untuk menganalisis  Bagian mana yang seharusnya tidak terjadi…..?  Apabila…..terjadi, bagaimanakah akhir cerita akan terjadi…….?  Bagaimana ini ……sama dengan…..?  Apa tema yang mendasari ... ?  Apa yang Anda pikirkan sebagai kemungkinan hasil lainnya ?  Mengapa ..... perubahan terjadi ?  Dapatkah Anda membandingkan Anda ... dengan yang disajikan di ... ?  Apa permasalahan dari ...?  Anda membedakan antara ... ?  Apa saja sebab motif di balik ... ? 72 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



 



Apa yang mengubahnya…. ? Apa masalahnya dengan ... ?



5) Menilai (Evaluate) Evaluating Can the student justify a stand or decision? (appraise, argue, defend, judge, select, support, value, and evaluate) Menilai didefinisikan sebagai kemampuan melakukan judgement berdasar pada kriteria dan standar tertentu. Kriteria sering digunakan adalah menentukan kualitas, efektifitas, efisiensi, dan konsistensi, sedangkan standar digunakan dalam menentukan kuantitas maupun kualitas. Evaluasi mencakup kemampuan untuk membentuk suatu pendapat mengenai sesuatu atau beberapa hal, bersama dengan pertanggungjawaban pendapat itu yang berdasar kriteria tertentu. Ada dua macam proses kognitif yang tercakup dalam kategori ini: memeriksa (checking) dan mengritik (critiquing) Memeriksa (Checking): Menguji konsistensi atau kekurangan suatu karya berdasarkan kriteria internal (kriteria yang melekat dengan sifat produk tersebut). Contoh: Memeriksa apakah kesimpulan yang ditarik telah sesuai dengan data yang ada. Mengritik (Critiquing): menilai suatu karya baik kelebihan maupun kekurangannya, berdasarkan kriteria eksternal. Contoh: menilai apakah rumusan hipotesis sesuai atau tidak (sesuai atau tidaknya rumusan hipotesis dipengaruhi oleh pengetahuan dan cara pandang penilai).



73 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Pertanyaan untuk menilai  Adakah solusi yang tepat untuk ... ?  Ukurlah nilai dari....Apa yang Anda pikirkan tentang…..?  Dapatkah Anda mempertahankan posisi Anda tentang ... ?  Menurut Anda . ... sesuatu yang baik atau buruk ?  Bagaimana anda mengatasi ... ?  Perubahan apa yang ... apa yang Anda rekomendasikan ?  Apakah Anda percaya…? Bagaimana yang Anda rasakan apabila….?  Apa sajakah konsekwensinaya ?  Pengaruh apakah yang akan….pada kehidupan kita?  Apa sajakah pro dan kontra dari ... ?  Seberapa efektifkah ... ?  Mengapa ….berharga?  Apa sajakah afternatif?  Siapa yang akn mendapatkan dan iapa yang akan kehilangan? 6) Berkreasi(Create) Creating Can the student create new product or point of view? (assemble, construct, create, design, develop, formulate, and write) Create didefinisikan sebagai menggeneralisasi ide baru, produk atau cara pandang yang baru dari sesuatu kejadian. Create di sini diartikan sebagai meletakkan



74 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



beberapa elemen dalam satu kesatuan yang menyeluruh sehingga terbentuklah dalam satu bentuk yang koheren atau fungsional. Siswa dikatakan mampu Create jika dapat membuat produk baru dengan merombak beberapa elemen atau bagian ke dalam bentuk atau stuktur yang belum pernah diterangkan oleh guru sebelumnya. Proses Create umumnya berhubungan dengan pengalaman belajar siswa yang sebelumnya. Ada tiga macam proses kognitif yang tergolong dalam kategori ini, yaitu: membuat (generating), merencanakan (planning), dan memproduksi (producing). Membuat (generating): menguraikan suatu masalah sehingga dapat dirumuskan berbagai kemungkinan hipotesis yang mengarah pada pemecahan masalah tersebut. Contoh: merumuskan hipotesis untuk memecahkan permasalahan yang terjadi berdasarkan pengamatan di lapangan. Merencanakan (planning): merancang suatu metode atau strategi untuk memecahkan masalah. Contoh: merancang serangkaian percobaan untuk menguji hipotesis yang telah dirumuskan. Memproduksi (producing): membuat suatu rancangan atau menjalankan suatu rencana untuk memecahkan masalah. Pertanyan untuk berkreasi  Dapatkah Anda merancang sebuah... untuk ... ?  Dapatkah Anda memberikan solusi yang memungkinkan untuk ... ? 75 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



   



Jika Anda menggunakan seluruh sumber, bagaimanakah Anda akan melakukannya dengan ... ? Mengapa tidak Anda temukan cara Anda sendiri untuk ... ? Ada berapa cara yang dapat Anda ... ? Dapatkah Anda menciptakan kegunaan baru dan tidak biasa untuk ... ?



Taksonomi Bloom revisi kadang-kadang juga disebut sebagai taksonomi Anderson dan Krathwohl yang berkaitan erat dengan dimensi pengetahuan yang lain yaitu pengetahuan faktual, pengetahuan konseptual, pengetahuan prosedural, dan pengetahuan metakognisi. Lihat Tabel 4.2 berikut. Tabel 4.2 Taksonomi Bloom revisi Tingkatan Menciptakan (Creating)



Mengevaluasi (Evaluating)



Berpikir Tingkat Tinggi Menggeneralisasikan (generating), merancang (designing), memproduksi (producing), merencanakan kembali (devising) Mengecek (checking), mengkritisi (critiquing), hipotesis (hypothesising), eksperimen (experimenting)



76 | Pengukuran



Komunikasi Negosiasi (negotiating), memoderatori (moderating), kolaborasi (collaborating) Bertemu dengan jaringan/mendiskus ikan (net meeting), berkomentar commenting), berdebat (debating)



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Menganalisis (Analyzing)



Menerapkan (Applying)



Memahami/ mengerti (Understanding)



Mengingat (Remembering)



Memberi atribut (attributeing), mengorganisasikan (organizing), mengintegrasikan (integrating), mensahihkan (validating) Menjalankan prosedur (executing), mengimplementasikan (implementing), menyebarkan (sharing) Mengklasifikasikan (classification), membandingkan (comparing), menginterpretasikan (interpreting), berpendapat (inferring) Mengenali (recognition), memanggil kembali (recalling), mendeskripsikan (describing), mengidentifikasi (identifying) Berpikir Tingkat Rendah



Menanyakan (Questioning), meninjau ulang (reviewing)



Posting, blogging, menjawab (replying) Bercakap (chatting), menyumbang (contributing), networking,



Menulis teks (texting), mengirim pesan singkat (instant messaging), berbicara (twittering)



Selanjutnya untuk lebih jelas letak perbedaan antara taksonomi Bloom original dan taksonomi Bloom revisi dapat kita melihat dalam gambar 4.4.



77 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Gambar 4.4. Taksonomi Bloom original dan revised



Perbandingan antara ranah kognitif taksonomi Bloom asli dengan ranah lognitif taksonomi Bloom revisi dapat kita lihat dalam Tabel 4.4 berikut. Tabel 4-4. Perbandingan antara ranah kognitif Bloom asli dengan ranah kognitif Bloom revisi Ranah kognitif C1 C2 C3 C4 C5 C6



Original (asli) Knowledge (Pengetahuan) Comprehension (Pemahaman) Apply (Aplikasi) Analysis (Analisis) Synthesis (Sintesis) Evaluation (Evaluasi)



78 | Pengukuran



Revised (revisi) Remembering (Mengingat) Understanding (Memahami) Applying (Mengaplikasikan) Analyzing (Menganalisis) Evaluating (Mengevaluasi) Creating (Mencipta)



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Gambar 4.5 di bawah memperlihatkan kombinasi cognitive process dan knowledge dimensions (Heer, 2012)



Gambar 4.5. Kombinasi antara cognitive process dan knowledge dimensions



79 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 5 TAKSONOMI TUJUAN AFEKTIF DAN PSIKOMOTOR A. Taksonomi Ranah Afektif Taksonomi afektif yang paling terkenal adalah yang dikembangkan oleh Krathwohl, Bloom dan Masia (1964). Ranah Afektif mencakup segala sesuatu yang terkait dengan emosi, misalnya perasaan, nilai, penghargaan, semangat,minat, motivasi, dan sikap. Lima kategori ranah ini diurutkan mulai dari perilaku yang sederhana hingga yang paling kompleks. Taksonomi ini menggambarkan proses seseorang di dalam mengenali dan mengadopsi suatu nilai dan sikap tertentu yang menjadi pedoman baginya bertingkah laku. Krathwohl mengurutkan tujuan afektif ke dalam 5 tingkatan dari yang paling sederhana 80 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



sampai kompleks, yaitu Penerimaan (receiving), tanggapan (responding), penghargaan (valuing), pengorganisasian (organization), dan pengamalan (charakterization) 1) Penerimaan (Receiving) adalah semacam kepekaan dalam menerima rangsangan (stimulasi) dari luar yang datang kepada siswa dalam bentuk masalah, situasi, gejala dan lain-lain. Dalam tipe ini termasuk kesadaran, keinginan untuk menerima stimulus, control dan seleksi gejala atau rangsangan dari luar. Receiving juga diartikan sebagai kemauan untuk memperhatikan suatu kegiatan atau suatu objek. Pada jenjang ini siswa dibina agar mereka bersedia menerima nilai-nilai yang diajarkan kepada mereka dan mereka mempunyai kemauan menggabungkan diri ke dalam nilai itu atau mengidentifikasi diri dengan nilai itu. Contoh: siswa mendengarkan penjelasan guru dengan penuh perhatian. Contoh kata kerja kunci: menanyakan, mengikuti, memberi, menahan/mengendalikan diri, mengidentifikasi, memperhatikan, menjawab: 2) Tanggapan (Responding) adalah suatu sikap yang menunjukkan adanya partisipasi aktif atau kemampuan menanggapi, kemampuan yang dimiliki seseorang untuk mengikutsertakan dirinya secara aktif dalam fenomena tertentu dan membuat reaksi terhadapnya dengan salah satu cara. Hal ini mencakup



81 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



ketepatan reaksi, perasaan, kepuasan dalam menjawab stimulus dari luar yang datang kepada dirinya.



Contoh: siswa mengerjakan pekerjaan rumah, berpartisipasi dalam diskusi kelas, memberikan presentasi, bertanya terhadap ide-ide, konsep, atau model baru untuk lebih memahaminya. Contoh kata kerja kunci: Menjawab, membantu, mentaati, memenuhi, menyetujui, mendiskusikan, melakukan, memilih, menyajikan, mempresentasikan, melaporkan, menceritakan, menulis, menginterpretasikan, menyelesaikan, mempraktekkan. 3) Penilaian (Valuing), atau menghargai artinya memeberikan nilai atau memberikan penghargaan terhadap suatu kegiatan atau objek, sehingga apabila kegiatan itu idak dikerjakan kan memebrikan suatu penyesalan. Dalam kaitannya dengan proses pembelajaran peserta didik tidak hanya mau menerima nilai yang diajarkan mereka telah berkemampuan untuk menilai konsep atau fenomena baik atau buruk. Contoh: siswa menunjukkan kepercayaan terhadap proses kerja kelompok dalam pemecahan masalah. Contoh kata kerja kunci: 82 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Menunjukkan, mendemonstrasikan, memilih, membedakan, mengikuti, meminta, memenuhi, menjelaskan, membentuk, berinisiatif, melaksanakan, memprakarsai, menjustifikasi, mengusulkan, melaporkan, menginterpretasikan, membenarkan, menolak, menyatakan/ mempertahankan pendapat, 4) Organisasi (Organization) yakni pengembangan dari nilai ke dalam suatu sistem organisasi, termasuk hubungan suatu nilai dengan nilai yang lain, pemantapan dan prioritas nilai yang telah dimilikinya. Yang termasuk kedalam organisasi ialah konsep tentang nilai, organisasi sistem nilai dan lain-lain. Contoh: siswa mengenali kebutuhan akan keseimbangan kebebasan dan tanggungjawab dalam kelompok kooperatif untuk memecahkan masalah dalam pembelajaran. Contoh kata kerja kunci: Mentaati, mematuhi, merancang, mengatur, mengidentifikasikan, mengkombinasikan, mengorganisisr, merumuskan, menyamakan, mempertahankan, menghubungkan, mengintegrasikan, menjelaskan, mengaitkan, 5) Pengamalan (Characterization) adalah keterpaduan semua sistem nilai yang telah dimiliki seseorang, yang mempengaruhi pola kepribadian dan tingkah lakunya.



83 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Proses internalisasi nilai telah menempati tempat tertinggi dalam hierarki nilai. Contoh: siswa dapat bekerjasama dalam kelompok kooperatif (menampilkan kerja tim), menggunakan pendekatan obyektif dalam pemecahan masalah, dan merevisi penilaiannya berdasarkan bukti baru. Contoh kata kerja kunci: Melakukan, melaksanakan, memperlihatkan membedakan, memisahkan, menunjukkan, mempengaruhi, mendengarkan, memodifikasi, mempraktekkan, mengusulkan, merevisi, memperbaiki, membatasi, mempertanyakan, mempersoalkan,



B. Taksonomi Ranah Psikomotor Ranah Psikomotorik meliputi gerakan dan koordinasi jasmani, keterampilan motorik dan kemampuan fisik. Ketrampilan ini dapat diasah jika sering melakukannya. Perkembangan tersebut dapat diukur sudut kecepatan, ketepatan, jarak, cara/teknik pelaksanaannya. Bloom (1979) menyatakan bahwa ranah psikomotor berhubungan dengan hasil belajar yang pencapaiannya melalui keterampilan manipulasi yang melibatkan otot dan kekuatan fisik. Singer (1972) menambahkan bahwa mata pelajaran yang berkaitan dengan psikomotor adalah mata pelajaran yang lebih beorientasi pada gerakan dan menekankan pada reaksi–reaksi fisik dan keterampilan tangan. Jadi, hasil belajar psikomotor tampak dalam bentuk keterampilan (skill) dan kemampuan bertindak. 84 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Ada beberapa ahli yang mengemukakan level atau tingkatan hasil belajar psikomotor, di antaranya yang sering digunakan adalah hasil belajar psikomotor yang dikembangkan oleh Dave, Simpson dan Harrow. Menurut Dave (1967) hasil belajar psikomotor dapat dibedakan menjadi lima tahap, yaitu: imitasi, manipulasi, presisi, artikulasi, dan naturalisasi. Imitasi adalah kemampuan melakukan kegiatankegiatan sederhana dan sama persis dengan yang dilihat atau diperhatikan sebelumnya. Contohnya, seorang siswa dapat memukul bola dengan tepat karena pernah melihat atau memperhatikan hal yang sama sebelumnya. Manipulasi adalah kemampuan melakukan kegiatan sederhana yang belum pernah dilihat tetapi berdasarkan pada pedoman atau petunjuk saja. Sebagai contoh, seorang siswa dapat memukul bola dengan tepat hanya berdasarkan pada petunjuk guru atau teori yang dibacanya. Presisi adalah kemampuan melakukan kegiatan‐ kegiatan yang akurat sehingga mampu menghasilkan produk kerja yang tepat. Contoh, siswa dapat mengarahkan bola yang dipukulnya sesuai dengan target yang diinginkan. Artikulasi adalah kemampuan melakukan kegiatan yang komplek dan tepat sehingga hasil kerjanya merupakan sesuatu yang utuh. Sebagai contoh, siswa dapat mengejar bola kemudian memukulnya dengan cermat sehingga arah bola sesuai dengan target yang diinginkan. Dalam hal ini, siswa sudah dapat melakukan tiga kegiatan



85 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



yang tepat, yaitu lari dengan arah dan kecepatan tepat serta memukul bola dengan arah yang tepat pula. Naturalisasi adalah kemampuan melakukan kegiatan secara reflek, yakni kegiatan yang melibatkan fisik saja sehingga efektivitas kerja tinggi. Sebagai contoh tanpa berpikir panjang siswa dapat mengejar bola kemudian memukulnya dengan cermat sehingga arah bola sesuai dengan target yang diinginkan. Tujuan kawasan psikomotor yang dikembangkan oleh Simpson (1972) mulai dari tingkat yang sederhana hingga tingkat yang rumit, yaitu: Persepsi (Perception), Kesiapan/Set, Respon terpimpin (Guided respons), Mekanisme (Mechanism), Complex Overt Respons, dan Originasi (Origination) Persepsi (Perception) adalah berhubungan dengan penggunaan indera untuk mengarahkan kegiatan motorik. Mulai dari kesadaran ada stimulus sampai kepada memilih tugas yang relevan untuk menterjemahkannya ke dalam suatu kegiatan (performance) tertentu. Contoh: menurunkan suhu AC saat merasa suhu ruangan panas Kesiapan/Set, adalah Kemampuan untuk mempersiapkan diri, baik mental, fisik, dan emosi, dalam menghadapi sesuatu. Contoh: melakukan pekerjaan sesuai urutan, menerima kelebihan dan kekurangan seseorang Respon terimpin (Guided respons) adalah langkah permulaan dalam mempelajari keterampilan yang kompleks, meliputi: menirukan, trial and error. Ketetapan dari performance ditentukan oleh instruktur atau oleh kriteria yang sesuai. Contoh: Mengikuti arahan dari instruktur. 86 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Mekanisme (Mechanism) mekanisme (Mechanism), merupakan performance yang menunjukkan bahwa respons yang dipelajari telah menjadi kebiasaan dan gerakangerakan dapat dilakukan dengan penuh kepercayaan dan kemahiran. Ini merupakan performance dari bermacam-macam keterampilan. Contoh: menggunakan computer Complex Oert Respons yaitu performance yang sangat terampil dan gerakan motorik yang memerlukan pula gerakan kompleks. Kemahiranya ditunjukkan dengan cepat, lancar, dan tepat dengan energi minimum, tanpa ragu-ragu dan otomatis (dilakukan dengan mudah dan terkontrol baik). Conth: Keahlian bermain piano. Originasi Origination), yaitu penciptaan pola-pola gerakan yang baru untuk menyesuaikan dengan situasi/masalah yang khusus. Hasil belajarnya ditekankan pada kreativitas yang didasarkan pada keterampilan tingkat tinggi. Harrow (1972) mengemukakan bahwa ranah hasil belajar psikomotot terdiri atas: Gerakan reflex, Gerakangerakan fundamental, Kemampuan perceptual, Kemampuan fisis, Gerakan keterampilan, dan Komunikasi tanpa kata-kata. Gerakan refleks, yaitu gerakan yang dilakukan tanpa disadari yang tertuju kepada suatu rangsang tertentu, (mengedipkan mata, menggeliat, menguap, membegkokkan badan, dan meyesuaikan sikap badan). Gerakan-gerakan fundamental. Merupakan polapola gerakan yang terbentuk dari gabungan gerakangerakan refleks dan menjadi dasar gerakan keterampilan 87 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



yang kompleks (berjalan, lari, melompat, meluncur, membungkuk, melengkung, berputar, memegang, menggerakan jari, dsb). Kemampuan perseptual. Kemampuan menafsirkan rangsangan dari berbagai cara untuk menyesuaikan diri dengan lingkungannya (‘mendengarkan’ mengikuti perintah verbal, ‘gerakan terkoordinasi’, loncat tali, menangkap, kinestetik discrimination, visual, auditory, dan tactile discrimination). Kemampuan fisis. Karakteristik organik yang esensial untuk mengembangkan gerakan keterampilan tinggi, termasuk ketahanan, kekuatan, fleksibilitas, dan ketangkasan (lari jarak jauh, berenang, angkat berat, gulat, ballet, membengkokkan/melengkungkan punggung, menyentuh jari kaki, mengetik). Gerakan keterampilan. Adanya tingkatan efisiensi pada saat melakukan tugas-tugas gerakan kompleks secara utuh, meliputi semua gerakan keterampilan yang terbentuk atas pola-pola gerakan locomotor dan manipulatif, termasuk keterampilan adaptif sederhana, adaptif majemuk, dan adaptif kompleks Komunikasi tanpa kata-kata. Komunikasi yang dilakukan dengan cara gerakan-gerakan tubuh sampai dengan koreografis yang canggih (sikap badan, gerak tangan, ekspresi raut muka, gerakan dansa, gerakan tari) Menurut Lunerta (Jihad & Haris, 2008) bentuk tes untuk ranah psikomotor yaitu dapat berupa tes paper and pencil, tes identifikasi, tes simulasi, dan tes unjuk kerja. (1) Tes paper and pencil : meskipun berupa tes tulis, namun sasarannya adalah kemampuan siswa dalam 88 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



menampilkan karya, seperti desain alat, desain grafis, atau lainnya (2) Tes identifikasi; tes ini dimaksudkan untuk mengukur kemampuan siswa dalam mengidentifikasi sesuatu hal, misalnya menemukan bagian yang rusak dari suatu alat, dan sebagainya (3) Tes simulasi: tes ini dilakukan jika tidak ada alat sesungguhnya yang dapat dipakai untuk memperagakan penampilan siswa, sehingga melalui simulasi dapat dinilai apakah siswa sudah menguasai keterampilan dengan bantuan peralatan tiruan ini (4) Tes unjuk kerja: tes ini dilakukan dengan alatyang sesungguhnya dan tujuannya untuk mengetahui apakah siswa sudah menguasai/terampil menggunakan alat tersebut. Untuk mendapat data melalui tes tersebut dapat digunakan daftar cek (check list) atau skala penilaian/kiraan (rating scale).



89 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



UNIT III INSTRUMEN EVALUASI DAN TEKNIK PENILAIAN Ditinjau dari alat ukur atau instrumen yang digunakan untuk melakukan pengukuran, secara umum dibedakan menjadi dua, yaitu berbentuk tes atau non-tes. Alat pengukuran yang berbentuk tes bisa dibedakan menjadi tiga macam, yaitu tes lisan, test tertulis, dan tes perbuatan. Tes lisan bisa diselenggarakan secara individual atau kelompok. Tes tertulis bisa berbentuk esai (uraian) atau obyektif. Sedangkan tes perbuatan bisa dilaksanakan secara individual atau juga kelompok. Alat pengukuran (penilaian) yang non-tes, yang biasanya menyertai dalam pelaksanaan proses belajar mengajar sangat banyak macamnya. Di antaranya bisa disebutkan adalah observasi (baik dengan cara langsung, tak langsung, maupun partisipasi), wawancara (terstruktur atau bebas), angket (tertutup atau terbuka), sosiometri, checklist, 90 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



concept map, portfolio, student journal, pertanyaanpertanyaan, dan sebagainya. Dilihat dari wilayah atribut



yang diungkap, secara umum alat ukur dapat dikategorikan menjadi dua wilayah yaitu wilayah kognitif dan wilayah non kognitif (Suryabrata, 2000) Teknik penilaian adalah cara-cara yang ditempuh untuk memperoleh informasi mengenai proses dan produk yang dihasilkan dari pembelajaran yang dilakukan siswa. Ada beberapa teknik yang dapat dilakukan dalam rangka penilaian ini, secara garis besar dapat dikategorikan sebagai teknik tes & nontes, baik untuk mengakses proses belajar maupun hasil belajar. Teknik tes merupakan cara untuk memperoleh informasi melalui pertanyaan yang memerlukan jawaban benar atau salah, sedangkan teknik nontes adalah suatu cara untuk memperoleh informasi melalui pertanyaan yang tidak memerlukan jawaban benar atau salah, tetapi hanya digradasi positif – negatif, suka – tidak suka, atau setuju – tidak setuju.



91 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 6 INSTRUMEN TES A.Pengertian Tes Secara sederhana tes dapat diartikan sebagai himpunan pertanyaan yang harus dijawab atau pernyataan-pernyataan yang harus dipilih atau ditanggapi, atau tugas-tugas yang harus dilakukan oleh peserta tes dengan tujuan untuk mengukur pengetahuan, keterampilan, kecerdasan, atau kemampuan suatu aspek tertentu dari peserta tes. Kata “tes” berasal dari bahasa Latin “testum”, alat untuk mengetahui kandungan-kandungan tanah. Dalam bahasa Perancis, tes adalah alat atau piring untuk menyisihkan logam mulia dari bahan-bahan lain seperti pasir, batu, tanah, dan sebagainya. Kemudian diadopsi dalam psikologi dan pendidikan untuk menjelaskan sebuah alat ukur yang dikembangkan untuk dapat melihat dan mengukur peserta tes yang memenuhi kriteria tertentu.



92 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Untuk memperoleh gambaran yang lebih jelas tentang pengertian tes, beberapa pengertian tes yang dibuat para ahli dikemukakan di bawah ini: (1) ”Test is a systematic procedure for observing a person’s behaviour and describing it with the aid of a numerical scale or a category system. Tes adalah suatu prosedur sistematik untuk mengamati tingkah laku seseorang dan mendeskripsikannya dengan menggunakan skala numerik atau sistem kategori (Cronbach , 1970). (2) “Test is a standard procedure for obtaining a sample of behavior from a specified domain” Tes adalah suatu proses baku untuk memperoleh sampel tingkah laku dari suatu ranah tertentu (Crocker dan Algina, 1986). (3) Test as a systematic procedure for measuring a sample of behavior. Tes adalah suatu prosedur sistematik yang dipakai untuk mengukur tingkah laku atau karakteristik seseorang (Brown, 1981). (4) Test is procedure in which a sample of an individual’s behavior is obtained, evaluated, and scored using standardized procedures. Tes adalah suatu prosedur dimana suatu sampel perilaku induvidu diperoleh, dievaluasi, dan diskor dengan menggunakan prosedur standar (Reynold, Livingston, & Wilson, 2010).



93 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(5) Test is defined as an instrument of systematic procedure for observing and describing one or more chaaracteristics of a student using either a numerical scale or a clasification scheme. Tes didefinisikan sebagai suatu instrumen prosedur sistematis untuk mengamati dan menggambarkan satu atau lebih karakteristik siswa yang menggunakan skala numerik atau skema klasifikasi (Nitko & Brookhart, 2007) (6) Dalam Encyclopedia of Educational Evaluation, tes diartikan; “any series of questions or exercises or other means of measuring the skill, knowledge, intelligence, capacities or aptitudes of an individual or group”.Artinya seperangkat pertanyaan atau latihan atau alat pengukur kemampuan, pengetahuan, kepandaian, kapasitas atau kecerdasan lain dari suatu kelompok atau individu (Anderson, et. al,1981). Dari pendapat-pendapat di atas dapat disimpulkan bahwa yang dimaksud dengan tes adalah prosedur yang sistematis yang terdiri atas seperangkat pertanyaan atau tugas-tugas untuk mengukur suatu perilaku tertentu pada peserta didik dengan menggunakan bantuan skala numerik atau kategori tertentu. Kata “prosedur sistematik” yang terdapat pada kelima pengertian di atas bermakna bahwa suatu tes itu harus disusun, dilaksanakan, dan diskor (diberi angka) berdasarkan aturan-aturan yang telah ditentukan 94 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



sebelumnya. Istilah “tingkah laku” berarti bahwa suatu tes itu menghendaki agar peserta didik (siswa) menunjukkan apa yang sudah diketahui dengan cara menjawab butirbutir tes atau mengerjakan tugas yang terdapat dalam tes. Melalui jawaban yang diberikan atau cara melakukan tugas-tugas, tersebut akan terungkap berbagai informasi mengenai aspek psikologis tertentu dari orang yang dikenai tes Informasi yang diperoleh selanjutnya akan dijadikan dasar untuk membuat penilaian. Selain pengertian tes sebagai prosedur sistematis, tes juga dianggap sebagai suatu alat. Karena itu tes dapat dinyatakan sebagai sejumlah pertanyaan yang harus dijawab atau serangkaian tugas yang harus dikerjakan oleh peserta tes yang hasilnya digunakan untuk mengukur perubahan tingkahlaku dari ranah tertentu. Tes adalah seperangkat pertanyaan atau tugas-tugas untuk menentukan bentuk-bentuk respon yang berkenaan dengan perilaku peserta didik yang dicari (Salvia dan Ysseldyke,1994). Pada tes hasil belajar yang diukur adalah tingkah laku ranah kognitif yaitu kemajuan belajar siswa, tingkat pemahaman dan penguasaannya terhadap cakupan materi yang dipersyaratkan dan sesuai dengan tujuan pembelajaran tertentu.



B. Tujuan Tes Terkait dengan tujuan tes dalam evaluasi pendidikan/pembelajaran banyak para ahli menjelaskan tentang tujuan dari tes. Rangkumannya antara lain yaitu: 95 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



1) Untuk mengetahui kemajuan belajar siswa setelah mengikuti kegiatan pembelajaran dalam jangka waktu tertentu. 2) Untuk mengetahui efektivitas metode pembelajaran. 3) Untuk mengetahui kedudukan siswa dalam kelompoknya. 4) Untuk memperoleh masukan atau umpan balik bagi guru dan siswa dalam rangka perbaikan. 5) Untuk mendeskripsikan kemampuan belajar siswa. 6) Untuk mengetahui tingkat keberhasilan PBM 7) Untuk menentukan tindak lanjut hasil penilaian 8) Untuk memberikan pertanggung jawaban (accountability) 9) Untuk mengetahui tingkat kemampuan siswa 10) Untuk mengukur pertumbuhan dan perkembangan siswa 11) Untukmendiagnosa kesulitan belajar siswa 12) Untuk mengetahui hasil pengajaran 13) Untuk mengetahui hasil belajar 14) Untuk mengetahui pencapaian kurikulum 15) Untuk mendorong siswa belajar 16) Untuk mendorong pendidik mengajar yang lebih baik



C. Klasifikasi Tes Tes dapat diklasifikasikan dengan beberapa macam, tergantung dari tujuannya (Anastasi dan Urbina, 1997). 1.Tes Kinerja Maksimum dan tes Kinerja Tipikal



96 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Menurut Cronbach (1970) tes dapat dibedakan dalam dua kelompok besar yaitu (1) tes yang mengukur kinerja maksimum (Maximum Performance Tests), dan (2) Tes yang mengukur kinerja tipikal (Typical Performance Tests). Tes-tes kinerja maksimal adalah tes dimana responden didorong untuk berusaha sekuat tenaga agar mendapatkan skor tertinggi. Tes inteligensi, tes bakat dan tes prestasi belajar merupakan contoh tes kinerja maksimal. Tes-tes kinerja tipikal tidak digunakan untuk mengetahui apa yang mampu dilakukan oleh seseorang tetapi untuk mengetahui apa yang cenderung dilakukan seseorang. Pada tes kinerja tipikal responden didorong untuk melaporkan secara jujur keadaan dirinya dalam variabel yang diukur. Tes-tes kepribadian, tes minat, semua skala sikap adalah termasuk dalam kelompok tes kinerja tipikal. Dalam tes-tes kinerja maksimal, jawaban subyek adalah jawaban benar atau jawaban salah, sedangkan pada tes-tes kinerja tipikal jawaban subyek adalah positif atau negatif.



2.Tes Acuan Norma dan Tes Acuan Kriteria Tes dapat dibedakan menjadi: tes acuan norma (norm-referenced test) dan tes acuan patokan (criterionreferenced test). Tes acuan norma atau sering disebut 97 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



sebagai tes acuan normatif adalah tes yang penafsiran hasilnya atas dasar kinerja relatif seseorang terhadap kinerja orang lain dalam kelompoknya..Tujuannya adalah untuk membeda-bedakan seorang individu dengan individu lainnya agar peringkat dapat dilakukan berdasarkan hasil masing-masig. Seorang guru ingin mengetahui prestasi seorang siswa dalam suatu pelajaran tertentu, misalnya pelajaran fisika, prestasi siswa itu dapat dibandingkan dengan siswa-siswa lain dalam kelasnya. Gambaran prestasi yang diperoleh demikian adalah relatif dan karenanya tes acuan norma juga dikenal sebagai tes relatif. Tes-tes acuan patokan adalah tes yang penafsiran hasilnya atas dasar kinerjanya sendiri tanpa membandingkan dengan kinerja orang lain. Pada tes acuan patokan ini hasil tes atau skor seseorang dibandingkan terhadap suatu acuan tertentu yang ditetapkan. Guru menetapkan kriteria atau standar minimum yang harus dicapai oleh setiap peserta didik. Sesudah pembelajaran, penguasaan dan prestasi siswa dalam pelajaran tersebut di tes. Keputusan hasil tes itu dibandingkan dengan kriteria yang telah ditetapkan.



3.Tes Buatan Guru dan Tes Standar Berdasarkan cara penyusunan tes, Cangelosi (1995) membedakan tes menjadi 2 macam, yaitu tes buatan guru (teacher-made test) dan tes terstandar (standardized test).



98 | Pengukuran



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Tes buatan guru (teacher-made test) adalah tes yang disusun dan dikembangkan oleh guru mata pelajaran untuk untuk keperluan pengukuran dan penilaian di kelasnya sendiri guna memperoleh informasi tentang kemajuan belajar siswanya. Efektivitas dan kualitas jenis tes ini bergantung kepada ketrampilan dan kemampuan guru dalam merancang sutu tes. Tes buatan guru ini bisa sebagai ujian kenaikan kelas, sebagai tes satuan pelajaran, atau sebagai kuis-kuis. Butir-butirnya dapat disajikan dalam bermacam format: pilihan ganda, betul-salah, jawaban singkat, melengkapi, atau soal-soal esai. Cirikhas tes ini adalah dikonstruksi oleh guru kelas untuk mengukur tujuan khusus pada kelas tertentu. Tes Standar (Standardized Test) adalah tes yang dirancang oleh ahli tes yang bekerja sebagai ahli kurikulum sekaligus sebagai guru. Tes tersebut distandarisasi dalam arti pengelolaan dan penyekoran yang dilakukan berdasarkan standar dan asumsi kondisi yang seragam sehingga hasil dari penilaian dapat dibandingkan untuk kelas atau sekolah yang berbeda. Beberapa jenis tes standar berdasarkan jenis normanya, yaitu tes inetelegensi, tes bakat, tes prestasi akademik, tes minat dan sikap serta tes kepribadian (Sax, 1980) Sax (1980) menunjukkan perbedaan antara tes buatan guru dan tes standar, adalah seperti dalam Tabel 6.1 Tabel 6.1.Perbandingan antara Tes Buatan Guru dengan tes Standar Karakteristik



Tes Buatan Guru



99 | Pengukuran



Tes Standar



& Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



1) Spesifikasi tujuan



2) Isi



3) Aturan pengelolaan dan penskoran



4) Norma



5) Penilaian tes



Tujuan tes spesifik untuk keperluan penilaian siswa suatu kelas Isi dapat diambil dari dari berbagai muatan kurikulum. Butirbutir tes dapat ditambah, dikurangi dan dimodifikasi sesuai pertimbangan guru Aturan bergantung kepada guru. Mereka dapat melakukan tes secara seragam untuk seluruh siswa, tetapi dapat juga diadaptasi sesuai dengan kondisi siswa Tidak ada norma yang menjadi acuan, tetapi norma itu dapat dikembangkan sendiri oleh guru



Tujuan tes berlaku umum untuk siswa lintas kelas atau sekolah Butir-butir soal tetap dan tidak dapat dimodifikasi, dan hany mencakup suatu muatan tertentu dari kurikulum



Aturan bergantung kepada pihak yang membuat tes (publisher), mereka menyajikan aturan dan petunjuk dalam sebuah manual



Norma dikembangkan oleh pembuat tes (publisher) untuk seluruh guru untuk membandingkan kinerja suatu kelas berdasarkan usia dan tingkatan siswa Kualitas dari tes 5 Data yang berupa kualitas dapat dinilai sendiri dari suatu hasil tes oleh guru dikeluarkan oleh pembuat tes (publisher)



D. Jenis-Jenis Tes 1. Berdasarkan Klasifikasi Psikologi Dalam psikologi, tes dapat diklasifikasikan menjadi empat jenis, yaitu: (1) tes yang mengukur intelegensi umum, (2) tes yang mengukur kemampuan khusus atau tes



100 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



bakat, (3) tes yang mengungkap aspek kepribadian (personality test) (4) tes yang mengukur prestasi. a. Tes Inteligensi Tes Inteligensi dirancang untuk mengukur kemampuan umum seseorang dalam suatu tugas. Kita akan ingat bahwa kecerdasan merupakan kemampuan untuk berpikir dan belajar dari pengalaman. Hal ini diduga tergantung pada kemampuan mewarisi dan lingkungan dimana seseorang dibesarkan. Suatu tes kecerdasan memberikan indikasi tentang kemampuan umum individu. Tes kecerdasan biasanya mencakup berbagai macam tes sebagai sampel beberapa aspek fungsi kognitif. b. Tes Bakat Tes bakat dibuat untuk mengungkap kemampuan potensial dalam bidang tertentu. Jadi, tes-tes bakat mengukur kemampuan-kemampuan khusus dan potensi untuk belajar atau melakukan tugas-tugas baru yang mungkin relevan dengan belajar atau kinerja di bidang tertentu. Oleh karena itu tes bakat berorientasi ke masa depan. Tes bakat yang digunakan untuk memprediksi kesuksesan dalam suatu program khusus disebut tes bakat khusus. Tes bakat sering juga disebut tes bakat skolastik atas tes kecerdasan bakat. Tes bakat sering digunakan untuk proses seleksi dan penempatan. Bakat-bakat yang dapat di tes seperti : bakat menulis, mekanik, musik, seni, kreativitas 101 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Contoh tes bakat adalah Ujian Masuk Bersama ke Sekolah Kejuruan. c. Tes Kepribadian Tes kepribadian yang bertujuan mengungkap karakteristik individual subjek dalam aspek yang diukur, seperti ciri-ciri cara berfikir, merasakan atau berperilaku Beberapa tes kepribadian mengukur sikap, yaitu cara seseorang menanggapi orang lain, benda, atau situasi secara emosional atau secara rasional. Beberapa tes kepribadian mengukur minat, misalnya minat terhadap pekerjaan. Tes kepribadian yang lain didesain untuk mengukur keadaan emosional seseorang, atau mengukur pola perilaku yang menyimpang atau abnormal dan menunjukkan penyimpangan psikologis. d. Tes Hasil Belajar (Achievement Test) Tes hasil belajar dimaksudkan tes yang digunakan untuk mengevaluasi hal yang telah diperoleh dalam suatu kegiatan. Menurut Brown (2004) tes hasil belajar merupakan “a test to see how far students achieve materials addressed in a curriculum within a particular time frame”. Suatu tes untuk mengetahui (mengungkap) seberapa jauh siswa-siswa telah menguasai materi yang ditentukan dalam kurikulum pada kurun waktu tertentu. Tes hasil belajar adalah berkaitan dengan tujuan pengajaran, yaitu apa yang telah diajarkan. Tes ini bertujuan untuk mengetahui (1) sejauhmana siswa menguasai materi pelajaran yang telah diajarkan, (2) kualitas atau tingkatan yang dicapai, (3) perubahan dan 102 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



kemajuan pembelajaran, dan (4) keefektifan strategi pengajaran. Menurut Azwar (2010), tes ini bertujuan untuk mengukur prestasi atau hasil yang dicapai siswa dalam belajar Tes hasil belajar biasanya terdiri dari sejumlah butir soal yang memiliki tingkat kesukaran bervariasi, mudah, sedang, dan sukar. Tes hasil belajar disusun secara terencana untuk mengungkap kemampuan siswa dalam menguasai materi-materi yang yang telah diajarkan.. Tes hasil belajar berisi butir pertanyaan atau tugas untuk mengukur apakah pengetahuan atau keterampilan yang telah dipelajari/dimiliki siswa dapat ditampilkan dan dikuasai siswa secara baik.. Gronlund (1976) menyatakan bahwa tes prestasi berfungsi sebagai alat untuk penempatan, fungsi formatif, fungsi diagnostik dan fungsi sumatif. Tes Penempatan: adalah tes yang diselenggarakan menjelang dimulainya suatu program pengajaran, dengan maksud untuk menempatkan seseorang pada kelompok yang sesuai dengan tingkat kemampuan yang dimilikinya. Tes Formatif: adalah tes untuk mendapatkan informasi tentang kemajuan siswa. Tujuan tes ini adalah untuk mengukur penguasaan siswa terhadap pokok bahasan atau topik tertentu.Tes ini dapat dilakukan melalui kuis-kuis atau tes pokok bahasan. Tes formatif dilakukan pada setiap periode waktu tertentu dan digunakan untuk memonitor kemajuan siswa (Silverius, 1991). Tes Diagnostik: adalah tes yang dilaksanakan untuk mendiagnosis atau mengidentifikasi kesukarankesukaran dalam belajar, mendeteksi faktor-faktor yang 103 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



menyebabkan terjadinya kesukaran belajar yang dihadapi siswa, dan menetapkan cara mengatasi kesukaran atau kesulitan belajar tersebut. Hasil tes diagnostik dapat digunakan sebagai dasar penyelenggaraan pengajaran yang lebih sesuai dengan kemampuan siswa sebenarnya, termasuk kesulitan-kesulitan belajarnya. Tes Sumatif: adalah tes untuk mengetahui hasil pengajaran secara keseluruhan. Karena tes ini menekankan pada hasil pengajaran secara keseluruhan, maka butir tesnya meliputi seluruh materi yang telah disampaikan. Lazimnya, tes sumatif diberikan di akhir suatu pelajaran, atau akhir semester. Hasilnya untuk menentukan keberhasilan siswa. Tingkat keberhasilan dinyatakan dengan skor atau nilai, pemberian sertifikat, dan sejenisnya.



2. Berdasarkan Cara Mengerjakan Berdasarkan cara pelaksanaannya tes dapat dibagi menjadi tiga jenis, yaitu (1) Tes lisan (oral test), (2) Tes Tertulis (written test), dan (3) Tes perbuatan (skill test atau performance test. (1)Tes lisan: adalah tes yang pelaksanaanya dilakukan dengan mengadakan tanya jawab secara langsung antara pendidik dan peserta didik (berbentuk tanya jawab secara tatap muka). Tes lisan pada umumnya digunakan untuk mengevaluasi hasil belajar dalam bentuk kemampuan dalam mengemukakan ide-ide dan pendapat-pendapatnya secara lisan Tes lisan memiliki kelebihan dan kelemahan. 104 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Kelebihannya adalah: (a) dapat menilai kemampuan dan tingkat pengetahuan yang dimiliki peserta didik, sikap, serta kepribadiannya karena dilakukan secara berhadapan langsung; (b) bagi peserta didik yang kemampuan berpikirnya relatif lambat sehingga sering mengalami kesukaran dalam memahami pernyataan soal, tes bentuk ini dapat menolong sebab peserta didik dapat menanyakan langsung kejelasan pertanyaan yang dimaksud; (c) hasil tes dapat langsung diketahui peserta didik. Kelemahannya adalah (a) subjektivitas pendidik sering mencemari hasil tes, (b) waktu pelaksanaan yang diperlukan relatif cukup lama. (2)Tes tertulis: adalah tes yang dilakukan secara tertulis baik soal maupun jawabannya. Pada tes tertulis soal‐ soalnya harus dijawab peserta didik dengan memberikan jawaban tertulis. Tes yang disampaikan secara lisan dan dikerjakan atau dijawab secara tertulis masih digolongkan ke dalam jenis tes tertulis. Ujian tertulis ini biasanya dilakukan secara berkelompok dengan mengambil tempat di suatu ruangan tertentu. (3)Tes perbuatan: Tes yang penugasannya disampaikan dalam bentuk lisan atau tertulis dan pelaksanaan tugasnya dinyatakan dengan perbuatan atau unjuk kerja. Menurut Winkel (1983) Tes perbuatan adalah “tes yang persoalan atau pertanyaan disampaikan dalam bentuk tugas yang harus dikerjakan oleh peserta didik. Alat yang dapat digunakan tes ini adalah berupa observasi atau



105 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



pengamatan terhadap tingkah laku tersebut, yang hasilnya kemudian diserahkan pada guru”. Alat yang dapat digunakan untuk melakukan tes ini adalah lembar pengamatan atau lembar observasi terhadap tingkah laku tersebut Tes bentuk perbuatan ini pada umumnya dapat digunakan untuk menilai proses maupun hasil (produk) dari suatu kegiatan praktik. Untuk tes perbuatan yang sifatnya individual, sebaiknya menggunakan format pengamatan individual. Untuk tes perbuatan yang dilaksanakan secara kelompok digunakan format tertentu yang sudah disesuaikan untuk keperluan pengamatan kelompok. Selain itu, Heaton (1988) membagi jenis tes menjadi 4 bagian utama, yaitu: (1) tes hasil belajar (achievement test), (2) tes penguasaan (proficiency test), (3) tes bakat (aptitude test), dan (4) tes diagnostik (diagnostic test).



E. Bentuk-Bentuk Tes Hasil Belajar Tes yang merupakan salah satu alat ukur hasil belajar memiliki berbagai bentuk. Wiersma dan Jurs (1990) menyatakan bahwa terdapat dua bentuk utama butir tes, yang disebut tes objektif dan esai, yang masing-masing memiliki format yang bervariasi. Gronlund (1976) menyatakan “The items used in classroom tests are typically divided into two general categories: (1) the objective item which is highly structured and requires the pupil to suplply a word or two or to select the correct answer from among a limited number of alternatives, and (2) the essay question 106 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



which permits the pupil to select, organize, and present his essay form. Tes yang digunakan dalam ruang kelas (tes hasil belajar) secara umum dibagi menjadi dua kategori, yaitu: 1) butir objektif yang terstruktur dan meminta siswa untuk mengisi satu atau dua kata atau memilih jawaban benar dari sejumlah pilihan, dan 2) pertanyaan esai (uraian) yang memungkinkan siswa untuk memilih, mengatur, dan menyajikan bentuk uraiannya.



F. Keterbatasan Tes Sebagai Alat Ukur Keterbatasan tes sebagai alat ukur muncul karena langkah-langkah mengukur atribut itu dilakukan secara tidak langsung. Oleh karena keakuratan informasi yang diperoleh dari hasil tes tergantung pada keterwakilan dan kecukupan sampel butir-butir tes terhadap perilaku yang terkait dengan atribut. Dengan kata lain, tes sebagai alat ukur harus memiliki sampel yang representatif dari butirbutir yang mengukur semua dan apa yang ingin diukur. Selain itu, tidak seperti pengukuran fisik, instrumen atau alat ukur tes tidak mutlak. Nilai nyata dari skor 0 persen tidak berarti bahwa peserta didik memiliki prestasi nol dan karena itu tidak belajar apa-apa. Kita telah mengetahui bahwa seorang siswa yang memiliki skor 60 dalam tes tertentu memiliki kemampuan lebih daripada yang siswa lain yang memiliki skor 30. Namun, kita mengetahui seberapa besar lebuhnya itu. Oleh karena itu, skor-skor tes perlu diinterpretasikan dengan hati-hati.



107 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



G. Fungsi Tes 1. Sebagai alat untuk mengukur hasil belajar siswa. Sebuah tes dapat digunakan untuk mengetahui sejauh mana materi ajar telah dikuasai oleh siswa. Misalnya, jika guru mengajar topik tertentu di kelas, pada akhirnya guru memberikan tes dan banyak siswa memperoleh skor yang tinggi. Ini merupakan indikasi bahwa mereka telah memahami topik dengan sangat baik.Tetapi jika skor mereka yang sangat rendah, ini menunjukkan bahwa usaha kita sia-sia. Karenanya, kita perlu melakukan pembelajaran yang lebih baik. Hasil tes inilah yang akan membantu guru memutuskan apakah akan melanjutkan ke topik berikutnya atau mengulang topik yang sama.



2. Sebagai motivator dalam pembelajaran. Menurut Ebel (1991), bahwa tes kadang-kadang dapat dianggap sebagai motivator dari luar diri (ekstrinsik). Pengalaman menunjukkan bahwa para siswa akan lebih giat belajar jika mengetahui bahwa diakhir program nanti akan dilakukan tes. Tanpa tes, akan banyak siswa yang enggan untuk belajar secara mandiri, sementara beberapa siswa lainnya berkemungkinan kurang memberi perhatian saat guru sedang mengajar. Kita dapat membayangkan jika ada guru yang tidak memberikan tes maka hal itu sama seperti siswa mendengarkan khutbah di masjid. 108 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



3. Sebagai upaya perbaikan kualitas pembelajaran. Melalui penggunaan tes penempatan, tes diagnostik, dan tes formatif dapat memperbaiki kualitas pembelajaran, 4. Sebagai penentu berhasil atau tidaknya siswa sebagai syarat untuk melanjutkan pendidikan ke jenjang yang lebih tinggi dengan melaksanakan tes sumatif



H. Karakteristik Tes yang Baik Sebuah tes dikatakan tes yang baik jika tes tersebut memiliki ciri-ciri antara lain memiliki validitas, reliabilitas, objektivitas, praktikabilitas, dan ekonomis. 1. Memiliki validitas. Tes dikatakan memiliki validitas jika tes tersebut dengan secara tepat, secara benar, secara shahih, atau secara absah dapat mengukur apa yang seharusnya diukur, yaitu mengukur hasil belajar yang telah dicapai oleh siswa setelah mereka menempuh proses belajar mengajar dalam jangka waktu tertentu. 2. Memiliki reliabilitas. Tes dikatakan memiliki reliabilitas jika hasil-hasil pengukuran yang dilakukan dengan menggunakan tes tersebut secara berulang kali terhadap subjek yang sama, menunjukkan hasil yang tetap atau sifatnya ajeg dan stabil. 3. Memiliki objektivitas. Tes dikatakan memiliki objektivitas jika tes tersebut disusun dan dilaksanakan menurut tujuan instruksional khusus yang telah ditentukan, bukan atas kemauan dan kehendak dari tester, serta dalam pemberian skor 109 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



dan penentuan nilai harus terhindar dari unsurunsur subjektivitas tester. 4. Memiliki praktikabilitas. Tes dikatakan memiliki praktikabilitas jika tes tersebut praktis (mudah dilaksanakan, mudah pemeriksaannya, dan dilengkapi dengan petunjuk-petunjuk yang jelas) dan mudah mudah pengadministrasiannya. 5. Memiliki ekonomis. Tes dikatakan memiliki ekonomis jika pelaksanaan tes tersebut tidak membutuhkan ongkos/biaya yang mahal, tenaga banyak, dan waktu yang lama Selain ciri-ciri tersebut , masih ada ciri tambahan agar tes dapat dipandang sebagai tes yang baik, yaitu: mudah dilaksanakan dan mudah untuk diskor (Basuki dan Hariyanto, 2014).



110 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 7 111 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BENTUK TES HASIL BELAJAR A. Tes Objektif 1.Pengertian Tes Objektif Nelson (1970) menyatakan “The objective test is highly structured. The examinee is presented with items for which he must select answers from the alternatives given rather than construct the answers himself”, tes objektif adalah tes yang sangat terstruktur. Peserta tes disajikan dengan butir-butir dimana mereka harus memilih jawaban dari pilihan-pilihan yang diberikan tanpa menyusun jwaban sendiri. Pengertian kata “objektif” di sini dimaksudkan bahwa tes jenis ini, objektif dilihat dari sistem penskorannya, artinya siapa saja yang memeriksa lembar jawaban tes akan menghasilkan skor yang sama. Jadi, tes objektif adalah tes yang sistem penskorannya objektif. Tes objektif merupakan perangkat tes yang butir-butir soalnya mengandung alternatif jawaban yang harus dipilih oleh peserta tes. Alternatif jawaban telah disediakan oleh pembuat butir soal. Peserta tes diminta memilih jawaban dari alternatif jawaban yang telah disediakan. Karenanya, pemberian skor terhadap jawaban soal dapat dilakukan secara objektif oleh pemeriksa. (Hopkins dan Antes, 1989) mengemukakan bahwa dalam butir soal objektif, pemeriksaan tes tidak memberikan penilaian tentang mutu 112 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



jawaban siswa, tetapi hanya mencocokkan jawaban siswa dengan kunci jawaban Tes objektif mempunyai beberapa keunggulan yang dapat digunakan dalam pembelajaran di sekolah. Pertama, tes objektif itu singkat dan siswa tidak perlu menulis banyak dalam menjawab. Kedua, materi dan tujuan pengajaran dapat terwakili dengan baik. Ketiga, tes objektif adalah reliabel. Keempat, tes objektif dapat digunakan pada kelas dengan jumlah siswa yang banyak, dan dalam melakukan penyekoran dapat akurat, hanya menggunakan kunci jawaban yang dapat dilakukan oleh orang atau mesin (Brown dan Thornton, 1971). Tes objektif digunakan untuk mengevaluasi hasil belajar berupa kemampuan-kemampuan: a) b) c) d) e) f)



Mengingat dan mengenal kembali fakta-fakta Memahami hubungan antara dua hal atau lebih Mengaplikasikanprinsip-prinsip Menganalisis Mengsintesis mengevaluasi



2. Kelebihan Tes Objektif  Tes objektif meningkatkan skor jawaban siswa pada butir-butir tes karena penskoran tidak dipengaruhi oleh bias penskor ketika penskoran dilakukan tetapi oleh kebenaran jawabannya.  Penskoran tes objektif adalah mudah dan membutuhkan sedikit waktu. Penskoran juga dapat



113 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd























dilakukan oleh komputer dan memberikan efesiensi yang tinggi bagi besar peserta tes. Hasil tes objektif terutama tes pilihan ganda dapat digunakan untuk tujuan diagnostik karena tes objektif dapat memberi petunjuk terhadap kesalahan-kesalahan faktual dan kesalah pahaman yang memerlukan perbaikan. Untuk pengambilan sampel materi pada tes objektif adalah cukup karena lebih representatif mewakili isi materi dan luas bahan karena memungkinkan jumlahnya butirnya yang banyak Hasilnya memberikan kemampuan peserta tes lebih valid dan reliabel. Tes objektif efisien untuk mengukur pengetahuan tentang fakta-fakta. Tes objektif dapat juga dirancang untuk mengukur pemahamn, ketrerampilan berpikir dan hasil-hasil belajar kompleks lainnya. Butir tes objektif dapat menjadi sebagai pretes (tes awal), disempurnakan melalui analisis butir, dibakukan, dan digunakan kembali beberapa kali jika ditangani dengan benar. Tes objektif adalah adil untuk semua peserta tes karena tidak bertugas pada keterampilan lain di luar keterampilan yang dimaksudkan untuk mengukur. Artinya validitasnya tidak dipengaruhi oleh tulisan tangan yang baik, atau banyak kata-kata yang tidak berguna.



3. Kelemahan Tes Objektif 114 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd















 



Tes objektif tidak mendorong pengembangan peserta tes dalam keterampilan yang diinginkan seperti kemampuan untuk memilih, mengatur atau mensitesiskan ide-ide dan menyajikannya secara benar dalam bentuk logis dan koheren. Tes objektif cenderung mengukur hanya pengetahuan faktual. Kelemahan ini dapat diatasi dengan mengembangkan butir-butir untuk butir objektif secara ketat beradasarkan langkah-langkah yang terlibat dalam proses pengembangan butir. Pengembangan butir tes objektif yang baik memerlukan pelatihan pengembang tes dalam keterampilan yang diperlukan untuk mengkonstruksi efektif, butir yang valid dan relaibel. Tes objektif membutuhkan waktu, komitmen dan perencanaan yang memadai Butir tes objektif memberi kemungkinan untuk menebak terutama ketika butir tes tidak terampil dikembangkan. Seorang peserta tes dapat menebak dengan benar pada beberapa butir dan mendapatkan angka tidak layak bahkan dalam tes objektif yang dikonstruk secara baik. Adalah lebih mudah untuk menipu dalam tes objektif daripada tes esai jika tes ini kurang dikelola.



4. Klasifikasi Tes Objektif Menurut Gronlund dan Linn (1990) tes objektif dapat diklasifikasikan menjadi dua jenis, yaitu (1) soal



115 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



dengan respon pilihan (Selected Response Items) dan (2) soal dengan respon isian (Supply Response Items) 4.1.Jenis Respon Pilihan Tes respon pilihan (Selected Response Items) adalah jenis tes di mana peserta tes memilih jawaban yang paling sesuai atau pilihan yang benar. Adapun yang termasuk dalam kelompok ini adalah tes benar-salah, tes menjodohkan, dan tes pilihan ganda a. Tes Benar- Salah Tes bentuk benar-salah (true-false) terdiri dari sebuah pernyataan atau proposisi yang harus dinilai oleh peserta tes atau siswa dan kemudian memberi tanda, apakah benar atau salah. Dalam tes ini pernyataan disajikan kepada peserta tes dan ia diminta untuk menyatakan apakah pernyataan itu Benar atau Salah, Ya atau Tidak, Setuju atau Tidak Setuju, dan sebagainya. Kelebihan tes benar-salah: (1) Sangat mudah untuk mengkonstruksi butir respon pilihan (alternatif) namun validitas dan reliabilitas butir tersebut bergantung pada keterampilan para pengkonstruk butir. Untuk mengkonstruk butir respon pilihan tidak ambigu, yang mengukur hasil belajar signifikan, memerlukan banyak keahlian.(2) Sejumlah besar butir respon pilihan mencakup materi sampel yang luas dapat diperoleh dan peserta tes dapat meresponnya



116 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



dalam jangka waktu yang singkat. (3) penilaiannya objektif. Kelemahan tes benar-salah: (1) Tes ini membutuhkan materi pelajaran yang dapat diutarakan sehingga pernyataan tersebut benar atau salah tanpa batasan atau pengecualian seperti dalam ilmu sosial. (2) Tes ini terbatas untuk hasil belajar dalam bidang pengetahuan saja kecuali untuk membedakan antara fakta dan pendapat atau mengidentifikasi hubungan penyebab dan akibat.(3) Tes ini rentan terhadap menebak dengan peluang benarnya adalah 50%. (4) Apabila jumlah butir soalnya sedikit, indeks daya pembeda butir soal cenderung rendah. Ada enam variasi tes benar-salah yaitu: benar-salah (true-false), ya-tidak (yes-no), betulsalah (right-wrong), pembetulan atau koreksi (correction),pilihan benar-salah jamak (multiple true-false), dan ya-tidak dengan penjelasan (yes-no with explanation). Nitko (1996) mengemukakan Variasi ”benar-salah” berbentuk proposisi yang harus dinilai oleh peserta didik, apakah penyataan itu benar atau salah. Variasi bentuk “ya-tidak” menanyakan pertanyaan langsung, terhadap mana peserta didik menjawab atau tidak. Pada variasi bentuk ”betul-salah,” dikemukakan perhitungan, persamaan, atau kalimat yang harus dinilai oleh peserta didik apakah betul atau tidak betul. Variasi bentuk “koreksi atau pembetulan,” meminta kepada peserta didik untuk menilai sebuah proposisi, 117 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



seperti pada bentuk benar-salah, tetapi peserta didik juga diminta untuk memperbaiki atau mengoreksi setiap pernyataan yang salah dan membetulkannya. Variasi bentuk pilihan “benarsalah” tampaknya sama dengan butir pilihan ganda, malahan pada saat memilih satu opsi yang benar, peserta didik memperlakukan tiap opsi sebagai suatu pernyataan “benar-salah” yang terpisah, yakni lebih dari satu pilihan bisa benar. Sedangkan pada variasi “ya-tidak” dengan penjelasan, menanyakan pertanyaan langsung dan meminta peserta didik untuk menjawab “ya” atau “tidak,” dan dijelaskan mengapa pilihannya benar. Penggunaan tes Benar-Salah: (1) Jenis tes ini umumnya digunakan untuk mengukur kemampuan mengidentifikasi kebenaran dari pernyataan fakta, definisi istilah, pernyataan prinsip-prinsip dan hasil pembelajaran yang relatif sederhana. (2) Juga digunakan untuk mengukur kemampuan membedakan fakta dari pendapat, tahyul dari keyakinan ilmiah. (3) Tes ini paling baik digunakan untuk mengukur kemampuan mengenali hubungan-hubungan penyebab-dan-akibat. (4) Tes ini paling baik digunakan dalam situasi dimana hanya ada dua kemungkinan pilihan seperti benar atau salah, lebih atau kurang, dan sebagainya, dan /(5) Tes jenis ini berguna ketika sejumlah besar materi pembelajaran harus segera diuji b. Tes Menjodohkan 118 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Tes menjodohkan adalah tes yang terdiri dari dua kelompok. Kelompok pertama berisi kata-kata pertanyaan, di mana kata-kata ini memiliki jodoh atau pasangan pada kelompok kedua. Tugas peserta tes atau siswa ialah menjodohkan masing-masing kata atau pertanyaan tersebut dari kelompok satu dan kelompok ke dua. Bentuk soal menjodohkan terdiri atas sub kelompok pernyataan yang pararel. Kedua kelompok pernyataan ini berada dalam satu kesatuan. Kelompok sebelah kiri merupakan bagian yang berisi soal dan kelompok sebelah kanan berisi jawabannya. Jumlah jawaban dibuat lebih banyak dari jumlah soal. Kelebihan tes menjodohkan adalah: (1) Tes menjodohkan bentuknya yang kompak dan dapat mengukur sejumlah besar hasil belajar yang berkaitan dengan fakta-fakta, dan mudah menyusunnya.terdiri Bentuk rapi ini memungkinkan untuk mengukur sejumlah besar materi faktual yang terkait dalam waktu yang relatif singkat.(2) Tes menjodohkan memungkinkan pengambilan sampel isi materi yang banyak, yang menghasilkan validitas isi yang relatif lebih tinggi.(3) Faktor menebak dapat dikontrol jika terampil dalam mengkonstruksi butir seperti respon benar setiap stimulus harus berfungsi (4) Penskorannya sederhana dan objektif, serta dapat dilakukan dengan komputer



119 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Kelemahan tes menjodohkan adalah: 1) sukar mengukur proses mental yang tinggi, 2) siswa cenderung untuk membuat tafsirantafsiran, 3) kemungkinan menebak relative tinggi. Penggunaan tes menjodohkan: 1) Tes ini digunakan ketika hasil pembelajaran menekankan pada kemampuan untuk mengidentifikasi hubungan diantara hal-hal dan sejumlah stimulus yang homogen dan respon yang dapat diperoleh, 2) Pada dasarnya digunakan untuk menghubungkan dua hal yang memiliki dasar logis untuk digabungkan, 3) Tes ini memadai untuk mengukur pengetahuan faktual seperti pengujian pengetahuan istilah, definisi, tanggal, peristiwa, petunjuk ke peta serta diagramdiagram. c. Tes Pilihan Ganda Thorndike dan Hagen (1977) menyatakan:”the multiple choice item consists of two parts: the stem which presents the problem, and the list of possible answers or options. In the standard from of the item, one of the options is the correct or the best answer and the others are misleads or foils or distractors.



120 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Soal pilihan ganda adalah bentuk soal yang konstruksinya terdiri atas dua bagian yaitu pokok soal (stem) dan alternatif jawaban (option). Satu di antara alternatif jawaban tersebut adalah jawaban benar atau yang paling benar (kunci jawaban), sedangkan alternatif jawaban yang lain berfungsi sebagai pengecoh (distractor).



Stem Item atau Butir Soal



Distractor Option Kunci



Pokok soal dapat dibuat dalam dua bentuk, yaitu pokok soal dalam bentuk pertanyaan tidak selesai atau dalam bentuk kalimat tanya. Jumlah alternatif jawaban yang dibuat biasanya empat atau lima. Hal ini senada dengan pendapat Thorndike dan Hagen (1977)” an item must have at least 3 answer choices to be classified as a multiple choice itemand typical pattern is to have 4 or 5 answe”. Semakin banyak alternatif jawaban yang dibuat, maka probabilitas siswa untuk menebak jawaban semakin kecil. Tata tulis tes pilihan ganda adalah sebagai berikut (Kemdikbud, 2010).



121 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(1) Jika pokok soal (stem) ditulis dengan kalimat tidak selesai, maka awal kalimat ditulis dengan huruf besar dan awal option ditulis dengan huruf kecil, dan pada akhir kalimat disertai dengan empat buah titik. Perhatikan struktur tes pilihan ganda berikut: ----------------------------------------------------------------------------------------------------------------------------------------Pokok Soal ------------------------------------------.... -----------------------------* Kunci jawaban ----------------------------- Pengecoh ----------------------------- Pengecoh ---------------------------- Pengecoh (2) Jika pokok kalimat ditulis dengan kalimat tanya, maka awal kalimat ditulis dengan huruf kapital dan akhir kalimat diberi tanda tanya. Setiap awal option dimulaii dengan huruf kapital dan diakhiri dengan tanda titik.



Perhatikan struktur tes pilihan ganda berikut: ----------------------------------------------------------------------------------------------------------------------------------------Pokok Soal ------------------------------------------? ----------------------------- .* Kunci jawaban -----------------------------. Pengecoh 122 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



-----------------------------. Pengecoh ----------------------------. Pengecoh Petunjuk menulis soal pilihan ganda: Mengkonstruksi butir soal pilihan ganda yang baik membutuhkan waktu yang cukup untuk menulis, menelaah, dan merevisinya. Sebaiknya kita menulis (mencicil) beberapa soal setiap hari ketika materi masih segar dalam ingatan setelah mengajar, dibandingkan dengan menulis soal sekaligus setelah selesai (di akhir ) penyajian materi. Menulis Stem: Stem dari butir soal pilihan ganda memiliki suatu masalah atau menyatakan sebuah pertanyaan. Aturan mendasar pada penulisan stem bahwa siswa harus memahami pertanyaan tanpa harus membaca beberapa kali dan tanpa membaca semua pilihan (option). Menulis Respons (tanggapan): Soal-soal pilihan ganda biasanya mempunyai empat atau lima pilihan (option) untuk membuatnya sukar bagi siswa dalam menebak jawaban yang benar. Aturan mendasar untuk penulisan respons (tanggapan) adalah (a) siswa harus dapat memilih respons yang tepat tanpa harus memilah-milah kerumitan yang tidak ada hubungannya dengan mengetahui jawaban yang benar, dan (b) mereka



123 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



tidak harus mampu menebak jawaban yang benar dari cara respons tersebut ditulis. Penggunaan tes Pilihan Ganda: (1) Tes pilihan ganda merupakan bentuk tes yang paling banyak digunakan dari bentuk tes yang ada. Tes ini dapat digunakan untuk mengukur berbagai hasil pembelajaran dari yang sederhana hingga ke yang kompleks, (2) Tes pilihan ganda dapat disesuaikan dengan materi dan tujuan pembelajaran pada tingkat-tingkat pengetahuan dan pemahaman. (3) Tes pilihan ganda dapat digunakan untuk mengukur hasil-hasil pengetahuan yang berkaitan dengan kosa kata, fakta, prinsip, metode dan prosedur dan juga aspek-aspek pemahaman yang berhubungan dengan penafsiran fakta-fakta, prinsip-prinsip dan metode-metode, (4) Kebanyakan dari tes-tes prestasi dan bakat yang standar dikembangkan secara komersil menggunakan jenis tes pilihan ganda. Tes pilihan ganda dapat digunakan untuk mengukur pengetahuan, ingatan dan juga pemikiran tingkat tinggi. Haladyna (1999) mengemukakan bahwa pertanyaan-pertanyaan pilihan ganda dapat mengukur empat jenis isi (fakta, konsep, prinsip, dan prosedur) dan lima jenis perilaku kognitif (mengingat, memahami, memprediksi, mengevaluasi, dan menyelesaikan masalah). Kelebihan tes Pilihan Ganda: 124 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(1) Tes pilihan ganda adalah penerapannya yang luas dalam pengukuran bermacam-macam fase pencapaian, (2) Tes pilihan ganda berguna dalam mendiagnosis dan memungkinkan membedakan diantara peserta tes berdasarkan apa yang sedang diukur yang dimiliki mereka, (3) Dapat mengukur berbagai jenjang kognitif (dari ingatan sampai dengan evaluasi (4) Tes pilihan ganda dapat diskor dengan computer Kekurangan Tes Pilihan Ganda: (1) Memerlukan waktu yang relatif lama untuk menulis soalnya; (2) Sulit membuat pengecoh yang homogen dan berfungsi ;(3) Terdapat peluang untuk menebak kunci jawaban. (4) Tes pilihan ganda membutuhkan waktu respon yang lebih lama dari pada tes objektif jenis lain Ragam Tes Pilihan Ganda Ragam tes pilihan ganda dapat dibedakan atas: 1) Ragam Tes Pilihan Ganda menurut soalnya, dan 2) Ragam Tes Pilihan Ganda menurut jawabannya.



Ragam Tes Pilihan Ganda menurut soalnya: Terdapat 5 (lima) ragam soal pilihan ganda berdasarkan soalnya yaitu: (1) pilihan ganda biasa (melengkapi pilihan), (2) pilihan ganda asosiasi, (3) 125 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



pilihan ganda analisis hubungan atau sebab akbiat, (4) Pilihan ganda analisis kasus, dan (5) pilihan ganda membaca diagram, grafik, tabel. Penggunaan kelima ragam itu memungkinkan soal pilihan ganda dapat mengukur aspek kognitif tingkat tinggi (analisis, sintesis, dan evaluasi). (1) Tes pilihan ganda melengkapi pilihan. Soal tes pilihan ganda jenis ini terdiri dari pokok soal (stem) yang berupa pernyataan yang belum lengkap atau suatu pertanyaan yang dilengkapi dengan 4 atau 5 kemungkinan jawaban yang disebut option. Tugas siswa adalah memilih jawaban yang benar (sesuai kunci). Ragam ini paling banyak digunakan. Kekeliruan penggunaan ragam ini umumnya pada segi kaidah bahasa dan penempatan pilihan (option). Petunjuk: Pililah satu jawaban yang tepat pada soal di bawah ini dengan memberi tanda silang (X) pada huruf dilembaran jawaban Contoh soal: Untuk pembelajaran yang menuntut pencapaian kompetensi tertentu sebagaimana diharapkan dan termuat pada kurikulum saat ini, maka lebih tepat menggunakan…. 126 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



A. Penilaian Acuan Normatif B. Penilaian Acuan Patokan C. Penilaian Berbasis Kelas D. Penilaian Berbasis Kompetensi (2) Tes pilihan ganda asosiasi. Tes jenis ini merupakan modifikasi dari tes pilihan ganda biasa. Bentuk asosiasi juga terdiri dari satu pernyataan dan beberapa alternatif jawaban, hanya saja terdapat lebih dari satu jawaban yang benar. Soal dengan ragam asosiasi ini mengharuskan siswa berpikir lebih komprehensif sebab pilihan jawaban yang benar bisa 3, 2, 1 atau semua salah. Petunjuk:: Pilihlah: A. Jika (1), (2), dan (3) betul; B. Jika (1) dan (3) betul; C. Jika (2) dan (4) betul; D. Jika hanya (4) yang betul. Contoh soal: Kegiatan evaluasi terdiri dari: (1) mengukur (2) menilai (3) memberikan hasil (4) persiapan 127 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(3)Tes pilihan ganda hubungan antar hal atau sebab akibat Tes soal ini memuat pernyataan dan alasan, dengan pola memuat pernyataan dan memuat alasan. Soal pilihan ganda jenis ini terdiri dari 2 kalimat pernyataan, yang dihubungkan dengan kata SEBAB. Kedua kalimat bisa merupakan sebab akibat, bisa juga keduanya benar tetapi tidak berhubungan, bisa salah satu benar, dan bisa juga keduanya salah. Petunjuk: Pada soal berikut terdapat kalimat-kalimat yang terdiri atas pernyataan yang diikuti alasan Pilihlah: A. Jika pernyataan benar, alasan benar, dan ada hubungan sebab akibat B. Jika pernyataan benar, alasan benar, dan tidak ada hubungan sebab akibat C. Jika pernyataan benar, alasan salah D. Jika pernyataan salah, dan alasan salah E. Baik pernyataan maupun alasan salah



128 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Contoh soal: Motivasi adalah salah satu seni penting yang harus dikuasai oleh orang pimpinan SEBAB Kemampuan memotivasi bawahan adalah salah satu cara untuk mendapatkan sumberdaya manusia yang mau dan mampu bekerja (4) Tes pilihan ganda tinjauan atau analisis kasus. Bentuk tes soall tinjauan/ analisis kasus sama dengan ragam butir 1 (melengkapi atau menjawab pertanyaan), hanya isi yang terkandung dalam pokok soal berupa kasus. Peristiwa khusus, hasil kerja di laboratorium, atau kejadian di sekitar kita dapat dijadikan kasus. Petunjuk: Untuk soal berikut disediakan suatu teks yang harus dipahami secara cermat. Kemudian menyusul soal yang memasalahkan hal-hal yang berhubungan dengan isi teks. Pilihlah satu jawaban yang paling tepat pada soal yang mengiringi teks.



129 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Contoh soal: Sebuah benda digantung dengan pegas, dengan h adalah tinggi benda dari tanah. Bila sekarang benda itu ditarik sedikit ke bawah, kemudian dilepaskan, benda itu akan berayun naik turun secara harmonic dengan frekuensi ayunan per detik. Ayunan benda itu disebabkan oleh: A. Tarikan searah dari pegas B. Tarikan searah dari gravitasi C. Interaksi antara pegas dan gaya gesekan udara D. Interaksiantara gaya gravitasi dan gaya gesekan udara (5) Tes pilihan ganda analisis diagram, grafik, tabel. Bentuk tes soal ini disajikan berupa diagram, gambar, grafik atau tabel. Ragam tes pilihan ganda ini dapat mengukur aspek berpikir lebih tinggi. Petunjuk: Dalam menjawab soal berikut ini hendaknya digunakan table serta data yang ada di dalamnya. Contoh:



130 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Tabel di bawah ini menggambarkan rata-rata suhu dan curah hujan di kota X selama 10 bulan Januari s.d Oktober)



Udara



Jan



Feb



Mar



Apr



Mei



Jun



Jul



Ag t



Sep



Okt



Suhu udara (oC)



28,9



29,9



31,3



29,9



29,1



28,6



27,9



28 ,1



28,9



28,7



Curah Hujan (mm)



1,0



0,0 0,0 4,0



23,0



86,0



27,0



2,0 1, 0



42,0



Adopsi dari Zainul & Nasution, 2005.



Pertanyaan: Manakah yang benar untuk kota X ? A. Bulan yang terpanas suhu udaranya adalah bulan yang sedikit curah hujannya B. Setiap bulan selalu turun hujan di kota X C. Terjadi dua kali musim hujan dalam selam 10 bulan di kota X D. Waktu yang paling baik untuk menanam padi di kota X adalah pada bulan Juni 2) Ragam Tes Pilihan Ganda menurut jawabannya. Ada tujuh (tujuh) ragam soal pilihan ganda berdasarkan jawabannya yaitu: (1) jawaban yang benar; (2) jawaban yang paling tepat/baik; (3) banyak jawaban yang benar; (4) jawaban sebagai isian; dan (5) pengecualian negatf.



131 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(1) Jawaban yang Benar. Salah satu dari optionnya mutlak benar, sementara yang lainnya mutlak salah. Contoh: Siapakah yang menemukan telepon ? A. Edison B. Bell C. Morse D. Marconi (2) Jawaban yang paling tepat/Baik. Kemungkinan jawaban mempunyai tingkat kebenaran yang berbeda.Yang paling tinggi tingkat kebenarannya adalah yang paling benar Contoh: Jenis tes yang digunakan untuk mengukur pembelajaran sekolah disebut : A. Sebuah tes diagnostik . B. Sebuah tes kemampuan . C. Sebuah tes profil . D. Sebuah tes prestasi (3) Banyak Jawaban yang Benar. Kemungkinan jawaban(option) dapat berisi lebih dari satu jawaban yang benar. Contoh: 132 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Pancasila adalah.... A. Dasar negara Republik Indonesia B. Lima azas orde baru C. Falsafah hidup bangsa Indonesia D. Alat peersatu bangsa Indonesia (4) Jawaban sebagai Isian. Ujung dari pertanyaanya terdapat kekosonga sehingga perlu diisi Contoh: Penemu rumus kesetaraan energi dan massa adalah.... A. Rutherford B. Einstein C. Sommerfeld D. Maxwell (5) Pengecualian Negatif. Pada ragam ini jawaban yang paling benar ialah perkecualian dari pokok soal Contoh; Di bawah adalah kebaikan tes bentuk objektif dibandingkan tes bentuk uraian, kecuali … A. Cepat dan obyektif dalam memeriksa jawaban peserta B. Dapat mewakili bahan atau materi yang telah dibelajarkan



133 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



C. Mudah membuat dibandingkan tes uraian D. Waktu yang diperlukan menjawab satu butir soal



pertanyaanya singkat



untuk



4.2. Jenis Respon Isian Tes respon isian (Supply Response Items) atau bentuk tes mengisi jawaban cenderung menunjukkan kompromi antara tes esai dan tes objektif. Yang termasuk dalam kelompok ini adalah butir soal jawaban singkat (short answer) dan butir soal melengkapi (completion). a. Tes Jawaban Singkat Bentuk soal jawaban singkat merupakan soal yang menghendaki jawaban dalam bentuk kata, bilangan, kalimat atau simbol dan jawabannya hanya dapat dinilai benar atau salah. Kaidah utama dalam menulis bentuk soal jawaban singkat adalah: soal harus sesuai dengan indikator, jawaban yang benar hanya satu, dan rumusan kalimat soal harus komunikatif. Penggunaan tes Jawaban Singkat: (1) Sangat cocok mengukur berbagai hasil pembelajaran yang relatif sederhana seperti mengingat informasi yang dihafal dan hasil-hasil pemecahan masalah yang diukur dalam matematika dan sains.(2) Dapat digunakanuntuk mengukur 134 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



kemampuan untuk menafsirkan diagram, bagan, grafik dan data bergambar.(3) Digunakan paling efektif untuk mengukur hasil belajar tertentu seperti hasil belajar perhitungan dalam matematika dan sains. Kelebihan tes Jawaban Singkat: (1) sangat mudah menyusunnya, karena secara relatif biasanya mengukur hasil belajar yang msederhana (2) Dapat meminimalkan menebak karena peserta tes harus memberi jawaban dengan berpikir dan mengingat kembali informasi yang diminta atau membuat perhitungan yang diperlukan untuk memecahkan masalah yang disajikan. Hal ini berbeda dengan butir pilihan dimana sebagian pengetahuan memungkinkan peserta tes memilih jawaban yang benar. Kelemahan tes Jawaban Singkat: (1) Tidak cocok untuk mengukur hasil belajar yang kompleks. Ia cenderung untuk mengukur hanya pengetahuan faktual dan bukan kemampuan untuk menerapkan pengetahuan tersebut dan mendorong menghafal jika digunakan berlebihan. (2) Cenderung mengukur kemampuan mengingat (simple recall).(3) Tes jawaban singkat tidak dapat diskor dengan komputer. Ada dua bentuk soal jawaban singkat, yaitu bentuk pertanyaan langsung dan bentuk pertanyaan tidak lengkap. 135 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Contoh : 1) Berpakah luas segitiga yang panjang alasnya 8 cm dan tingginya 6cm? 2) Luas daerah segitiga yang panjang alasnya 8 cm dan tingginya 6 cm adalah.... Bentuk soal jawaban singkat cocok untuk mengukur pengetahuan yang berhubungan dengan istilah, fakta, prinsip, metode, prosedur dan penafsiran data sederhana. b. Tes Melengkapi Tes melengkapi adalah butir soal yang meminta peserta didik atau siswa untuk melengkapi suatu kalimat dengan satu frase, satu angka atau satu formula. Penggunaan tes melengkapi: Tes ini biasanya digunakan dalam tes matematika dasar, seperti menjumlah, mengurangi, membagi dan sebagainya. Selain itu, tes ini dapat juga digunakan untuk menguji kemampuan mengingat Kelebihan tes Melengkapi: (1) mudah dikonstruksi, dalam waktu yang relatif singkat dapat diknstruksi sejumlah butir, (2) mampu menguji sebagian besar pokok bahasan dalam waktu yang relatif singkat. Kelemahan tes Melengkapi:



136 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(1) Tidak dapat menguji semua tingkat kemampuan hasil belajar, (2) Terlalu menekankan pada kemampuan mengingat, sehingga hasil tes tidak menggambarkan keseluruhan kemampuan hasil belajar. 5. Kapan Menggunakan Tes Objektif Tes objektif digunakan ketika tugas yang sangat terstruktur yang diperlukan untuk membatasi jenis respon (jawaban) peserta tes dapat membuat dan memperoleh jawaban yang benar dari siswa dengan menunjukkan pengetahuan atau keterampilan khusus yang disebut dalam butir. 











Tes objektif digunakan untuk menilai lebih efektif pencapaian salah satu tujuan hasil belajar sederhana dan juga hasil kompleks dalam pengetahuan, pemahaman, dan penerapan, dan bahkam di tingkat yang lebih tinggi meliputi luasan materi yang lebih luas jika terampil dikonstruk. Adalah dimungkinkan untuk menetapkan sebanyak 120 tes objektif tersebar di banyak satuan pelajaran dan beberapa tingkat kognitif selama satu atau dua jam. Tes objektif digunakan ketika yang diinginkan tujuannya, menskornya mudah dan akurat terutama bila jumlah peserta tes besar. Tes objektif digunakan untuk mengukur pemahaman, keterampilan berpikir dan hasil belajar kompleks dari siswa 137 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



B. TES ESAI 1.Pengertian Tes Esai Tes esai sering disebut tes subjektif, karena proses pemberian skornya. dipengaruhi oleh opini atau penilaian dari pendidik atau pemeriksa tes tersebut. Stalnaker (1951) mengemukakan “ A test item which requires a response composed by the examinee, usually in the form of one or more sentences, of a nature that no single response or pattern of response can be listed as correct, and the accuracy and quality of which can be judged subjectively only by one skilled or informed in the subject’’. Esai adalah sebuah tes yang membutuhkan jawaban yang disusun oleh peserta tes, biasanya dalam bentuk satu kalimat atau lebih kalimat, bersifat yang bukan jawaban tunggal atau pola jawaban dapat terdaftar sebagai benar, dan akurat serta kualitas yang dapat dinilai subjektif hanya oleh para ahli. Nurkancana dan Sunartana (1990) mengemukakan “Tes uraian adalah butir tes yang mengandung pertanyaan atau tugas yang jawaban atau pengerjaan tes harus dilakukan dengan cara mengekspresikan pikiran eksamini secara naratif. Jadi tes esai atau uraian menghendaki peserta tes atau siswa untuk mengorganisasikan, merumuskan, dan mengemukakan sendiri jawabannya. Dengan kata lain bahwa peserta tes atau siswa tidak memilih jawaban, akan 138 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



tetapi memberikan jawaban dengan kata-katanya sendiri secara bebas. Berdasarkan pengertian di atas, tes esai adalah tes yang terdiri dari pertanyaan-pertanyaan atau butir-butir yang dirancang untuk memperoleh respon dari peserta tes atau siswa melalui jawaban bebas mereka terhadap materi yang telah mereka pelajari. Dalam hal ini peserta tes (peserta ujian) memiliki tanggungjawab pemikiran untuk merespon atau menanggapi pertanyaan yang diajukan. Mereka memiliki kebebasan untuk mengekspresikan atau menyatakan jawabannya dalam kata-kata sendiri. Jawaban atas pertanyaan-pertanyaan yang diberikan peserta didik biasanya mempunyai kualitas dan derajat kebenaran yang bervariasi. Sering kali, jawaban-jawaban mereka tidak lengkap. Tes esai memiliki kualitas psikometri atau kualitas pengukuran yang buruk meskipun populer di kalangan guru kelas terutama mereka yang kurang terampil dalam mengkonstruksi butir. Karenanya, seorang guru harus mengetahui bagaimana cara mengkonstruksi atau mengembangkan butir-butir esai, dan selanjutnya mengetahui bagaimana melaksanakan dan cara penskoran butir-butir untuk meningkatkan validitas dan reliabilitasnya. Tes esai digunakan oleh guru untuk mengukur prestasi pembelajaran di ruang kelas dan sebagainya. Beberapa ciri khas tes esai adalah: (1) Siswa menjawab sejumlah kecil pertanyaan. Karena waktu terbatas, biasanya sekitar 2 atau 3 jam ujian, siswa diminta untuk menjawab dalam kata-kata 139 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



sendiri dan tidak lebih dari 5 atau 6 pertanyaan. Tidak selalu semua topik yang telah dibahas tercakup oleh tes ini. (2) Naskah jawaban ditulis dalam gaya siswa sendiri, dan dengan tulisan tangannya. Dalam beberapa kasus, kesalahan ejaan dan bahasa serta tulisan tangan yang buruk mempengaruhi hasil siswa. (3)



Para siswa cukup bebas untuk mengatur jawaban mereka sendiri, ini menyiratkan bahwa akan ada jawaban dengan berbagai tingkat akurasi dan kelengkapan. Tes esai mendorong kreativitas siswa karena membiarkan mereka bekerja sendiri. Tes esai menghambat kerja menebak dan mendorong kebiasaan belajar yang baik pada siswa.



Dalam menggunakan pertanyaan-pertanyaan esai secara efektif, adalah penting untuk dimengerti kelebihan atau kelemahan dari tes esai. Tanpa mengetahuinya, guruguru mungkin menggunakan pertanyaan esai pada hal mungkin jenis tes lain lebih cocok. 2. Kelebihan Tes Esai Beberapa kelebihan tes esai adalah sebagai berikut:  Tes esai mengukur hasil belajar yang kompleks yang tidak dapat diukur dengan cara-cara lain. Misalnya, untuk mengukur keterampilan komunikasi siswa. yaitu, kemampuan siswa untuk menghasilkan jawaban, mensintesiskan, mengorganisir ide-ide



140 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



























dan menyajikannya dalam bentuk logis dan koheren. Ini merupakan kelebihan utama. Tes esai memungkinkan pengukuran keterampilan berpikir divergen dan terorganisir dengan penekanan pada integrasi dan penerapan berpikir serta keterampilan memecah masalah, kreativitas dan orisinilitas. Tes esai dapat dipakai untuk mengukur hasil-hasil pembelajaran ranah kognitif pada tingkat-timgkat tujuan pendidikan yang lebih tinggi seperti penerapan, analisis, sintesis, dan evaluasi. Tes esai sangat mudah dan ekonomis untuk dilaksanakan. Dapat dengan mudah dan nyaman ditulis di papan tulis karena terdiri dari beberapa butir saja. Hal ini dapat menghemat bahan dan waktu untuk menghasilkannya. Tes esai mudah dikonstruksi (dikembangkan) dan tidak memerlukan banyak waktu. Keadaan ini harus dijaga secara serius untuk menghindari konstruksi pertanyaan-pertanyaan yang dapat menyesatkan Tes esai dapat digunakan untuk mengukur pengetahuan yang mendalam terutama dalam pokok materi sempit Tes esai tidak mendorong siswa untuk menebak dan melakukan kecurangan selama testing atau pengujian



Mehrens dan Lehmann (1984) mengemukakan kelebihan atau keunggulan tes esai, yaitu: (1) secara relatif lebih mudah untuk menyiapkan butir soalnya 141 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



dibandingkan dengan menyusun butir soal pilihan ganda, (2) merupakan alat yang bisa mengukur kecakapan siswa untuk menyusun jawaban dan mengemukakannya dalam prosa, (3) dapat membantu siswa untuk melihat kejujuran dengan memberi tekanan pada kemampuan siswa untuk mengisi jawaban yang benar, dan (4) dapat membantu merangsang hasil yang baik bagi pembelajaran siswa.. 3. Keterbatasan Tes Esai Meskipun kelebihan tes esai sudah dijelaskan, namun tes ini tidak memenuhi dua macam kualitas yang paling penting sebagai sebuah alat ukur yang baik.  Tes essai tidak memadai dalam pensampelan isi materi pelajaran dan tujuan pembelajaran karena memberikan sampel materi yang terbatas. Penyediaan sedikit pertanyaan mengakibatkan tes tidak valid dan cakupan tujuan- tujuan pembelajaran dan materi menjadi sempit.  Selain tidak validnya pengukuran, mengevaluasi jawaban atas pertanyaan-pertanyaan yang dikembangkan sembarang cenderung menjadi tugas membingungkan dan memakan waktu. Hal ini menyebabkan berkurangnya reliabilitas dalam penskoran. Penelitian telah menunjukkan bahwa jawaban-jawaban pertanyaan esai diskor secara berbeda oleh guru-guru berbeda dan bahkan skor guru-guru yang sama berbeda pada waktu berbeda.  Seringkali sebuah pertanyaan esai menyiratkan banyak keterampilan lain yang terukur selain



142 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



keterampilan yang dimaksudkan untuk diukur. Ini disebabkan itu peserta tes merespon terhadap pertanyaan-pertanyaan sama secara berbeda.  Butir tes esai tidak mudah untuk mempelajari secara empiris kualitas-kualitas butirnya, seperti tingkat kesulitan dan daya beda. Hopkins dan Stanley (1981) mengemukakan bahwa keterbatasan tes esai adalah sebagai berikut. (1) tidak konsistennya pembaca (reader reliability), (2) adanya efek dari kecenderungan menilai yang dipengaruhi oleh keadaan lain (halo effect), (3) akibat yang timbul karena adanya pengaruh pada jawaban butir soal sebelumnya (item-to-item carryover effects), (4) akibat yang timbul karena pengaruh hasil tes sebelumnya (test-to-test carryover effects), (5) akibat yang timbul karena urutan penilaian (order effects), dan (6) akibat yang timbul karena bentuk tulisan atau bahasa (language mechanics effects). Sedangkan kelebihan tes esai adalah bahwa dengan tes esai, mampu untuk mengukur tingkat berpikir lebih tinggi dan kompleks, serta bisa mengembangkan sikap untuk memecahkan masalah 4. Kapan Menggunakan Tes Esai Tes esai umumnya paling cocok digunakan untuk keadaan berikut:  Kita harus menggunakan pertanyaan esai dalam pengukuran prestasi kompleks ketika berbedanya cirikhas derajat tanggapan (respons) yang diperlukan. Siswa bebas memilih, menghubungkan dan menyajikan ide-ide dalam kata-kata mereka 143 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd











sendiri. Kebebasan ini meningkatkan nilai dari pertanyaan esai sebagai suatu ukuran prestasi kompleks meski menimbulkan kesulitan penskoran yang membuat tes tidak cukup sebagai ukuran pengetahuan nyata. Pertanyaan-pertanyaan esai juga harus digunakan untuk mengukur hasil-hasil pembelajaran yang tidak dapat diukur dengan butir-butir tes objektif. Pertanyaan esai dapat dimanfaatkan sepenuhnya ketika kekurangannya diimbangai oleh kebutuhan pengukuran itu. Tes esai harus digunakan ketika hasil pembelajaran yang berkaitan dengan kemampuan-kemampuan memilih, mengatur, mengintegrasikan, menghubungkan, dan mengevaluasi ide-ide memerlukan kebebasan respons dan keaslian yang disediakan oleh pertanyaan esai.



5. Klasifikasi Tes Esai Gronlund & Linn (1990) mengelompokkan tes esai atau tes uraian menjadi dua bentuk, yaitu tes uraian terbatas (restricted response items) dan tes uraian bebas (extended respons items). Kadang-kadang tes uraian terbatas disebut uraian objektif, sedangkan tes uraian bebas disebut uraian non-objektif. 5.1. Tes Uraian Terbatas Pada tes uraian terbatas ini peserta tes dibatasi pada sifat, panjang atau susunan jawaban untuk dibuat. Butir-butir jawaban terarah pada jawaban-jawaban yang 144 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



diperlukan. Menurut Mehrens dan Lehmann (1984) menyatakan bahwa tes esai jawaban terbatas atau terstruktur, peserta tes atau siswa lebih dibatasi pada bentuk dan ruang lingkup jawabannya, karena secara khusus dinyatakan konteks jawaban yang harus diberikan oleh peserta tes Hal ini membatasi kebebasan peserta tes untuk memilih, mengingat, dan mensintesis semua yang diketahui dan menyajikannya secara logis sebagaimana yang diinginkan. Jenis tes essai ini paling berguna dalam mengukur hasil-hasil pembelajaran pada tingkat kognitif rendah, yaitu, tingkat pengetahuan, pemahaman dan penerapan. Berikut diberikan beberapa contoh tes jenis essai terbatas : 1. Berikan tiga kelebihan dan dua kerugian tes esai 2. Jelaskan empat kegunaan tes dalam pendidikan Tes uraian terbatas cocok untuk mata pelajaran yang jawabannya cenderung tidak memiliki variasi misalnya matematika dan fisika. Agar penskorannya objektif diperlukan pedoman penskoran. Penskoran dilakukan pada setiap langkah pengerjaan, misalnya menuliskan rumus, menghitung hasil, menafsirkan dan menyimpulkan hasilnya. Penskoran bersifat hirarkis sesuai dengan langkah pengerjaan soal. Bobot skor untuk tiap butir tes ditentukan berdasarkan tingkat kesulitan butir tes. Soal yang sulit, bobotnya lebih besar dibandingkan dengan soal yang mudah. Tes uraian terbatas digunaakan untuk mengevaluasi hasil belajar berupa kemampuan-kemampuan: a) Menjelaskan hubungan sebab akibat 145 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



b) c) d) e) f) g)



Menjelaskan aplikasi prinsip-prinsip Mengajukan argumentasi Merumuskan hipotesis Merumuskan kesimpulan-kesimpulan Merumuskan asumsi-asumsi Menjelaskan metode dan prosedur



5.2. Tes Uraian Bebas Dalam tes bentuk uraian bebas, peserta tes hanya dibatasi dengan waktu dan tidak terikat dengan susunan jawaban. Menurut Mehrens dan Lehmann (1984), pada tes esai bentuk jawaban bebas atau terbuka, mengijinkan peserta tes atau siswa untuk mendemonstrasikan kecakapannya, yaitu: (1) menyebutkan atas pengetahuan faktual, (2) menilai pengetahuan faktualnya, (3) menyusun ide-idenya, dan (4) mengemukakan idenya secara logis dan koheren. Sebuah contoh pertanyaan dalam kategori ini adalah sebagai berikut. “Siswa diberikan seperangkat tes yang di dalamnya terdapat kesalahan dan kekacauan pada petunjuknya, pada butir-butirnya, dan dalam susunan butir-butirnya. Tulislah kritikan evaluasi saudara terhadap tes ini dengan menggunakan kriteria standar evaluatif konstruksi tes yang digambarkan dalam buku teks. Rincikan jawaban saudara tentang kelebihan dan kelemahan tes serta evaluasilah keseluruhan kualitasnya” Dalam merespon (menjawab) pertanyaan seperti pada ujian yang menunjukkan kemampuan untuk memilih dan mengingat fakta-fakta yang menurutnya berkaitan, 146 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



menyusun dan menyajikan ide-idenya dalam bentuk yang logis dan jelas. Jenis tes ini memberi kebebasan untuk memutuskan mana fakta-fakta yang menurutnya paling relevan dan menulis sebanyak mungkin sebagai jawaban. Tes essai jenis ini sebagian besar berguna dalam mengukur hasil pembelajaran pada tingkat-tingkat kognitif lebih tinggi seperti tingkat analisis, sintesis, dan evaluasi. Meskipun demikian, tipe essai bebas juga dibatasi oleh kelemahan, antara lain:  Penskoran respon-respon (jawaban-jawaban) biasanya sulit dan tak reliabel karena peserta tes bebas dalam menyusun informasi faktual dari berbagai-bagai tingkat kebenaran.. Bentuk tes uraian non-objektif/uraian bebas cocok untuk bidang studi ilmu-ilmu sosial. Meskipun hasil penskoran tes jenis ini cenderung subjektif, namun, bila disediakan pedoman penskoran hasilnya dapat lebih objektif. Sebaiknya setiap soal ditetapkan kata kunci. Tes uraian bebas digunakan untuk mengevaluasi hasil belajar yang bersifat kompleks berupa kemampuankemampuan: a) Menghasilkan, menyusun dan menyatakan ideide b) Memadukan hsil belajar dari berbagai bidang studi c) Merekayasa atau mendesain eksperimen d) Menjelaskan nilai suatu ide 6. Konstruksi Tes Esai



147 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Kita menyadari akan kesulitan pertanyaan esai sebagai sebuat alat ukur. Oleh karena itu, tes esai merupakan alat (instrumen) pengukuran berguna hanya sejauh konstruksi, pelaksanaan, dan penskorannya memiliki objektivitas yang tinggi. Karenanya, butir-butir tes esai harus terdiri dari butir-butir yang akan menjamin pemahaman yang sama dari setiap peserta tes. Juga, respon-respon yang diberikan oleh dua atau lebih penelaah harus memberikan skor yang sama dan harus menarik interpretasi yang konsisten, Kita mengetahui bahwa hal tersebut sulit untuk dicapai dan membutuhkan banyak usaha. Oleh karena itu hal-hal berikut disarankan sebagai panduan untuk mengkonstruksi butir tes esai yang baik yang sesuai dengan perilaku yang diinginkan. i. Membatasi penggunaan pertanyaan esai hanya untuk hasil pembelajaran yang tidak dapat diukur dengan dengan tes-tes objektif. ii. Pertanyaan esai harus dirancang sedemikian rupa sehingga hanya keterampilan yang butir maksudkan untuk diukur saja yang terukur. Hal ini dapat dicapai dengan mengungkapkan secara jelas dan tepat pertanyaan sesuai dengan tujuan pembelajaran. iii. Sebuah pertanyaan esai harus menentukan secara tepat apa yang diperlukan dari tes esai tersebut. Pastikan bahwa tugas peserta tes adalah jelas ditunjukkan dengan pembatasan daerah yang dicakup oleh butir, menggunakan kata-kata deskriptif 148 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



untuk memberikan arahan tertentu terhadap respon atau jawaban yang diinginkan. iv. Petunjuk batas waktu perkiraan untuk setiap pertanyaan. Hal ini diperlukan untuk menunjukkan waktu yang dialokasikan untuk setiap pertanyaan guna memungkinkan peserta tes mengatur kecepatan merekan menulis pada setiap pertanyaan dan untuk menghilangkan kecemasan yang mungkin timbul. v. Menghindari penggunaan pertanyaan pilihan, karena pertanyaan pilihan mungkin mempengaruhi validitas hasil tes. 7. Cara Mengurangi Subjektivitas Tes Esai Seperti telah diketahui bahwa subjektivitas merupakan keterbatasan utama dari tes esai. Namun, kita bisa mengurangi subjektivitas ini seminimum mungkin dengan mengikuti langkah-langkah sederhana berikut: i. ii. iii.



iv.



v.



Menghindari pertanyaan-pertanyaan terbuka Membiarkan siswa menjawab pertanyaan yang sama, untuk menghindari pilihan Menggunakan nomor siswa, bukan nama mereka, untuk menyembunyikan identitas mereka Menskor semua jawaban untuk setiap pertanyaan untuk semua siswa pada suatu waktu Jangan biarkan skor pada suatu pertanyaan mempengaruhi kita saat menskor berikutnya. 149 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



vi. vii.



Selalu mengatur ulang kertas sebelum kita mengoreksi Jangan biarkan perasaan atau emosi kita sehingga mempengaruhi penskoran kita Menghindari dari gangguan-gangguan ketika mengoreksi



8. Perbandingan antara tes objektif dengan tes esai Menurut Gronlund dan Linn (1995) perbadingan antara tes esei dan tes objektif adalah seperti dalam Tabel 7.1 berikut Tabel 7.1. Perbandingan antara tes objektif dengan tes esai 1.Hasil belajar yang diukur



Tes Objektif Baik untuk mengukur hasil belajar pada tingkat pengetahuan tentang fakta, pemahaman, keterampilan berpikir, dan hasil belajar yang kompleks. Tetapi tidak mampu untuk mengukur kemampuan untuk memilah dan menyusun ide-ide, kecakapan menulis, dan beberapa bentuk



Tes Esei Tidak efisien untuk mengukur pengetahuan tentang fakta. Dapat mengukur pemahaman, keterampilan berpikir, dan hasil belajar yang kompleks lainnya (khususnya sangat berguna jika jawaban orisinil yang diinginkan). Cocok untuk memilih dan menyusun ide-ide, keterampilan menulis, dan keterampilan untuk memecahkan masalah yang



150 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



2.Penyiapan butir soal



3.Mengambil sampel materi pelajaran



4.Kontrol terhadap jawaban peserta didik



5.Pemberian skor 6.Pengaruh pada proses pembelajaran



keterampilan untuk memecahkan masalah Banyak memerlukan waktu untuk menyusun butir soal. Sukar mempersiapkan butir soal yang baik dan memerlukan waktu lama Dapat mewakili semua materi pelajaran dan dapat memuat butir soal yang banyak dalam seperangkat tes Tinggal memilih jawaban yang telah tersedia. Menghindari gertak sambal dan pengaruh keterampilan menulis, bisa menebak jawaban Pensekoran secara objektif dan cepat, mudah, dan konsisten Biasanya mendorong peserta didik untuk mengembangkan pengetahuan



menuntut pemikiran yang orisinil Hanya sedikit pertanyaan yang diperlukan untuk seperangkat tes. Menyiapkan butir soal relatif mudah, tetapi lebih sulit daripada anggapan orang Tidak dapat mewakili seluruh materi pelajaran, karena hanya sedikit pertanyaan yang bisa dimasukkan dalam seperangkat tes Bebas menjawab atas dasar kata-katanya sendiri, dan keterampilan menulis mempengaruhi sekor, berpikir menebak bisa dikurangi Pensekoran subjektif dan lambat, sulit, dan tidak konsisten Mendorong peserta didik untuk memusatkan pikiran pada sejumlah besar materi pelajaran,



151 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



7.Reliabilitas



tentang fakta-fakta khusus dan kemampuan untuk pembedaan di antara fakta tersebut. Dapat mendorong pengembangan pemahaman, keterampilan berpikir, dan hasil belajar yang kompleks lainnya Reliabilitas yang tinggi mungkin dicapai, khususnya jika tes disusun secara baik



dengan penekanan khusus pada kemampuan untuk menyusun, mengintegrasikan, dan mengemukakan ide-ide secara efektif. Dapat mendorong kebiasaan menulis buruk jika waktunya mendesak Reliabilitasnya lebih rendah, terutama karena pensekoran yang tidak konsisten



152 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 8 INSTRUMEN NONTES A. Konsep Nontes



Non tes dapat diartikan sebagai teknik penilaian yang dilakukan tanpa menggunakan tes. Teknik ini dilakukan melalu piengamatan secara teliti dan tanpa menguji peserta didik. Non tes biasanya dilakukan untuk mengukur hasil belajar yang berhubungan dengan apa yang dapat dibuat atau dikerjakan oleh siswa dari apa yang diketahui atau dipahaminya. Menurut Widiyoko (2009) instrumen nontes berhubungan dengan penampilan yang 153 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



dapat diamati dari pada pengetahuan dan proses mental lainnya yang tidak dapat diamati dengan panca indra. Instrumen atau alat penilaian yang tergolong nontes antara lain: a) kuesioner /angket, b) pedoman wawancara (interview), 3) daftar cocok (check-list), 4) skala penilaian (Rating Scale), 5) lembar pengamatan/ observasi, 6) jurnal, 7) inventori, 8) penilaian diri (self-assessment), dan 9) penilaian oleh teman sejawat (peer assessment). Pada penilaian hasil pembelajaaran, instrumen nontes biasanya digunakan untuk mengukur pada ranah afektif dan psikomotorik.



B. Kuesioner (Angket) Kuesioner atau angket adalah sebuah daftar pertanyaan yang harus diisi oleh orang yang akan diukur (responden). Pada umumnya tujuan penggunaan kuesioner dalam proses pembelajaran terutama adalah untuk memperoleh data mengenai latar belakang siswa sebagai salah satu bahan dalam menganalisis tingkah laku dan proses belajar mereka. 1.Kelebihan Kuesioner/ angket Terdapat beberapa kelebihan kuesioner (angket) sebagai instrumen evaluasi, di antaranya yaitu: 1) Dengan angket kita dapat memperoleh data dari sejumlah siswa yang banyak yang hanya membutuhkan waktu yang singkat. 2) Setiap siswa dapat memperoleh sejumlah pertanyaan yang sama



154 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



3) Dengan kuesioner (angket) siswa terhindar dari pengaruh subjektif dari guru dapat dihindarkan 2. Kelemahan kuesioner atau angket Di samping kelebihannya, kuesioner atau angket juga memiliki beberapa kelemahan, di antaranya yaitu: 1) Pertanyaan yang diberikan melalui kuesioner atau angket adalah terbatas, sehingga apabila ada hal-hal yang kurang jelas maka sulit untuk diterangkan kembali 2) Kadang-kadang pertanyaan yang diberikan dalasm kuesioner tidak dijawab oleh semua siswa atau mungkin dijawab tetapi tidak sesuai dengan kenyataan yang sebenarnya, 3) Ada kemungkinan kuesioner atau angket yang diberikan tidak dapat dikumpulkan semua, sebab banyak siswa yang merasa kurang perlu hasil dari kuesioner yang diterima, sehingga tidak memberikan kembali angketnya. 3.Jenis-jenis kuesioner atau angket: Ditinjau dari segi isi Kuesioner dibedakan atas 4 bagian yaitu: 1) Pertanyaan fakta adalah pertanyaan yang menanyakan tentang fakta antara lain eperti jumlah sekolah, jumlah jam belajar, jumlah siswa , jumlah guru, dan sebagainya.. 2) Pertanyaan perilaku adalah pertanyaan jika guru menginginkan tingkah laku seseorang siswa dalam



155 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



kegiatan di sekolah atau dalam proses belajar mengajar. 3) Pertanyaan informasi adalah pertanyaan jika guru menginginkan mengungkapkan berbagai informasi atau menggunakan fakta. 4) Pertanyaan pendapat dan sikap adalah kuesioner yang berkaitan dengan perasaan, kepercayaan predisposisi, dan nilai-nilai yang berhubungan dengan objek yang dinilai. Sering kuesioner atau angket jenis ini disebut sebagai skala sikap atau skala penilaian, padahal antara angket dan skala itu berbeda.



Skala Sikap yaitu mengenai keadaan atau perasaan atau penilaian yang bersangkutan, misalnya menilai sikap siswa terhadap pembelajaran guru, yang mengisi kuesioner skala sikap tersebut adalah siswa. Sedangkan skala penilaian adalah mengukur mengenai keadaan, kemampuan, penampilan, atau kinerja orang lain. Contohnya ingin mengetahui kinerja guru di dalam kelas, yang mengisi kuesioner skala penilaian ini adalah siswa, bukan guru, karena karena siswa yang mengetahui atau merasakan indikator kinerja gurunya. Adapun perbedaan antara kuesioner dan skala sikap (penilaian) yaitu: 1) Data yang diungkap oleh luesioner (angket) berupa data faktual sedangkan data yang diungkap oleh skala berupa konstrak atau konsep psikologis yang menggambarkan kepribadian individu; 2) Pertanyaan dalam angket berupa pertanyaan langsung terarah kepada informasi mengenai data 156 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



3)



4)



5)



6)



7)



yang hendak diungkap. Pada skala pertanyaan sebagai stimulus tertuju pada indikator perilaku guna memancing jawaban yang merupakan refleksi dari keadan diri subjek yang biasanya tidak disadari oleh responden yang bersangkutan. Pada angket responden tahu persis informasi apa yang dikehendaki oleh pertanyaannya, sedangkan pada skala responden biasanya tidak menyadari arah jawaban yang dikehendaki oleh pertanyaannya. Jawaban terhadap angket tidak dapat diberi skor melainkan diberi angka coding sebagai klasifikasi jawaban. Pada skala psikologi dapat diberi skor melalui proses penskalaan (scaling). Satu angket dapat mengungkap informasi mengenai banyak hal sedangkan satu skala hanya diperuntukkan guna mengungkap satu atribut tunggal (unidimensional) Data hasil angket tidap perlu diuji lagi reliabilitasnya secara psikometris sedangkan skala psikologi harus teruji karena relevansi isi dan konteks kalimat yang digunakan sebagai stimulus pada skala psikologi lebih terbuka terhadap error. Validitas angket lebih ditentukan oleh kejelasan tujuan dan lingkup informasi yang hendak diungkap sedangkan validitas skala psikologi lebih ditentukan oleh kejelasan konsep psikologis yang hendak diukur dan operasionalisasinya.



157 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Agar lebih jelas letak perbedaan antara Angket dengan Skala maka dapat dilihat dari masing-masing contohnya berikut.. Contoh Aktivitas Guru



Angket/Kuesioner



No



Pernyataan



1



Perencanaan dan Persiapan Materi Menyelesaikan tugas administrasi Pertemuan atau rapat Pengembangan profesi (kursus, seminar, lokakarya Kegiatan dengan siswa (Bimbingan Eskul, Kelompok belajar) Lain-lain, sebutkan ..................................



2 3 4 5



6



untuk



mengetahui



Jumlah Jam dalam seminggu 0



219 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Untuk contoh perhitungan lihat Tabel 10.7 berikut:



Tabel 10.7. Kecocokan antar penilai Butir Penilai 1 2 3 1 1 0 I 2 1 0 I 3 1 0 I 4 0 0 I 5 0 0 1 Penting 3 2 5 Tidak Penting 2 3 0



4 1 0 1 1 1 4 1



5 0 0 0 0 1 1 4



Perhitungan butir 1: Mp = 3, M = 5 CVR = (2 CVR =(



)–1 ) – 1 = ( ) – 1 = 0,20, butir 1 tidak valid



Perhitungan butir 4: Mp = 4, M = 5 CVR = (2 CVR =(



)–1 )–1=



( )–1=



0,60 ,butir 2 valid



2) Perhitungan validitas isi untuk seluruh butir Untuk mengetahui validitas isi seluruh butir tes (bukan butir per butir) dapat dilakukan dengan cara mengecek alat ukur oleh dua orang penilai (ahli). Indek 220 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



validitas ditentukan oleh kecocokan hasil penilaian di antara dua ahli tersebut terhadap keseluruhan butir tes. Rumus yang digunakan yaitu: Koefisien validitas isi =



(Gregory dalam



Retnawati, 2015) Perangkat tes dinyatakan valid jika diperoleh harga diatas 0,50 (Susetyo, 2011). Adapun bentuk Tabel kecocokan antar panilai adalah sebagai berikut. Tabel 10.8. Kecocokan antar penilai Penilai 1 Penilai/Kategori



Penilai 2



Kurang Penting



Penting



Kurang Penting



A



B



Penting



C



D



Sebagai contoh, jika hasil penilaian perangkat ukur oleh dua orang ahli, hasilnya sebagai berikut. Penilai 1 Penilai/Kategori



Penilai 2



Kurang Penting



Kurang Penting



Penting



5



3



221 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Penting



Koefisien validitas isi =



2



=



15



= 0,60



Koefisien validitas isi sebesar 0,6 menunjukkan bahwa validitas isi tes tersebut berada dalam kategori sedang. 2.Validitas Konstruks Pengujian validitas konstruk merupakan gabungan dari pendekatan logis dan empiris. Menurut Kerlinger (2003) ada tiga cara yang dapat digunakan untuk menentukan validitas konstruk, yaitu (a) konvergensi dan diskriminabilitas, (b) metode matrik multitrait-multi method, dan (c) metode analisis faktor. Pendekatan yang banyak dilakukan dalam pengujian validitas konstruk sekarang adalah pendekatan analisis faktor. Analisis faktor adalah kajian tentang kesalingtergantungan antara variabel-variabel, dengan tujuan untuk menemukan himpunan variabel-variabel baru, yang lebih sedikit jumlahnya dari pada variabel semula, dan menunjukkan yang mana di antara variabelvariabel semula itu yang merupakan faktor-faktor persekutuan (Suyanto, 1977). Melalui analisis faktor dapat melihat apakah spesifikasi konstruk yang dikembangkan secara teoritik telah sesuai dengan konsep konstruk yang mendasarinya setelah dilakukan ujicoba di lapangan. Teknik ini menganalisis butir-butir alat ukur yang terdapat dalam sejumlah faktor tertentu, butir-butir yang



222 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



memiliki unsur kebersamaan (common factor) digabung menjadi suatu faktor baru. Salah satu prosedur pengujian validitas konstruk yang tidak terlalu kompleks dapat dilakukan dengan pendekatan validitas internal atau validitas butir. 3.Validitas Konkurensi Tuckman (1975) mengemukakan “concurrent validity tells wheather the degree to which persons show evidence of a quality on a given test is reflected in or paralled by their scores on another test of presumably the same characteristic” maksudnya validitas konkuren menjelaskan sejauh mana orang menunjukkan bukti dari kualitas pada tes yang diberikan itu tercermin atau terhubung dengan skor pada tes lain yang karakteristiknya sama. Contoh: Ibu Sari mengembangkan sebuah tes dan dia ingin mengetahui apakah tesnya itu valid. Ibu Sari mengambil tes lain yang tersedia yang diketahui valid dan menggunakan tes itu sebagai kriteria. Dia memberikan kedua set tes tersebut: tes yang dikembangkan dan tes sebagai kriteria kepada kelompok siswa berjumlah 10 orang. Skor-skor mereka ditunjukkan di bawah. Tentukan validitas tes ibu Sari tersebut.



223 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Tes yang Tes yang dikem dijadikan bangkan Kriteria (Y) ibu Sari (X) 34 30 40 37 35 25 49 37 50 45 38 29 37 35 47 40 38 35 43 39 411 352



XY



X2



Y2



1020 1480 875 1813 2250 1102 1295 1880 1330 1677 14722



1156 1600 1225 2401 2500 1444 1369 2209 1444 1849 17197



900 1369 625 1369 2025 841 1225 1600 1225 1521 12700



( √*



( (



√*(



√*(



)(



)( )



)



√(



( (



) +*(



(



)



(



)+



)(



)



) +* )



(



)(



(



)



*(



=



)(



) + )



)(



(



)



) +



) )



(



= 0,83



224 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



)+



Prof. Dr. Yusrizal, M.Pd



Suatu koefisien korelasi sebesar 0,83 menunjukkan bahwa tes yang dikembangkan ibu Sari memiliki validitas konkurensi 4. Validitas Prediktif Tuckman (1975) menyatakan “Predictive validity indicates the degree of correspondence between scores on the test in question and future outcomes that are expected to be related to characteristic measured by the test. Maksudnya, validitas ramalan menunjukkan tingkat kesesuaian di antara skor-skor pada tes dalam soal dan hasil mendatang yang diharapkan berkaitan dengan ciriciri yang diukur oleh tes. Menurut Nurkancana dan Sunartana (1986), cara yang dipergunakan untuk menilai tinggi rendahnya validitas prediktif ialah dengan jalan mencari korelasi antara nilai-nilai yang dicapai oleh oleh siswa dalam tes tersebut dengan nilai-nilai yang dicapainya kemudian. Sebagai contoh, untuk menguji validitas tes masuk Perguruan Tinggi Negeri, Perguruan Tinggi belum memiliki data tentang prestasi mahasiswa, sehingga kriteria yang akan dibandingkan belum tersedia. Kriteria pembanding yang diramalkan oleh tes masuk adalah nilai hasil belajar mahasiswa setelah diterima dan mengikuti pembelajaran selama waktu tertentu. Contoh: Pak Budi ingin mengetahui validitas prediktif tesnya yang dilaksanakan setahun sebelumnya melalui korelasi skor-skor dengan peringkat dari siswa yang sama Skor-skor dan peringkat 225 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



ditunjukkan di bawah. Tentukan validitas tes pak Budi.



Peringkat (X) 89 85 90 79 80 82 92 87 81 84 849



Tes (Y) 40 37 45 25 27 35 41 38 29 37 354



XY



X2



Y2



3560 3145 4050 1975 2160 2870 3772 3306 2349 3108 30295



7921 7225 8100 6241 6400 6724 8464 7569 6561 7056 72261



1600 1369 2025 625 729 1225 1681 1444 841 841 12908



( √*



(



( √*(



√*(



)



)



(



) (



) +*(



(



)



(



)+



√(



)(



)



) +*



)(



)(



)(



(



)(



) + )



)(



)



(



) +



)



*( )



(



=



)



(



= 0,76



226 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



)+



Prof. Dr. Yusrizal, M.Pd



Suatu koefisien korelasi sebesar 0,76 menunjukkan bahwa tes pak Budi memiliki validitas prediktif.



D. Faktor-faktor yang mempengaruhi Validitas Beberapa aktor yang dapat mempengaruhi validitas tes adalah: 1. Faktor dari dalam tes itu sendiri, seperti: (a) petunjuk yang tidak jelas, (b) Penggunaan kosa kata dan struktur kalimat yang sulit, (c) ambiguitas. (d) alokasi waktu yang tidak cukup, (e) Penekanan yang berlebihan terhadap aspek tertentu, menyebabkan mudah ditebak, (f) Kualitas butir tes yang tidak memadai untuk mengukur hasil belajar. (g) Susunan tes yang jelek., (h) Tes terlalu pendek, (i) Penyusunan butir tes yang tidak runtut . (j) Pola jawaban yang mudah ditebak, 2. Faktor berfungsinya tes dan prosedur mengajar . 3. Faktor administrasi dan penskoran . 4. Faktor tanggapan siswa. 5. Hakikat kelompok dan kriteria.



227 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



228 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 11 RELIABILITAS TES A.Pengertian Reliabilitas Dari segi bahasa, reliabilitas berasal dari kata reliability yang mempunyai asal kata rely dan ability yang berarti hal yang dapat dipercaya. Sebuah tes dikatakan mempunyai reliabilitas berarti tes tersebut dapat dipercaya karena memberikan data yang tetap atau konsisten, dan menjadi sandaran pengambilan keputusan. Beberapa pengertian reliabilitas adalah sebagai berikut: (1) Reliability refers to the degree to which a particular test or instrument providee



229 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



trustworthy or consistent measures of whatever it does measure. Maksudnya reliabilitas mengacu pada derjat dimana suatu tes atau alat ukur tertentu memberikan kepercayaan atau konsisten dalam mengukur apa yang diukur (Erickson and Tim,1976) (2) Reliabilty refers to consistency of measurement-



that is, how consistent test scores or others evaluation results are from one measurement to another. Maksudnya reliabilitas mengacu pada kekonsistenan dari pengukuran, yaitu berapa konsistenya skor-skor tes atau hasil-hasil evaluasi lain dari suatu pengukuran untuk pengukuran lainnya(Gronlund and Linn, 1990) (3) Reliability is as the extent to which a test measures consistently what it purports to measure. Artinya, reliabilitas sebagai derajat dimana suatu tes mengukur secara konsisten apa yang seharusnya diukur (Deblassie, 1974) (4) Reliability refers to the extent to which measurement results are free of unpredictable kinds of error. Reliabilitas mengacu pada tingkat dimana hasil-hasil pengukuran bebas dari kesalahan-kesalahan yang tidak disangka (Morris & Gibbon, 1986)



230 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(5) Reliability refer to the degree to which test scores are free from errors of measurement .Reliabilitas mengacu pada derjat dimana skor-skor tes bebas dari ke kekeliruan pengukuran ( Pedhazur dan



Schmelkin, 1991 Jadi reliabilitas (keandalan) suatu alat ukur adalah keajegan (konsistensi) hasil pengukurannya seandainya alat ukur tersebut digunakan oleh orang yang sama dalam waktu yang berlainan atau digunakan oleh orang yang berlainan dalam waktu yang sama. Deblassie (1974) menyatakan bahwa “ A test is reliable if it provides consistent information about examinees”. Jadi, suatu tes yang reliabel adalah jika tes itu memberikan informasi yang konsisten atau tetap (ajeg) tentang peserta tes. Secara singkat reliabilitas dapat dinyatakan sebagai” sejauhmana alat ukur itu dapat menghasilkan ukuran yang konsisten”. Konsisten atau tetap (ajeg) disini tidak berarti harus memiliki skor yang selalu sama ketika diujikan berkali-kali pada siswa yang sama, tetapi mengikuti perubahan secara ajeg. Sebagai contoh, jika skor si A dalam sebuah tes mula-mula lebih rendah dibandingkan dengan skor si B, maka jika diadakan pengukuran ulang, si A juga mendapat skor lebih rendah dari si B. Itulah yang dikatakan tes itu ajeg atau tetap, atau tes itu reliabel.



B. Jenis-Jenis Reliabilitas Menurut Djaali dab Muljono (2008) reliabilitas dibedakan atas dua macam, yaitu reliabilitas konsistensi tanggapan, dan reliabilitas konsistensi gabungan item. 231 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Reliabilitas konsistensi tanggapan berkaitan dengan kemantapan tes apabila diujikan beberapa kali akan memberikan hasil pengukuran (tanggapan) yang relatif konsisten. Reliabilitas konsistensi tanggapan, kadangkadang disebut sebagai external stability. Ada dua metode untuk mengestimasi reliabilitas tanggapan, yaitu: (1). metode “test retest” atau tes ulang, dan (2) metode “alternate forms” atau tes paralel. Reliabilitas konsistensi gabungan item adalah berkaitan dengan kemantapan atau konsistensi antara itemitem suatu tes. Reliabilitas ini juga disebut sebagai reliabilitan konsisten internal. Koefisien reliabilitas konsistensi



gabungan item dapat dihitung dengan dua teknik, (1) kalau jumlah butir tesnya genap dapat digunakan metode “splithalf” atau belah dua, yang menggunakan formula: Spearman-Brown, Flanagan, atau Rulon. (2) Jika jumlah butir tesnya ganjil, maka koefisien reliabilitasnya dihitung dengan menggunkan formula atau (a) rumus KuderRichardson, yang dikenal dengan nama KR-20 dan KR-21, (b). Rumus koefisien Alpha Cronbach , dan (c). Rumus reliabilitas Hoyt. Gambar11.1 memperlihatkan klasifikasi reliabilitas.



232 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Reliabilitas



Konsisten si Internal



Stabilitas Ekternal



Tes Ulang



Tes Parale l



Butir Genap



Metode Belah Dua



Butir Ganjil



Rumus KR-20



Rumus KR-21



Spearma n Brown



Rumus Fl a na ga n



Rumus Rulon



Alpha Cronbac



Gambar 11.1: Ilustrasi jenis-jenis reliabillits



C.Mengestimasi Koefisien Reliabilitas Menurut Suryabrata (2000) reliabilitas alat ukur yang menunjukkan derajad kekeliruan pengukuran tidak dapat ditentukan dengan pasti melainkan hanya dapat diestimasi. Untuk mengestimasi koefisien reliabilitas alat ukur dapat dihitung dengan menggunakan empat metode. Keempat metode tersebut adalah, metode “test retest” atau 233 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



tes ulang, metode “alternate forms” atau tes paralel, metode “split-half” atau belah dua, dan metode “internal consistency” atau konsistensi internal (Anderson, 1981). 1. Metode Tes Ulang (Test Retest Method) Test-retest is an obvious to estimate the reliability of a test is to the same group of individuals on two occasions and correlate the two sets of scores (Bryman, 2001). Maksudnya, test-retest ialah suatu kejelasan untuk memperkirakan tingkat reliabilitas sebuah tes untuk kelompok yang sama anggota pada dua kesempatan dan mengkorelasikan dua set skor.



Metode tes ulang maksudnya sebuah tes yang sama diberikan dua kali kepada responden yang sama dengan jarak waktu tertentu. Estimasi koefisien reliabilitas diperoleh dengan mengkorelasikan skor pengetesan pertama dengan skor pengetetesan kedua. Koefisien korelasi yang diperoleh menunjukkan koefisien reliabilitas tes tersebut Koefisien atau Indeks reliabilitas berkisar antara 0 - 1. Semakin tinggi koefisien reliabilitas suatu tes (mendekati 1), makin tinggi pula keajegan/ ketepatannya. Untuk mengkorelasi kedua skor hasil pengetesan dapat rumus menggunakan korelasi Pearson atau Spearman jika skor kontinu. Bentuk rumus korelasi Pearson Product Moment adalah sebagai berikut:



234 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



( √*



(



) +*



)(



) (



) +



dengan



: koefisien korelasi product moment X : skor hasil pengetesan pertama Y : skor hasil pengetesan kedua N : jumlah responden Kelemahan metode tes ulang adalah dalam penentuan selang waktunya. Jika selang waktu tes terlalu singkat, kemungkinan besar responden masih mengingat materi yang diteskan pertama kali, sehingga berkemungkinan besar skor tes yang kedua lebih baik daripada skor tes pertama. Sebaliknya jika selang waktu tes pertama dengan tes kedua terlalu lama dikhawatirkan banyak faktor serta situasi dan kondisi sudah banyak berubah dan mempengaruhi skor tes yang kedua. Contoh: Ibu Eva melaksanakan ujicoba tes Bahasa Inggris yang dikembangkannya pada 10 orang mahasiswa semester pertama. Setelah dua minggu, tes yang sama diberikan lagi pada mahasiswa yang sama. Skor-skor mereka pada tes pertama dan tes kedua ditunjukkan di bawah Hitung reliabilitas tes Bahasa Inggris yang dikembangkan ibu Eva.



235 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Tes Pertama (X) 40 35 30 20 19 20 37 38 40 25 304



Siswa A B C D E F G H I J ∑



Tes Kedua (Y) 41 40 25 20 20 23 34 35 40 25 303



XY



X2



Y2



1640 1400 750 400 380 460 1258 1330 1600 625 9843



1600 1225 900 400 361 400 1369 1444 1600 625 9924



1681 1600 625 400 400 529 1156 1225 1600 625 9841



( √*



( (



√*(



√*(



)(



)( )



)



√(



(



(



)(



) +*(



(



)



(



)+



)(



)



) +* )



(



)(



(



)



*(



=



) + )



)(



(



)



)+



) )



(



)+



= 0,94



Dari perhitungan didapat koefisien reliabilitas 0,94, karena itu dapat disimpulkan tes Bahasa Inggris memiliki reliabilitas tinggi. 236 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



2. Metode Tes Sejajar (Equivalent Test Method) Metode tes sejajar maksudnya dua buah tes yang mempunyai kesamaan tujuan, bobot soal, tingkat kesukaran, susunan soal yang sama (kecuali butir–butir soalnya saja yang berbeda) diberikan serentak pada responden yang sama. Estimasi koefisien relibilitas diperoleh dengan mengkorelasikan skor tes pertama dengan skor tes kedua. Kelemahan metode ini adalah sulitnya mengkonstruksi dua buah tes yang sama, namun metode sejajar ini dapat memperbaiki kelemahan pada metode pertama yaitu terhindarnya dari kondisi siswa masih mengingat materi tes pertama. Estimasi koefisien reliabilitas dengan metode tes ulang dan metode tes sejajar adalah untuk melihat stabil atau tidak stabilnya skor. Skor disebut stabil bila skor yang didapat pada suatu waktu dan pada waktu yang lain atau skor yang didapat dari dua buah tes yang ssejajar hasilnya relatif sama. Makna lain reliabilitas dalam pengertian stabilitas adalah subjek yang dikenai pengukuran akan menempati ranking yang relatif sama pada testing yang terpisah dengan alat tes yang ekuivalen (Singh, 1986). Contoh: Pak Iwan melaksanakan ujicoba tes Matematika yang dikembangkannya pada 10 mahasiswa semester tiga dengan cara membuat dua macam bentuk soal yang setara (ekivalen). Soal bentuk pertama diberikan pagi dan soal bentuk kedua diberikan satu jam kemudian. Skor-skor bentuk pertama dan bentuk kedua disajikan di bawah. 237 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Tentukan reliabilitas tes Matematika yang dikembangkan Pak Iwan tersebut. Ter Bentuk Pertama (X) 60 84 40 65 70 33 42 50 70 90 604



Tes Bentuk Kedua (Y) 48 82 37 72 89 40 37 60 80 74 619



XY



X2



Y2



2880 6888 1480 4680 6230 1320 1554 3000 5600 6660 40292



3600 7056 1600 4225 4900 1089 1764 2500 4900 8100 39734



2304 6724 1369 5184 7921 1600 1369 3600 6400 6400 41947



( √*



( (



√*(



√*(



)(



)( )



)



√(



( (



) +*(



(



)



(



)+



)(



)



) +* )



(



)(



( *(



)



=



)(



) + )



)(



(



)



) +



) )



(



= 0,84



238 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



)+



Prof. Dr. Yusrizal, M.Pd



Nilai rxy yang diperoleh adalah 0,84, yang menunjukkan hubungan yang sedang. Karena itu, skorskor tes dalam kedua bentuk tes matematika adalah reliabel. 3. Metode Belah Dua (Split-Half Methodl) Metode belah dua dilakukan dengan cara memberikan satu bentuk tes yang hanya diberikan sekali kepada sekelompok subjek dengan tujuan untuk menghindari kelemahan pada metode tes ulang dan metode tes sejajar. Metode belah dua dilakukan bila jumlah butir alat ukur genap. Pembelahannya dapat dilakukan atas dasar nomor butir butir ganjil – genap atau nomor butir awal – akhir. Perhitungan r, menggunakan skor mentah untuk mengestimasi hubungan butir-butir ganjil (belahan pertama) dan butir-butir genap (belahan kedua), digunakan rumus Pearson Product Moment . Untuk estimasi koefisien reliabilitas belah dua (Split-Half) ada tiga buah rumus atau formula yang dapat digunakan, masing-masing yaitu ((1) formula SpearmanBrown, (2) formula Rulon, dan (3) formula Flanagan. 1) Menggunakan Rumus Spearman-Brown: Estimasi koefisien reliabilitasnya belah dua dengan menggunakan rumus Spearman-Brown adalah sebagai berikut (Streiner dan Norman, 2000):



=



(



)



239 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



dengan k adalah jumlah bagian (belahan) butirbutir r adalah korelasi semula, yaitu korelasi antara skor belahan 1 dan skor belahan 2 Bentuk khusus rumus Spearman-Brown ketika diterapkan pada reliabilitas belah dua adalah sebagai berikut (Pedhazur dan Schmelkin, 1991):



dengan



adalah reliabilitas, dan



adalah korelasi



diantara dua belahan Langkah-langkah estimasi koefisien belah dua Spearman-Brown adalah: a. Membagi skor-skor siswa menjadi dua bagian, misalnya satu bagian butir-butir yang bernomor ganjil, dan satu bagian lagi butir-butir yang bernomor genap b. Menjumlahkan skor-skor dari butir-butir yang bernomor ganjil yang dimiliki masing-masing siswa c. Menjumlahkan skor-skor dari butir-butir yang bernomor genap yang dimiliki masing-masing siswa d. Menghitung koefisien korelasi menggunakan rumus product-momen, diperoleh (korelasi paruh antara belahan ganjil-genap) ( )( ) √*



(



) +*



(



240 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



) +



Prof. Dr. Yusrizal, M.Pd



e. Menghitung (korelasi penuh) menggunakan rumus Spearman -Brown



f. Menginterpretasi Contoh:



Ibu Dian membuat 10 butir tes Sains bagi siswanya di kelas 3. Untuk menentukan reliabilitas tesnya, ibu Dian menggunakan metode belah dua Sperman-Brown. Skor-skor siswa dari nomor butir ganjil dan nomor butir genap disajikan di bawah. Berapa besar koefisien reliabilitas tes yang dikembangkan bu Dian itu?.



Ganjil (X) 5 4 5 3 3 4 4 3 ∑X = 31



Genap (Y) 5 3 4 2 3 0 3 5 ∑Y= 25



XY



X2



Y2



25 12 20 6 9 0 12 15 ∑= 99



25 16 25 9 9 16 16 9 ∑ = 125



25 9 16 4 9 0 9 25 ∑ = 97



Dari Tabel diatas diketahui : N = 8; = 99 , = 125 dan



= 31; = 25,



241 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



= 25;



Prof. Dr. Yusrizal, M.Pd



Subtitusikan nilai-nilai di atas ke dalam rumus product moment ( √*



(



√*(



√(



)



) +*( )(



)



(



) +



)



(



)+



)



(



)+



)(



)



) +



)(



( )



(



(



) (



)



)



) +*



( )( √*( )(



)(



(



) *(



=



= 0,221



Menggunakan rumus Spearman-Brown, reliabilitas seluruh tes dihitung sebagai berikut:



(



)



= 0,361



Koefisien reliabilitas diperoleh adalah sebesar 0,361. Ini berarti bahwa tes yang dikembangkan ibu Dian itu tidak reliabel. 2) Menggunakan Rumus Rulon Rumus lain untuk estimasi reliabilitas belah dua adalah dikembangkan oleh Rulon (1939). Menurut Rulon 242 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



reliabilitas dapat dipandang dari adanya selisih skor yang diperoleh pada belahan pertama dengan belahan kedua. Selisih tersebut yang menjadi sumber variasi eror sehingga bila dibandingkan dengan variasi skor akan dapat menjadi dasar untuk melakukan estimasi reliabilitas tes. Rumus Rulon adalah sebagai berikut:



adalah koefisien reliabilitas adalah varians perbedaan skor belahan adalah varians skor total 1 adalah bilangan konstan Untuk mencari (varians perbedaan skor belahan) digunakan rumus: dengan



(



)



= Untuk mencari



(varians skor total) digunakan rumus: (



)



= Langkah-langkah estimasi koefisien reliabilitas belah dua menggunakan Rumus Rulon adalah: a. Membagi skor-skor siswa menjadi dua bagian, misalnya satu bagian butir-butir yang nomor urut ganjil, dan satu bagian lagi butir-butir yang nomor urut genap b. Menghitung perbedaan skor d = X – Y 243 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



c. Menjumlahkan d, sehingga diperoleh d. Mengkuadratkan d dan menjumlahkannya, sehingga diperoleh e. Menghitung koefisien reliabilitas dengan rumus Rulon yaitu:



f. Menginterpretasi Contoh:



Ganjil (X) 5 4 5 3 3 4 4 3 ∑X =31



Ibu Rini membuat 10 butir tes Sains bagi siswanya di kelas 3. Untuk menentukan reliabilitas tesnya, ibu Rini menggunakan metode belah dua Rulon. Skor-skor siswa dari nomor butir ganjil dan nomor butir genap disajikan di bawah. Berapa koefisien reliabilitas tes yang disusun oleh bu Rini tersebut?. Genap (Y) 5 3 4 2 3 0 3 5 ∑Y=25



d (X-Y) 0 1 1 1 0 4 1 -2 ∑= 6



= X+Y 0 1 1 1 0 16 1 4 ∑= 24



10 7 9 5 6 4 7 8



100 49 81 25 36 16 49 64



∑= 56



∑= 420



244 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Dari Tabel di aatas diketahui : N = 8;



= 31;



=25, ∑d= 6,



∑d2 = 24, ∑X t= 56 dan ∑



= 420



Mencari varian perbedaan skor: (



)



=



( )



=



=



= 2,437



Mencari varian skor total: (



=



)



(



)



=



= =1-



= 3,50



=1- 0,67 = 0, 329



Koefisien reliabilitas yang adalah diperoleh sebesar 0,329. Ini berarti bahwa tes yang dikembangkan ibu Rini itu tidak reliabel. 3) Menggunakan Rumus Flanagan: Selain metode Spearman-Brown dan Rulon, estimasi reliabilitas belah dua juga dapat digunakan rumus Flanagan, yaitu



 s2  s2 r11  21  1 2 2 st 



  



Keterangan : r11 = koefisien reliabilitas 245 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



s12 = varians skor butir belahan pertama s22 = varians skor butir belahan kedua. St2 = varians skor total Untuk mencari rumus:



(varians belahan pertama) digunakan (



)



= Untuk mencari rumus:



(varians belahan kedua) digunakan (



)



= Untuk mencari



(varians total) digunakan rumus: (



)



= Langkah-langkah estimasi koefisien reliabilitas belah dua menggunnakan Rumus Flanagan adalah: a. Membagi skor-skor siswa menjadi dua bagian, misalnya satu bagian butir-butir yang nomor urut ganjil, dan satu bagian lagi butir-butir yang nomor urut genap b. Menghitung (varians belahan pertama) c. Menghitung (varians belahan kedua) d. Menghitung (varians belahan total) e. Menghitung koefisien reliabilitas dengan rumus Flanagan yaitu:



246 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



= 2(



)



f. Menginterpretasi Contoh: Ibu Ayu membuat 10 butir tes IPA bagi siswanya di kelas 3. Untuk menentukan reliabilitas tesnya, ibu Ayu menggunakan metode belah dua Flanagan. Skor-skor siswa dari nomor butir ganjil dan nomor butir genap disajikan di bawah. Berapa besar koefisien reliabilitas tes yang disusun bu Ayu itu?. Ganjil (X1) 5 4 5 3 3 4 4 3 ∑X =31



Genap (X2) 5 3 4 2 3 0 3 5 ∑Y=25



25 16 25 9 9 16 16 9



25 9 16 4 9 0 9 25



∑= 125



∑= 97



= X1+X2 10 7 9 5 6 4 7 8 ∑= 56



Dari Tabel di aatas diketahui : N = 8; ∑



= 31;



=25, ∑



= 97, ∑X t= 56 dan ∑



= 125, = 420



247 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



100 49 81 25 36 16 49 64 ∑= 420



Prof. Dr. Yusrizal, M.Pd



Mencari varian belahan pertama: (



)



=



(



)



=



=



= 0,609



Mencari varian belahan kedua: (



)



=



(



)



=



=



= 2,359



Menc ri varians total: (



=



)



(



=



)



=



= 3,50



Selanjutnya nilai-nilai varians dari kedua belahan dan nilai varian total disubtitusikan ke dalam rumus Flanagan diperoleh = 2(



) = 2(



) =2(1-



) = 2(0,152) = 0,304 Koefisien reliabilitas diperoleh sebesar 0,304. Ini berarti bahwa tes yang dikembangkan ibu Ayu itu tidak reliabel.



248 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



4. Metode Konsistensi Internal (Consistency Internal Methodl) Metode konsistensi internal atau kadang-kadang disebut metode tes tunggal dilakukan dengan cara memberikan satu bentuk tes yang hanya diberikan sekali kepada sekelompok subjek. Untuk estimasi koefisien reliabilitas metode konsistensi internal dapat digunakan formula-formula Kuder-Richardson (KR-20 dan KR-21) dan alpha Cronbach. 1) Rumus Kuder Richardson 20 (KR-20) Untuk mengetahui koefisien reliabilitas tes atau alat ukur yang yang mempunyai skor dikotomi (0,1) seperti bentuk pilihan ganda digunakan rumus Kuder Richadson 20 (KR-20) seperti berikut (Wiersma dan Jurs, 1990): =



(



)



dengan: n adalah jumlah butir tes, p adalah proporsi yang menjawab benar satu butir q adalah proporsi yang menjawab salah satu butir, dan adalah varians skor total. Hasil perhitungan dengan rumus KR 20 lebih teliti, tetapi perhitungan lebih rumit. Langkah-langkah estimasi koefisien reliabilitas menggunnakan rumus KR-20 adalah: a. Mendistribusikan skor-skor dalam tabel kerja b. Menghitung ∑ pq c. Menghitung (varians total) dengan rumus: 249 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(



)



= d. Menghitung koefisien reliabilitas dengan rumus KR20 yaitu: =



(



)



e. Menginterpretasi Contoh:Ibu Eva membuat 10 butir tes pilihan ganda dalam mata pelajaran Sains bagi siswanya di kelas 3. Untuk menentukan reliabilitas tesnya, ibu Eva menggunakan metode konsistensi internal dengan rumus KR-20. Berapa besar koefisien reliabilitas tes yang disusun bu Eva ?



250 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



R es



Butir



1 2



3



4



5



6



7



8



9



1 0



X



X2



A



1



1



1



1



1



1



1



1



1



1



10



B C D E F G H I J p



1 1 1 1 1 1 1 1 1 1 0



1 1 1 1 1 1 1 0 0 0, 8 0, 2



1 1 1 1 1 1 0 0 0 0, 7 0, 3



1 1 1 1 1 0 0 0 0 0, 6 0, 4



1 1 1 1 0 0 0 0 0 0, 5 0., 5



1 1 0 1 0 0 1 0 0 0, 3 0, 7



1 0 0 1 0 0 0 0 0 0, 3 0, 7



0 1 0 1 0 1 0 0 0 0, 4 0, 6



1 1 0 0 0 0 0 0 0 0, 3 0. 7



9 9 6 9 5 4 4 2 1 59



q



1 1 1 1 1 1 1 1 0 0, 9 0, 1



10 0 81 81 36 81 25 16 16 4 1 44 1



p q



0



0, 09



0, 16



0, 21



0, 24



0, 25



0, 21



0, 21



0, 24



0, 21



1, 82



Dari Tabel di atas dapat diketahu:∑ pq = 1,82. ∑X = 59, ∑ = 441



Varian total menjadi: (



)



=



(



=



)



=



= 9,25



Selanjutnya nilai-nila tersebut disubtitusika ke dalam rumusKR-20 =



(



)



251 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(



=



) =(



)(1 – 0,196) =



0,892 Koefisien reliabilitas yang diperoleh sebesar 0,802 termasuk dalam kategori tinggi 2) Rumus Kuder Richardson 21(KR-21) Apabila Indeks Kesukaran Butir (IKB) bersifat homogen, yang berarti bahwa p relatif konstan untuk keseluruhan butir, maka indeks reliabilitas tes dihitung dengan metode KR21. Rumusnya adalah sebagai berikut (Wiersma dan Jurs, 1990): :



=



(



(



)



)



dengan n adalah jumlah butir pada tes



adalah skor rata-rata tes, dan adalah varians skor total. Rumus KR21 lebih sederhana dalam perhitungannya. Kelemahannya adalah kurang teliti dibandingkan dengan KR20. Langkah-langkah estimasi koefisien reliabilitas menggunnakan rumus KR-21 adalah: a. Mendistribusikan skor-skor dalam tabel kerja b. Menghitung (varians total) dengan rumus: (



)



= 252 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



c. Menghitung skor rata-rata tes ( ) d. Menghitung koefisien reliabilitas dengan rumus KR-21 yaitu: (



(



=



)



)



e. Menginterpretasi Contoh:Ibu Eli membuat 10 butir tes pilihan ganda dalam mata pelajaran Biologi bagi siswanya di kelas 3. Untuk menentukan reliabilitas tesnya, ibu Eli menggunakan metode konsistensi internal dengan rumus KR-21. Tentukan koefisien reliabilitas tes yang dikonstruksi ibu Eli tersebut? Res A B C D E F G H I J



Butir



1



2



3



4



5



6



7



8



9



10



1 1 1 1 1 1 1 1 1 1 10



1 1 1 1 1 1 1 1 1 0 9



1 1 1 1 1 1 1 1 0 0 8



1 1 1 1 1 1 1 0 0 0 7



1 1 1 1 1 1 0 0 0 0 6



1 1 1 1 1 0 0 0 0 0 5



1 1 1 0 1 0 0 1 0 0 3



1 1 0 0 1 0 0 0 0 0 3



1 0 1 0 1 0 1 0 0 0 4



1 1 1 0 0 0 0 0 0 0 3



253 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



X



X2



10 9 9 6 9 5 4 4 2 1 59



100 81 81 36 81 25 16 16 4 1 441



Prof. Dr. Yusrizal, M.Pd



Menghitung vaarian total (



)



=



(



)



=



=



= 9,25



= 59/10 = 5,9 Menghitung reliabilitas dengan rumus :



(



) (



)



(



(



=



)



)=



(



)



=(



) = 0,82



)(



Koefisien reliabilitas yang diperoleh sebesar 0,82 termasuk dalam kategori tingi 3) Rumus Alpha (α) Rumus alpha (α) Cronbach merupakan koefisien konsistensi internal yang paling sering digunakan untuk analisis reliabilitas. Alpha Cronbach dapat digunakan untuk item-item dengan respons kontinum. Bentuk rumus alpha Cronbach yaitu : (



dengan :



)



n adalah jumlah butir, adalah jumlah varian butir, dan adalah varian dari skor total



254 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Pedhazur dan Schmelkin (1991) memperluas rumus alpha khusus untuk skor dikotomi, yang bentuknya sebagai beriku: (



)



dengan p adalah proporsi yang mempunyai skor 1, dan q = 1- p, yaitu proporsi yang mempunyai skor 0. Langkah-langkah estimasi koefisien reliabilitas menggunnakan rumus alpha Cronbach adalah: a. Mendistribusikan skor-skor dalam tabel kerja b. Menghitung (varians butir) dari setiap butir dengan rumus: (



)



= c. Menjumlahkan semua varian butir sehingga diperoleh d. Menghitung (varians total) dengan rumus: (



)



= e. Menghitung koefisien reliabilitas dengan rumus alpha Cronbach yaitu: (



)



f. Menginterpretasi Contoh: Ibu Aini membuat 5 butir tes esei pelajaran Bahasa Indonesia bagi siswanya di kelas 3. Untuk 255 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



menentukan reliabilitas tesnya, ibu Aini menggunakan rumus alpha Cronbach. Skor-skor siswa disajikan dalam Tabel di bawah. Tentukan koefisien reliabilitas tes itu ? Siswa A B C D E F G H I J ∑ ∑ ∑



1 15 10 5 20 15 7 15 20 15 4



2 20 7 7 20 17 8 17 19 15 3



Butir 3 17 12 5 17 15 7 14 17 16 4



4 18 9 8 20 18 5 15 20 14 4



5 20 10 5 18 17 9 15 17 15 3



126 1890



133 2135



124 1778



131 2055



129 1967



90 48 30 95 82 36 76 93 75 18 643



Keterangan: N = Jumlah responden (siswa) a. Menghitung varians butir dengan rumus: (



)



= (



)



= (



=



=



= 30,24



=



= 36,61



)



256 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



8100 2304 900 9025 6724 1296 5776 8649 5625 324 48723



Prof. Dr. Yusrizal, M.Pd



(



)



= (



(







= 30,24



=



= 30,29



=



= 33,89



)



= =



= 24,04



)



=







=



36,61



b. Menghitung varians total dengan rumus: (



)



= (



)



=



=



= 737,81



c. Menghitung reliabilitas dengan rumus alpha Cronbach: (



(



)



) = 0,99



257 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Dapat dilihat bahwa koefisien reliabilitas yang diperoleh adalah 0,99, yang berada dalam kategori sangat tinggi. 4) Rumus Hoyt Selain metode atau rumus-rumus di atas, untuk menghitung koefisien reliabilitas dapat juga diperoleh dengan teknik analisis varian yang menggunakan rumus Hoyt yang bentuknya sebagai berikut.



r = 1 -dengan : MKbs = varians siswa MKs = varians responden r = reliabiltas tes Langkah-langkah estimasi koefisien reliabilitas jika menggunakan Rumus Hoyt adalah: a. Membuat tabel penyebara skor-skor jawaban siswa b. Menjumlahkan skor-skor butir tes yang betul, juga menjumlahkan skor –skor tiap siswa ( ) sehingga diperoleh ∑ , c. Mencari jumlah kuadrat total (J ) dengan rumus: J



)



(



=∑



)



-



d. Hitung jumlah kuadrat antar butir ( rumus (



)







(



), dengan



)



e. Hitung jumlah kuadrat antar siswa ( rumus:



) dengan



258 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(



JKs =



)







(



)



f. Hitung jumlah kuadrat antar responden-butir (



)



JKbs= JKt – JKb - JKs g. Hitung rata-rata jumlah kuadrat antar butir (MKb) dengan rumus: MKb = h. Hitung rata-rata jumlah kuadrat antar responden ( ), dengan rumus: = i.



Hitung rata-rata jumlah kuadrat antar butirresponden ( )



M j.



=



Menghitung Hoyt, yaitu



(



)



menggunakan rumus



r = k. Menginterpretasi r Contoh: Pak Fendi membuat 10 butir tes pilihan ganda dalam mata pelajaran fisika bagi 10 orang siswanya. Untuk menentukan reliabilitas tesnya, pak Fendi menggunakan rumus Hoyt. Tentukan reliabilitas tesnya.



259 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Res A B C D E F G H I J B



Butir



1



2



3



4



5



6



7



8



9



10



1 1 1 1 1 1 1 1 1 1 10



1 1 1 1 1 1 1 1 1 0 9



1 1 1 1 1 1 1 1 0 0 8



1 1 1 1 1 1 1 0 0 0 7



1 1 1 1 1 1 0 0 0 0 6



1 1 1 1 1 0 0 0 0 0 5



1 1 1 0 1 0 0 1 0 0 5



1 1 0 0 1 0 0 0 0 0 3



1 0 1 0 1 0 0 0 0 0 3



1 1 1 0 0 0 0 0 0 0 3



Xt 10 9 9 6 9 5 4 4 2 1 59



100 81 81 36 81 25 16 16 4 1 441



Dari tabel di atas dapat diketahui: ∑X =59, ∑ = 441, ∑ = 10, ∑ = 9, ∑ = 8, ∑ = 7, ∑ = 6, ∑ = 5, ∑ = 3,∑ = 3, ∑ = 4, ∑ = 3, N = 100 yaitu: 10 (banyaknya siswa) x 10 (banyaknya butir) Menghitung jumlah kuadrat total (J J



)



=



-



(



)



= 59



(



)



))



= 59-



= 24,19



Menghitung jumlah kuadrat antar butir ( (



=( (



)



+







(



+



)



)



+ +



+



+



+



+



+ )-



)



260 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



= 10 + 8,1 +6,4 + 4,9 + 3,6 + 2,5 + 2,5 + 0,9 +1,6 + 0,9 – 34,81 = 41,1 – 34,81 = 6,29 Menghitung jumlah kuadrat antar siswa ( JKs =



=( (



(



)



+



– +



(



)



)



+



+



+ +



+



+



+ )-



)



= (10 +8,1 + 8,1 + 3,6 +8,1 +2,5+ 1,6 +1,6 +0,4 + 0,10) - 34,81 = 44,1 – 34,81 = 9,29 Menghitung jumlah kuadrat antar responden-butir ( JKbs= JKt – JKb - JKs JKbs = 24,19 – 6,29 – 9,29 JKbs = 8,61 Menghitung rata-rata jumlah kuadrat antar butir (MKb) MKb =



=



0,698



261 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



)



Prof. Dr. Yusrizal, M.Pd



Menghitung rata-rata jumlah kuadrat antar responden ( )



=



=



=



= 1,03



Menghitung rata-rata jumlah kuadrat antar butirresponden ( )



M



=



=



(



)(



)



-=



=



= 0,106



Mensubtitusikan data tersebut di atas ke dalam rumus Hoyt



r =



= 1 --



= 0,897



Dapat dilihat bahwa koefisien reliabilitas yang diperoleh adalah 0,897, yang berada dalam kategori sangat tinggi. Tabel 11.2 Hasil Perhitungan Reliabilitas Analisis Varians Koefisien SumberVarians JK db MK Reliabilitas Butir 6,29 10 – 1 =9 0,698 Responden 9,29 10 – 1 = 0,807 =9 1,03 Keliru (Butir8,61 9 x 9 = Responden) = 81 0,106 262 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Ringkasan dari jenis-jenis reliabilitas dan cara mengestimasinya dapat dilihat dalam Tabel 11.2 berikut. Tabel 11.2 Metode Estimasi Reliabilitas Bentuk Reliabilitas 1.Tes Ulang (stabilitas) • Product moment dan korelasional 2. Paralel (ekuivalen) • Product moment dan korelasi Intrakelas 3. Split-half methods (metode belah dua) • Persamaan splithalf Spearman Brown Rumus Flanagan Rumus Rulon 3.Internal consistency • Kuder Richardson(KR20) • Kuder



Cara estimasi  memberikan tes yang sama sebanyak dua kali kepada peserta tes yang sama dalam waktu yang berbeda, skor-skornya dikorelasikan untuk mencari koefisien reliabilitas  memberikan dua tes yang sama kepada peserta tes yang sama dalam waktu yang relatif sama, kedua skor dikorelasikan untuk mencari koefisien reliabilitas  memberikan satu kali tes lalu dibelah dua, kemudian mengkorelasikan kedua belahan dengan rumus korelasi product moment,



  



Berikan sekali tes, kemudian menggunakan rumus KR-20 Berikan sekali tes, kemudian menggunakan rumus KR-21 Berikan sekali tes, kemudian menggunakan rumus



263 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Richardson(KR21) • Koefisien alpha Cronbach • Rumus Hoyt



alpha Cronbach







Berikan sekali tes, kemudian menggunakan rumus Hoyt



D. Kesalahan Pengukuran Standar Kesalahan Pengukuran Standar (Standard Error of Measurement, atau SEM) adalah ukuran yang mencerminkan tidak akuratnya skor dari tes yang digunakan untuk mengukur (Purwanto, 2009). Semakin tinggi koefisien reliabilitas maka semakin akurat dan makin rendah kesalahan standar pengukuran. Sebaliknya, semakin rendah koefisien reliabilitas maka makin tinggi kesalahan standar pengukuran dan makin tidak cermatnya pengukuran menggunakan tes. Dalam pengumpulan data hasil belajar di mana skor-skor akan dibandingkan secara individual sangat penting untuk memperhitungkan kesalahan standar pengukuran. Kesalahan standar pengukuran dihitung menggunakan rumus sebagai berikut : SEM = SD √ di mana : SEM = standard error of measurement SD = standar diviasi r = koefisien reliabilitas. Misalnya, Rossa seorang siswa memperoleh skor 50 pada suatu Tes yang mempunyai koefisien reliabilitas 264 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



sebesar 0,977 yang mempunyai standar yang ditentukan 90 berapakah interval Rossa ?



diperoleh dari kelompok siswa yang deviasi 13,51. Bila taraf kepercayaan % (atau taraf signifikansi p = 0,10), kepercayaan terhadap skor murni



Menggunakan rumus (SEM) di atas, maka SEM = SD √



= 13,5 √



kesalahan standar pengukuran



= 2,049



Jika koefisien reliabilitasnya rendah, misalnya r = 0,64, maka SEM = SD √ = 13,5 √ standar menjad besar.



= 8,1, artinya kesalahan



E. Faktor-Faktor yang mempengaruhi Reliabiltas 1. Panjang tes Secara umum semakin panjang suatu tes maka akan semakin tinggi pula reliabilitas tes tersebut. Panjang atau pendeknya suatu tes ditunjukkan oleh banyak atau sedikitnya jumlah butir. Alasannya, berdasarkan fakta bahwa tes yang panjang atau butir-butir tes yang banyak akan memberikan sampel soal yang mencukupi terhadap perilaku yang diukur. Selain itu, tes yang panjang, cenderung untuk mengurangi pengaruh terkaan.



265 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Untuk menghitung besarnya reliabilitas tes setelah ada penambahan banyak butir soal dapat digunakan rumus Spearman-Brown berikut :



=



(



)



dimana: rn = besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir soal baru. n = berapa kali butir-butir soal tersebut ditambah. r1 = besarnya koefisien reliabilitas sebelum butir-butir soal ditambah Sebagai contoh, suatu tes yang mempunyai 20 butir dan koefisien reliabilitasnya (r 1) sebesar 0,6. Berapakah koefisien reliabilitasnya (r 2) tes ini jika jumlah butirnya diperbanyak menjadi 40 ?. Tes yang mempunyai 40 butir artinya tes ini ditambah butirnya menjadi 2 kali jumlah butir dari sebelumnya, yaitu 20 butir. Menggunakan rumus Spearman-Brown di atas maka:



r2 = r2 =



(



)



= 0,75



Kalau tes tersebut ditambah lagi butirnya menjadi 3 kali lipat dari semula, maka koefisien reliabilitasnya menjadi:



266 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



r3 = r3 =



(



)



= 0,87



2. Penyebaran skor Koefisien reliabilitas secara langsung dipengaruhi oleh penyebaran skor dalam kelompok yang diukur. Semakin besar penyebaran skor maka semakin besar pula koefisien reliabilitas yang diperoleh. 3. Objektivitas Objektivitas sebuah alat ukur menyatakan derajad untuk pemberi skor kompeten yang sama mendapatkan hasil yang sama. Skor butir-butir tes objektif seperti pilihan ganda, skor yang dihasilkan tidak dipengaruhi oleh keputusan dan pendapat pemberi skor. Semakin tinggi tingkat objektivitas tes semakin tinggi pula tingkat reliabilitasnya. 4. Metode estimasi reliabilitas Secara umum, besarnya koefisien reliabilitas berkaitan erat dengan metode yang digunakan untuk estimasi reliabilitas. Misalnya, mengestimasi koefeisien reliabillitas menggunakan metode tes ulang (Test Retest Method): mungkin hasilnya lebih besar dibandingkan dengan metode belah dua jika interval waktunya pendek.



F. Hubungan Antara Reliabilitas dan Validitas 267 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Menurut Anderson (1981) persyaratan bagi suatu tes adalah validitas dan reliabilitas, dalam hal ini validitas lebih penting dan reliabilitas ini perlu karena menyokong terbentuknya validitas. Sebuah tes mungkin reliabel tetapi tidak valid. Sedangkan sebuah tes yang valid biasanya reliabel



Gambar: Hubungan antara validitas dan reliabilitas















Keterangan: Gambar a) hasil tembakan yang valid dan reliabel, karena hasilnya tepat pada sasaran dan masih dalam luasan konsisten Gambar b) hasil tembakan yang tidak valid dan tidak reliabel, karena sasaran gerak labil dan merata ke semua luasan target Gambar c) hasil tembakan yang reliabel tetapi tidak valid karena hasil tembakan pada luasan konsisten di luar ketepatan target yang telah ditetapkan.



268 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 12 ANALISIS BUTIR TES A.Pengertian Analisis Butir Tes Analisis butir soal didefinisikan sebagai suatu proses sistematik untuk mengkaji kualitas butir-butir soal tes terutama tes obyektif. Analisis butir es adalah salah satu kegiatan yang perlu dilakukan dalam rangka meningkatkan mutu suatu tes, khususnya mutu tiap butir soal yang menjadi bagian dari tes itu. Kegiatan menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan guru untuk meningkatkan mutu soal yang telah ditulis. Tujuannya adalah untuk mengkaji dan 269 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum soal digunakan. Soal yang bermutu adalah soal yang dapat memberikan informasi setepattepatnya sesuai dengan tujuannya di antaranya dapat menentukan peserta didik mana yang sudah atau belum menguasai materi yang diajarkan guru.



B. Manfaat Analisis ButirTes Anastasi dan Urbina (1997) mengemukakan bahwa manfaat dilakukannya analisis butir antara lain adalah: (1) dapat membantu para pengguna tes dalam evaluasi atas tes yang digunakan, (2) sangat relevan bagi penyusunan tes informal dan lokal seperti tes yang disiapkan guru untuk siswa di kelas, (3) mendukung penulisan butir soal yang efektif, (4) secara materi dapat memperbaiki tes di kelas, dan (5) dapat meningkatkan validitas soal dan reliabilitas Linn dan Gronlund (1995) menyatakan bahwa pelaksanaan kegiatan analisis butir soal didesain untuk menjawab pertanyaan-pertanyaan sebagai berikut. 1) Apakah fungsi soal sudah tepat? 2) Apakah soal ini memiliki tingkat kesukaran yang tepat? 3) Apakah soal bebas dari hal-hal yang tidak relevan? 4) Apakah pilihan jawabannya efektif? Analisis pada umumnya dilakukan melalui dua cara yaitu (1) analisis butir soal tes secara kualitatif dan (2) analisis butir soal tes secara kuantitatif. Dalam analisis butir soal secara kualitatif, aspek yang diperhatikan adalah 270 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



setiap soal ditelaah dari segi materi, konstruksi, bahasa, dan kunci jawaban/pedoman penskorannya. Analisis kualitatif sering pula dinamakan sebagai analisis teoritik yang dilakukan sebelum soal digunakan untuk melihat berfungsi tidaknya sebuah soal. Sedangkan analiis butir soal secara kuantitatif adalah penelaahan butir soal didasarkan pada data empirik dari butir soal yang bersangkutan. Data empirik ini diperoleh dari soal yang telah diujikan. Analisis secara teoritis adalah telaah soal yang difokuskan pada aspek materi, konstruksi, dan bahasa. Aspek materi berkaitan dengan substansi keilmuan yang ditanyakan serta tingkat berpikir yang terlibat, aspek konstruksi berkaitan dengan teknik penulisan soal, dan aspek bahasa berkaitan dengan kekomunikatifan /kejelasan hal yang ditanyakan (Mardapi, 2004). 1. Analisis Butir Tes Secara Kualitatif Analisis soal secara teoritik atau analisis kualitatif dilakukan sebelum diadakan ujicoba, yakni dengan cara mencermati butir. Telaah soal atau penilaian butir soal secara kualitatif merupakan analisis teoritis. Menurut Kartowagiran (2011), dalam analisis soal tes secara teoritik yang dikaji adalah kesesuaian antara butir-butir soal dengan tujuan atau indikator dan apakah soal tes sudah memenuhi validitas isinya. Soal tes juga dicermati penggunaan bahasa, kejelasan dan kesingkatannya, juga dilihat kejelasan dan kefungsian tabel dan atau gambar. Pilihan jawaban juga dicermati homogenitas dan kejelasannya. 271 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Caranya adalah kepada beberapa penelaah diberikan: butir-butir soal yang akan ditelaah, format penelaahan, dan pedoman penilaian/penelaahannya.



2. Analisis Butir Tes Secara Kuantitatif Ada dua pendekatan dalam analisis secara kuantitatif, yaitu pendekatan secara klasik dan modern. Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori tes klasik. Analisis butir soal secara modern yaitu penelaahan butir soal dengan menggunakan Item Response Theory (IRT) atau teori jawaban butir soal. Teori ini merupakan suatu teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu scal dengan kemampuan siswa. Dalam buku ini yang dibahas adalah analisis butir menggunakan teori tes klasik. Kualitas butir dalam analisis butir soal secara teori tes klasik adalah setiap butir soal direpresentasi oleh tingkat kesukaran butir, daya beda butir, dan khusus untuk tes pilihan ganda adalah keefektifan pengecoh (Mehrens & Lehmann, 1984) Ketiga tahapan tersebut diuraikan sebagai berikut a. Tingkat Kesukaran Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan 272 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran merupakan rasio antara penjawab item dengan benar dan banyaknya penjawab butir (Gronlund, 1982). Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk proporsi yang besarnya berkisar 0,00 - 1,00 (Aiken, 1994). Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil hitungan, berarti semakin mudah soal itu. Soal dengan indeks kesukaran 0,00 menunjukkan soal tersebut terlalu sukar, sebaliknya soal dengan indeks kesukaran 1,00 menunjukkan soal tersebut terlalu mudah. Allen dan Yen (1979) menyatakan bahwa secara umum indeks kesukaran suatu butir sebaiknya terletak pada interval 0,3 – 0,7. Pada interval ini, informasi tentang kemampuan siswa akan diperoleh secara maksimal. Sedangkan Thomas dan Dawson (1972) menjelaskan bahwa butir soal yang memiliki tingkat kesukaran 0,25 - 0,75 sudah dikatakan baik. Rumus yang dipergunakan untuk soal obyektif menurut Nitko (1996). adalah



p = dengan : p = Proporsi menjawab benar atau Indeks tingkat kesukaran ∑ B = banyaknya peserta tes yang menjawab benar. N = jumlah peserta tes yang menjawab.



273 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Cara lain menghitung indek kesukaran butir adalah dengan menggunakan rumus berikut (Gronlund, 1982).



p = x 100 % dengan P = Indeks kesukaran butir, R = jumlah jawaban butir yang betul, dan T = jumlah total butir yang di tes. Sebagai contoh: Misalkan hanya 30 dari 50 orang siswa dapat menjawab soal dengan betul, maka indeks kesukaran soal tersebut adalah:



p=



x 100 = 60 %



Untuk mengetahui tingkat kesukaran soal bentuk uraian digunakan rumus (Depdiknas, 2008) berikut ini. TingkatKesukaran =



Mean = Butir soal yang terlalu sukar sehingga hampir tidak terjawab oleh semua siswa atau terlalu mudah sehingga dapat dijawab oleh hampir semua siswa, sebaiknya dibuang karena tidak bermanfaat. Biasanya indeks kesukaran (p) diklasifikasikan menurut Asaad & Hailaya (2004) menjadi sebagai berikut :



274 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Tabel I. Indeks Kesukaran Butir Jarak Indeks 0,00 – 0,20 0,21 - 0,40 0,41 – 0,60 0,61 – 0,80 0,81 – 1,00



Tingkat Kesukaran Terlalu sukar Sukar Sedang Mudah Terlalui mudah



Tingkat kesukaran butir soal sangat penting karena dapat: (1) mempengaruhi karakteristik distribusi skor (mempengaruhi bentuk dan penyebaran skor tes atau jumlah soal dan korelasi antar soal), (2) berhubungan dengan reliabilitas. b.Daya Pembeda (D) Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara siswa yang telah menguasai materi yang ditanyakan dan siswa yang tidak/kurang/belum menguasai materi yang ditanyakan. Atau dengan kata lain, merupakan indeks perbedaan antara kelompok berkemampuan tinggi dengan berkemampuan rendah. Indeks daya pembeda setiap butir soal biasanya juga dinyatakan dalam bentuk proporsi. Semakin tinggi indeks daya pembeda soal berarti semakin mampu soal yang bersangkutan membedakan siswa yang telah memahami materi dengan siswa yang belum memahami materi. Indeks daya pembeda berkisar antara -1,00 sampai dengan +1,00. Semakin tinggi daya pembeda suatu soal, maka semakin kuat/baik soal itu. Jika daya pembeda 275 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



negatif (< 0) berarti lebih banyak kelompok bawah (siswa yang tidak memahami materi) menjawab benar soal dibanding dengan kelompok atas (siswa yang memahami materi yang diajarkan guru). Butir soal yang daya pembedanya rendah, tidak ada manfaatnya, malahan dapat merugikan siswa yang belajar sunguh- sungguh. Karena indeks daya pembeda suatu butir yang kecil nilainya akan menyebabkan butir tersebut tidak dapat membedakan siswa yang kemampuannya tinggi dan siswa yang kemampuannya rendah Daya pembeda butir soal bentuk pilihan ganda adalah dengan menggunakan rumus berikut (Gronlund dan Linn, 1995). D



=







dengan D = indeks Diskriminasi = jumlah jawaban benar kelompok atas = jumlah jawaban benar kelompok bawah T=: jumlah siswa kelompok atas atau bawah Rumus di atas adalah identik dengan rumus Depdiknas (2008). D=



atau D =



(



)



atau D =



276 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Karena P =



, maka dapat rumus daya beda dapat ditulis



dalam bentuk: D = PA - PB dengan D = daya pembeda soal BA = jumlah jawaban benar pada kelompok atas BB = jumlah jawaban benar pada kelompok bawah N = jumlah siswa yang mengerjakan tes 2. Langkah-Langkah Menghitung Daya Pembeda 1. Susunlah urutan peserta berdasarkan skor yang diperolehnya, mulai skor tertinggi sampai skor terendah 2. Bagilah peserta tes tersebut menjadi 2 (dua) kelompok yaitu : * Kelompok A: 27% sebagai kelompok atas * Kelompok B: 27% sebagai kelompok bawah 3. Hitung jumlah kelompok atas yang menjawab benar terhadap butir soal yang yang akan dihitung daya bedanya ( ) 4. Hitung jumlah kelompok bawah yang menjawab benar terhadap butir soal yang yang akan dihitung daya bedanya ( ) 5. Hitung proporsi peserta yang menjawab benar terhadap butir soal tersebut untuk kelompok atas dan kelompok bawah 277 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



6. Menghitung Indeks Daya Pembeda menggunakan rumus di atas Menurut Glass and Stanley (1970) selain rumus di atas, untuk mengetahui daya pembeda soal tes bentuk pilihan ganda dapat juga digunakan rumus korelasi point biserial (r pbis) seperti berikut.



√ keterangan Xb = rata-rata skor siswa yang menjawab benar Xs = rata-rata skor siswa yang menjawab salah SD = simpangan baku skor total p = adalah proporsi jawaban benar terhadap semua jawaban siswa, q = I –p



N o



Siswa



1



2



3



4



1 2 3 4 5 6 7 8 9



A B C D E F G H I



1 1 1 1 1 1 1 0 0



1 1 1 1 1 0 1 0 1



1 1 0 1 1 1 0 1 1



1 1 1 1 1 0 0 1 1



Nomor Butir 5 6 1 1 1 1 1 0 1 1 0



1 1 1 0 0 1 1 0 0



7



8



9



0 1 0 1 0 1 0 1 0



1 0 1 0 1 0 1 0 1



1 1 1 1 1 0 0 0 0



278 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



1 0 0 0 0 0 0 1 1 1 1



skor Total



Contoh: Hasil uji coba 10 butir soal pilihan ganda pada 10 orang siswa, adalah sebagai berikut:



8 8 7 7 7 5 6 5 5



Prof. Dr. Yusrizal, M.Pd



5



5



5



5



62



0,5



5



0,5



7



0,5



7



0,5



8



0,5



7



0,5



8



0,5



∑X P



0,5



4



0,5



1



0,5



0



0,7



0



0,3



1



0,7



0



0,3



0



0,8



0



0,2



1



0,7



0



0,3



1



0,8



J



Q 0,2



1 0



Ingin dihitung daya beda butir 1, Maka langkah perhitungannya adalah sebagai berikut:



(1) Menentukan proporsi menjawab benar (p) dengan rumus p = ∑ X/N = 8/10 = 0,8 (2) Menentukan nilai q, dengan rumus: q = 1- p q = 1-0,8 = 0,2 (3) Menentukan rata-rata skor total dengan rumus Mt = (62)/10 = 6,2 (4) Menentukan rata-rata skor siswa yang menjawab benar, yaitu 8 orang (kecuali H dan I) Mp = (8 + 6 +7 + 7 + 7 + 5 + 6 + 4)/8 = 6,50 (5) Menentukan standar deviasi dengan rumus



SD = √ √



=√



( (



) )



=√



( (



= 1,398



279 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



) )



=



Prof. Dr. Yusrizal, M.Pd







=



+







+ = 402



(6) Menentukan korelasi dengan persamaan







=



= 0,496







Angka 0,496 itu disebut indeks diskriminasi (Suryabrata, 2000), yang menunjukkan derajat kecermatan soal tersebut dalam membedakan siswa yang tinggi kemampuannya dari siswa yang rendah kemampuannya. Demikian dengan cara yang sama, maka indeks diskriminasi butir-butir 2, 3, 4, 5, 6, 7, 8, 9, 10 dapat dihitung. Untuk mengetahui daya pembeda soal bentuk uraian adalah dengan menggunakan rumus (Tim Puspendik, 2008) berikut ini. D= keterangan D = daya pembeda soal uraian Mean A = rata-rata skor siswa pada kelompok atas Mean B = rata-rata skor siswa pada kelompok bawah Skor Maks = skor maksmum yang ada pada pedoman penskoran



280 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Adapun klasifikasi indeks daya pembeda adalah seperti Tabel 2 berikut ini (Asaad & Hailaya, 2004). Tabel 2. Indek Diskriminasi Butir Jarak Indeks Di bawah 0,10 0,11 – 0,20 0,21 – 0,30 0,31 – 0,40 0,41 – 1,00



Tingkat Pembeda Butir diragukan Tidak membeda Sedang Membeda Sangat membeda



Menurut Ebel & Frisbie (1991), pada analisis butir tes dengan Content‐Referenced Measures, indeks daya diskriminasi (pembeda) butir tidak terlalu perlu menjadi perhatian, asalkan tidak negatif c. Analisis distraktor (pengecoh) Selain menghitung indeks kesukaran dan daya pembeda dalam analisis butir soal pilihan ganda juga perlu diketahui apakah distraktor atau pengecoh yang disediakan itu tepat atau tidak. Pada soal tes bentuk pilihan ganda, Option atau pilihan itu jumlahnya berkisar antara 3 sampai dengan 5 buah, dan dari kemungkinan‐ kemungkinan jawaban yang terpasang pada setiap butir itu, salah satu adalah merupakan jawaban betul (kunci jawaban), sedangkan sisanya adalah merupakan jawaban salah yang biasa dikenal dengan istilah distractor (pengecoh). Menurut Muhson,dkk (2012) menganalisis fungsi distraktor sering dikenal dengan istilah lain, yaitu: menganalisis pola penyebaran jawaban item. Suatu 281 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



kemungkinan dapat terjadi, bahwa dari keseluruhan alternatif yang ditetapkan pada butir tertentu, sama sekali tidak dipilih oleh peserta tes. Artinya peserta tes membiarkan kosong “blangko”. Pernyataan blangko ini sering dikenal dengan istilah omiet dan biasa diberi lambang dengan huruf O. Distraktor dinyatakan telah dapat menjalankan fungsinya dengan baik apabila distraktor tersebut sekurang‐kurangnya sudah dipilih oleh 5 % dari seluruh peserta tes. Menurut Fernandes (1984) distraktor dikatakan baik apabila paling tidak dipilih oleh 2 % dari seluruh peserta. Nitko (1996) menyatakan bahwa distraktor atau pengecoh dikatakan berfungsi apabila paling tidak dipilih oleh seorang peserta tes dari kelompok rendah. Untuk mengetahui berfungsi tidaknya sebuah pengecoh dapat digunakan rumus: %=



x 100 %



Pertimbangan terhadap analisis pengecoh: a. Diterima, karena sudah baik b. Ditolak, karena tidak baik c. Ditulis kembali, karena kurang baik



282 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Contoh: Pilihan Jawaban



Kelompok Atas Kelompok Bawah Jumlah



A



B



C



D



E



O



jumlah



5



7



15



3



3



0



33



8



8



6



5



7



3



37



13



15



21



8



10



3



70



O = Omitted (tidak menjawab), C* = kunci jawaban Pengecoh A : 13/70 x 100% > 5% , berfungsi B : 15/70 x 100% > 5% , berfungsi D : 8/70 x 100% > 5% , berfungsi E : 10/70 x 100% > 5% . berfungsi Menurut Arifin (2009), untuk menentukan indek pengecoh dapat juga dengan cara menggunakan rumus IP = (



) (



)



x 100 %



Keterangan: IP = Indek pengecoh P = jumlah siswa yang memilih pengecoh N = jumlah siswa yang ikut tes B = jumlah siswa yang menjawab betul pada setiap soal n = jumlah alternatif jawaban Adapun cara menafsirkan indeks pengecoh tersebut (Arifin, 2009) yaitu: Sangat Baik IP = 76 % - 125 % 283 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Baik Jurang Baik Jelek Sangat Jelek



IP = 51 % - 75 % atau 126 % - 150 % IP = 26 % - 50 % atau 151 % -175 % IP = 0 % - 25 % atau 176 % - 200 % IP = lebih dari 200 %n



Cara lain untuk menentukan indeks pengecoh adalah dengan menggunakan rumus



Ip = Np (



)



Keterangan: Np = jumlah siswa yang memilih pengecoh N = banyak option (pilihan) N = jumlah siswa yang ikut tes NB = jumlah siswa yang menjawab benar butir soal yang bersangkutan Untuk menafsirkannya adalah berdasarkan ketentuan berikut. Kriteria: > 200% : sangat buruk 0 – 25% atau 176-200% : buruk 26%-50% atau 151-175% : kurang baik 51%-75% atau 126-150% : baik 76%-125% : sangat baik 3. Analisis soal acuan patokan Tingkat kesukaran soal tes acuan patokan didasarkan atas berapa jauh tingkat prestasi belajar yang akan diukur. Apabila tingkat prestasi belajar yang harus 284 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



dicapai siswa tinggi, soal tes disusun dengan tingkat kesukaran yang tinggi pula. Daya beda soal pada acuan patokan tidak diperlukan, karena tes acuan patokan bukan untuk menentukan perbedaan siswa atas dasar prestasi belajarnya, tetapi untuk menentukan berapa persen mereka telah menguasai pelajaran yang telah diberikan. Yang dianalisis pada tes acuan patokan adalah mengukur efektivitas pengajaran, yaitu apakah pengajaran yang diberikan betul-betul efektif,atau sudah berapa persen siswa telah menguasai bahan pelajaran yang diberikan? Jadi, yang dianalisis pada tes acuan patokan adalah membandingkan hasil pengukuran antara pretes dan postes, yang disebut sebagai Indeks Efektivitas Pengajaran (Sensitivity to Instructional Effect) Untuk mengukur Indeks Efektivitas Pengajaran digunakan rumus berikut: E= dimana : E = indeks efektivitas pengajaran Ba = jumlah siswa yang menjawab betul sesudah menerima pengajaran Bb = jumlah siswa yang menjawab betul sebelum menerima pengajaran T = Total jumlah seluruh peserta tes Satu contoh analisis efektivitas pengajaran adalah sebagai berikut;



285 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Soal Pretes (PR) Postes (PT) 1. A 2. B 3. C 4. D 5. E 6. F



1



2



3



4



5



P R



PT



PR



PT



PR



PT



PR



PT



PR



PT



-



+ + + + + +



+ + + + + +



+ + + + + +



-



-



+ + + + + +



-



+ + -



+ + + + + -



Adopsi dari Joesmani, 1988+ = jawaban betul, - = jawaban salah Kesimpulan analisinya: Soal 1 :adalah soal yang ideal, sebelum diajar semua siswa menjawab salah, tetapi setelah diajar semua siswa menjawab betul Indeks Efektivitas Pengajaran adalah: E=



= 100



Soal 2: adalah terlalu mudah untuk mengukur hasil pengajaran, karena sebelum dan sesudah diajar siswa telah memberi jawaban betul Indeks Efektivitas Pengajaran adalah: E=



= 0,00



Soal 3 :adalah terlalu sukar dan tidak berhasil mengukur pengajaran, seakan-akan pengajaran yang telah diberikan



286 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



tidak ada gunanya, sebab sebelum diajarkan jawaban semua siswa salah, demikiasn pula sesudah diajar. Indeks Efektivitas Pengajaran adalah: E=



= 0, 00



Soal 4: adalah soal yang salah atau pengajaran yang salah, sebab sebelum diajar semua siswa telah memberi jawaban betul,tetapi setelah diajar semua siswa menjawab salah Indeks Efektivitas Pengajaran adalah: E=



= -1, 00



Soal 5 :adalah soal yang efektif, sebab proposisi siswa yang memberi jawaban betul pada postes lebih banyak daripada sebelum pretes Indeks Efektivitas Pengajaran adalah: E =



= 0,50



287 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



288 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



UNIT V



PENYUSUNAN SOAL DAN PENSKORAN Keberhasilan pengukuran hasil belajar bukan pada bentuk /tipe soal, tetapi pada mutu soal; Tes baru akan berarti bila terdiri dari butir soal yang menguji tujuan yang penting dan mewakili ranah yang diperlukan; Penyusunan soal perlu pengetahuan dasar dan latihan; Tes harus direncanakan dan dipertanggungjawabkan, karena itu penyusunan soal sagat perlu dan penting dilakukan. Setelah kita melakukan kegiatan tes terhadap siswa, kegiatan berikutnya adalah memberikan skor pada setiap lembar jawaban siswa. Kegiatan ini harus dilakukan dengan cermat karena menjadi dasar bagi kegiatan 289 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



pengolahan hasil tes sampai menjadi nilai prestasi. Sebelum melakukan tes, sebaiknya kita sudah menyusun teknik pemberian skor (penskoran). Bahkan sebaiknya kita sudah berpikir strategi pemberian skor sejak perumusan kalimat pada setiap butir soal. Pada Bab berikut ini akan disajikan pemberian skor pada tes domain kognitif. Membuat pedoman penskoran sangat diperlukan, terutama untuk soal bentuk uraian dalam tes domain kognitif supaya subjektivitas kita dalam memberikan skor dapat diperkecil. Salah satu aspek yang mempengaruhi keakuratan dan keadilan hasil penilaian adalah ketepatan guru dalam mengoreksi hasil jawaban siswa. Koreksi yang dilakukan tanpa hati-hati dan cermat berpotensi menghasilkan skor penilaian yang tidak tepat. Hal ini akan menyebabkan kurang tepatnya penilaian yang diberikan guru pada siswa. Dalam konteks inilah pedoman penskoran penting dan mutlak harus disiapkan sebaik-baiknya oleh guru. Pedoman penskoran merupakan pedoman menentukan skor terhadap hasil pekerjaan siswa. Dengan pedoman penskoran yang baik, guru memiliki pijakan yang jelas dalam memberikan skor terhadap jawaban siswa.



290 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 13 PENYUSUNAN DAN PENULISAN SOAL TES A.Penyusunan Tes 1. Langkah Penyusunan Pengembangan instrumen tes sebagai alat ukur ranah kognitif perlu menempuh langkah-langkah tertentu. Ada sejumlah langkah yang harus ditempuh untuk dapat mengembangkan tes hasil belajar dengan baik. Brennan (2006) mengemukakan langkah-langkah umum pengembangan tes sebagai berikut: 1) penentuan tujuan tes, 2) penyusunan kisi-kisi tes, 3) penulisan soal, 4) penelaahan soal, 5) uji coba soal termasuk analisisnya, 6) perakitan soal menjadi



291 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



perangkat tes, 7) penyajian tes, 8) penskoran, 9) pelaporan hasil tes, dan 10) pemanfaatan hasil tes. 1). Penentuan tujuan Tujuan tes harus dirumuskan secara jelas sehingga dapat memberikan arah dan lingkup pengembangan tes selanjutnya. Tujuan tes sangat penting karena setiap tujuan memiliki penekanan yang berbeda-beda. Misalnya, tujuan tes prestasi belajar, diagnostik, atau seleksi. Tujuan pemberian tes adalah untuk mengetahui sejauh mana siswa memahami atau menguasai materi tertentu setelah diajarkan/dibahas guru di ruang kelas 2). Penyusunan kisi-kisi tes Setelah tujuan tes dirumuskan, kita perlu membuat kisi-kisi tes (test blue-print/ table of specification). Tujuan penyusunan kisi-kisi adalah untuk menentukan ruang lingkup dan sebagai petunjuk dalam penulisan soal. Kisikisi dapat berupa format atau matriks. Kisi-kisi tes adalah deskripsi mengenai ruang lingkup dan isi dari apa yang akan diujikan, serta memberikan rincian mengenai soalsoal yang diperlukan oleh tes tersebut. Kisi-kisi pada umumnya berisi (1) rincian materi pembelajaran /aspek yang akan dievaluasi, (2) tingkah laku yang akan diukur berikut deskripsi indikatornya, (3) proporsi dan jumlah soal, serta (4) bentuk soal. Ada sejumlah langkah yang harus ditempuh untuk menyusun kisi-kisi tes. Langkah itu adalah: (1).Penentuan indikator-indikator (2). Pemilihan bentuk tes, dan (3). Penentuan panjang tes. Butir-butir tes hendaknya dapat 292 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



mengukur indikator, dan indikator-indikator dapat mengukur kompetensi dasar. Penentuan bentuk tes yang tepat ditentukan oleh tujuan tes dan jumlah peserta tes.



Contoh kisi-kisi tes Mata Pelajaran Semester Tahun Ujian Tipe Tes Jumlah Butir Tes No



Pokok Bahasan



: : : : : C1



Jenjang Kemampuan C2 C3 C4 C5



C6



Jumlah butir soal



1 2 3 dst Jumlah Butir Soal Persentase



100



3). Penulisan butir soal Penulisan butir adalah fase yang berat dalam proses pengembangan tes. Menulis butir-butir dalam suatu tes atau alat ukur merupakan suatu seni menuangkan gagasan. Penulisan butir-butir soal merupakan langkah penting dalam upaya pengembangan alat ukur atau sebuah tes yang baik Dalam penulisan butir soal, penulis harus memperhatikan kaidah penulisan soal. Menulis soal adalah penjabaran indikator kompetensi yang hendak diukur menjadi pertanyaan-pertanyaan yang karakteristiknya 293 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



sesuai dengan kisi-kisi. Setiap butir soal yang dibuat harus jelas apa yang ditanyakan dan jelas pula apa yang dituntut. Mutu setiap butir soal akan menentukan mutu soal tes secara keseluruhan. 4). Penelaahan soal Penelaahan soal adalah mengkaji secara teoritik soal tes yang telah disusun. Penelaahan ini dilakukan dengan memperhatikan tiga aspek, yaitu aspek materi, aspek konstruksi, dan aspek bahasa. Biasanya pada penelaahan soal dilakukan review dan revisi oleh orang lain. 5). Uji coba soal dan analisis. Soal yang sudah dibuat dan sudsah direproduksi atau diperbanyak itu diujicobakan kepada sejumlah sampel yang telah ditentukan. Sampel uji-coba harus mempunyai karakteristik yang kurag lebih sama dengan karakteristik peserta tes sesungguhnya. Berdasarkan data hasil uji-coba dilakukan analisis, terutama analisis butir soal yang meliputi tingkat kesukaran, validita butir, dan fungsi pengecoh. Soal-soal yang tidak valid akan didrop dan soalsoal yang valid akan ditetapkan untuk dipakai atau dirakit menjadi suatu tes yang valid. 6). Perakitan soal menjadi perangkat tes Dalam perakitan tes perlu mengelompokkan butir soal itu menurut bentuknya, bukan menurut jenis materinya atau menurut jenjang pengetahuan yang hendak diukur. Dengan demikian ada kelompok soal pilihan ganda, 294 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



ada kelompok soal menjodohkan dan sebagainya. Di samping pengaturan menurut bentuk itemnya, soal itu hendaknya diatur pula menurut taraf kesukarannya. jadi, ada baiknya soal tes disajikan mulai dari butir mudah ke yang sukar, pengelompokan rapi, tata letak bagus dan tidak terpotong-potong kalimatnya, dan kemasannya menarik. Untuk merakit soal menjadi suatu paket tes yang tepat, para guru perlu memperhatikan langkah-langkah perakitan soal sebagai berikut: a) Mengelompokkan soal-soal yang mengukur kompetensi dan materi yang sama, kemudian soal soal itu ditempatkan dalam urutan yang sama. b) Memberi nomor urut soal didasarkan nomor urut soal dalam kisi-kisi. c) Mengecek setiap soal dalam satu paket tes apakah soal-soalnya sudah bebas dari kaidah “Setiap soal tidak boleh memberi petunjuk jawaban terhadap soal yang lain”. d) Membuat petunjuk umum dan khusus untuk mengerjakan soal. e) Membuat format lembar jawaban. f) Membuat lembar kunci jawaban dan petunjuk penilaiannya. g) Menentukan/menghitung penyebaran kunci jawaban (untuk bentuk pilihan ganda), dengan menggunakan rumus berikut. Penyebaran kunci jawaban =



295 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



±3



Prof. Dr. Yusrizal, M.Pd



h) Menentukan soal inti (anchor items) sebanyak 10 % dari jumlah soal dalam satu paket i) Menentukan besarnya bobot setiap soal (untuk soal bentuk uraian) 7). Penyajian tes, Setelah diperoleh tes terstandar, naskah tes siap diberikan atau disajikan kepada peserta tes. Hal-hal yang perlu diperhatikan dalam penyajian tes adalah waktu penyajian, petunjuk yang jelas mengenai cara menjawab atau mengerjakan tes, ruangan dan tempat duduk peserta tes. Pada prinsipnya, hal-hal yang menyangkut segi administratif penyajian tes harus diperhatikan sehingga pengujian dapat terselenggara dengan lancar dan baik. 8). Penskoran Penskoran adalah melalui:



proses menentukan angka



(a) Kunci Jawaban (menentukan jawaban benar) (b) Kunci Skoring (menyeleksi jawaban benar dan salah) (c) Pedoman Penilaian (menentukan angka) Penskoran dilakukan menurut bentuk tes atau soal. Untuk butir-butir soal bentuk esai, terdapat dua metoda penskorannya. Yang pertama adalah point method, dan kedua adalah rating method. Pada point method setiap jawaban dibandingkan dengan jawaban ideal yang telah ditetapkan dalam kunci jawaban dan skor yang diberikan kepada setiap jawaban akan tergantung pada derajat 296 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



kepadanannya dengan kunci jawaban. Soal esei dengan jawaban terbatas penskoran dilakukan dengan point method, maka perlu menggunakan rambu-rambu jawaban Sedangkan dalam rating method, setiap jawaban siswa ditetapkan dalam salah satu kelompok yang sudah berdasarkan mutunya selagi jawaban tersebut dibaca. Soal esei dengan jawaban terbuka, penskoran dengan rating method, maka perlu menggunakan kriteria/rubric penilaian Dalam memeriksa dan menilai jawaban siswa dilakukan dengan cara soal demi soal, bukan bukan siswa demi siswa, untuk menghindari halo effect. Selanjutnya, dalam mengevaluasi jawaban soal esei, adalah tanpa mengetahui identitas siswa yang mengerjakan. 9). Pelaporan Hasil Tes Setelah pelaksanaan tes dan penskorannya, maka hasil tes tersebut perlu dilaporkan, Laporan tersebut misalnya kepada siswa yang bersangkutan, kepada orang tua/wali siswa, kepada Kepala Sekolah, dan sebagainya. Laporan hasl tes tersebut menjadi informasi yang berguna dan penting guna penentuan kebijakan selanjutnya. 10). Pemanfaatan Hasil Tes Hasil tes yang tidak lain adalah hasil pengukuran dapat dimanfaatkan untuk perbaikan sistem, metode, atau strategi belajar mengajar, di samping dapat dimanfaatkan untuk penentuan kebijakan.



297 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



B. Kaidah Penulisan Soal 1. Tes Pilihan Ganda Menurut Depdiknas (2007) kaidah penulisan soal pilihan ganda adalah sebagai berikut. a. Materi Soal harus sesuai dengan indikator (artinya soal harus menanyakan perilaku dan materi yang hendak diukur sesuai dengan rumusan indikator dalam kisi-kisi), pengecoh harus berfungsi, dan setiap soal harus mempunyai satu jawaban yang benar (artinya, satu soal hanya mempunyai satu kunci jawaban). b. Konstruksi a) Pokok soal harus dirumuskan secara jelas dan tegas. Artinya, kemampuan/ materi yang hendak diukur/ditanyakan harus jelas, tidak menimbulkan pengertian atau penafsiran yang berbeda dari yang dimaksudkan penulis. Setiap butir soal hanya mengandung satu persoalan/gagasan b) Rumusan pokok soal dan pilihan jawaban harus merupakan pernyataan yang diperlukan saja. Artinya apabila terdapat rumusan atau pernyataan yang sebetulnya tidak diperlukan, maka rumusan atau pernyataan itu dihilangkan saja. c) Pokok soal jangan memberi petunjuk ke arah jawaban yang benar. Artinya, pada pokok soal jangan sampai terdapat kata, kelompok kata, atau



298 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



d)



e)



f)



g)



ungkapan yang dapat memberikan petunjuk ke arah jawaban yang benar. Pokok soal jangan mengandung pernyataan yang bersifat negatif ganda. Artinya, pada pokok soal jangan sampai terdapat dua kata atau lebih yang mengandung arti negatif. Hal ini untuk mencegah terjadinya kesalahan penafsiran peserta didik terhadap arti pernyataan yang dimaksud. Untuk keterampilan bahasa, penggunaan negatif ganda diperbolehkan bila aspek yang akan diukur justru pengertian tentang negatif ganda itu sendiri. Pilihan jawaban harus homogen dan logis ditinjau dari segi materi. Artinya, semua pilihan jawaban harus berasal dari materi yang sama seperti yang ditanyakan oleh pokok soal, penulisannya harus setara, dan semua pilihan jawaban harus berfungsi. Pilihan jawaban jangan mengandung pernyataan “Semua pilihan jawaban di atas salah" atau "Semua pilihan jawaban di atas benar". Artinya dengan adanya pilihan jawaban seperti ini, maka secara materi pilihan jawaban berkurang satu karena pernyataan itu bukan merupakan materi yang ditanyakan dan pernyataan itu menjadi tidak homogen. Panjang rumusan pilihan jawaban harus relatif sama. Kaidah ini diperlukan karena adanya kecenderungan peserta didik memilih jawaban yang paling panjang karena seringkali jawaban yang lebih panjang itu lebih lengkap dan merupakan kunci jawaban. 299 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



h) Pilihan jawaban yang berbentuk angka atau waktu harus disusun berdasarkan urutan besar kecilnya nilai angka atau kronologis. Artinya pilihan jawaban yang berbentuk angka harus disusun dari nilai angka paling kecil berurutan sampai nilai angka yang paling besar, dan sebaliknya. Demikian juga pilihan jawaban yang menunjukkan waktu harus disusun secara kronologis. Penyusunan secara unit dimaksudkan untuk memudahkan peserta didik melihat pilihan jawaban. i) Gambar, grafik, tabel, diagram, wacana, dan sejenisnya yang terdapat pada soal harus jelas dan berfungsi. Artinya, apa saja yang menyertai suatu soal yang ditanyakan harus jelas, terbaca, dapat dimengerti oleh peserta didik. Apabila soal bisa dijawab tanpa melihat gambar, grafik, tabel atau sejenisnya yang terdapat pada soal, berarti gambar, grafik, atau tabel itu tidak berfungsi. j) Rumusan pokok soal tidak menggunakan ungkapan atau kata yang bermakna tidak pasti seperti: sebaiknya, umumnya, kadang-kadang. k) Butir soal jangan bergantung pada jawaban soal sebelumnya. Ketergantungan pada soal sebelumnya menyebabkan peserta didik yang tidak dapat menjawab benar soal pertama tidak akan dapat menjawab benar soal berikutnya. c. Bahasa/budaya Setiap soal harus menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia. Kaidah bahasa Indonesia 300 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



dalam penulisan soal di antaranya meliputi: a) pemakaian kalimat: (1) unsur subjek, (2) unsur predikat, (3) anak kalimat; b) pemakaian kata: (1) pilihan kata, (2) penulisan kata, dan c) pemakaian ejaan; (1) penulisan huruf, (2) penggunaan tanda baca. Bahasa yang digunakan harus komunikatif, sehingga pernyataannya mudah dimengerti peserta didik. Pilihan jawaban jangan mengulang kata/frase yang bukan merupakan satu kesatuan pengertian. Letakkan kata/frase pada pokok soal. Hopkin dan Antes (1990) juga memberikan petunjuk yang lebih rinci dan praktis dalam menyusun tes pilihan ganda, yaitu: (1) definisikan tugas-tugas dalam stem secara jelas, (2) tulis alternatif jawaban pada akhir pertanyaan, (3) tempatkan sebanyak mungkin kata-kata dalam stem, (4) hindari penggunaan kata-kata negatif, (5) hindari stem yang mengarah pada alternatif jawaban yang salah atau benar, (6) buat alternatif jawaban yang paralel, (7) tulis alternatif jawaban secara vertikal, (8) hindari jawaban “semua di atas”, (9) buat alternatif jawaban sama panjang, (10) hilangkan petunjuk ke arah jawaban benar, (11) buat pengecoh yang masuk akal, (12) usahakan stemnya dalam bentuk pertanyaan, (13) kontrol tingkat kesulitan soal sehingga persentase jawaban benar kira-kira separuhnya, (14) hindari kemungkinan menebak, (15) gunakan jawaban “tidak ada jawaban benar” hanya kalau tidak ada jawaban lain, (16) susun alternatif jawaban sesuai dengan abjad . 19 atau urutan lainnya, (17) letakkan jawaban benar secara acak, dan (18) usahakan memiliki empat sampai lima alternatif jawaban



301 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Dengan memperhatikan petunjuk tersebut, diharapkan para guru dapat menyusun butir tes pilihan ganda yang baik 2. Tes Dua Pilihan Jawaban (Benar-Salah, Ya-Tidak) Menurut Tim Puspendik (2008) Kaidah penulisan soal bentuk dua pilihan jawaban perlu adalah sebagai berikut. a) Hindari penggunaan kata: terpenting, selalu, tidak pernah, hanya, sebagian besar, dan kata-kata lain yang sejenis, karena dapat membingungkan peserta tes dalam menjawab. Rumusan butir soal harus jelas, dan pasti benar atau pasti salah. b) Jumlah rumusan butir soal yang jawabannya benar dan salah hendaknya seimbang. c) Panjang rumusan pernyataan butir soal hendaknya relatif sama. d) Susunan pernyataan benar dan pernyataan salah secara random, tidak sistematis mengikuti pola tertentu. Misalnya: B B S S, atau B S B S, dan sebagainya. Susunan yang terpola sistematis seperti itu dapat memberi petunjuk kepada jawaban yang benar. e) Hindari pengambilan kalimat langsung dari buku teks. Pengambilan kalimat langsung dari buku teks lebih mendorong siswa untuk menghafal daripada memahami dan menguasai konsep dengan baik.



302 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



3. Tes Menjodohkan Kaidah penulisan soal bentuk menjodohkan (Tim Puspendik, 2008) adalah seperti berikut: a. Tulislah seluruh pernyataan dalam lajur kiri sejenis, dan pernyataan dalam lajur kanan juga sejenis. Dengan kata lain: pernyataan dalam lajur sebelah kiri isinya homogen, demikian juga pernyataan dalam lajur sebelah kanan isinya harus homogen. b. Tulislah pernyataan jawaban lebih banyak dari pernyataan soal. Hal ini penting, untuk memperkecil probabilitas peserta tes menjawab soal secara menebak dengan benar. Seperti contoh berikut, pernyataan soal yang ada di lajur kiri adalah lima butir, pernyataan jawaban yang ada di lajur kanan adalah enam butir. c. Susunlah jawaban yang berbentuk angka secara berurutan dari besar ke kecil atau sebaliknya. Apabila alternatif jawabannya berupa tanggal dan tahun terjadinya peristiwa, maka susunlah tanggal dan tahun tersebut berurutan secara kronologis, seperti dalam penulisan soal pilihan ganda. d. Tulislah petunjuk mengerjakan tes yang jelas dan mudah dipahami oleh peserta tes. Oleh karena itu, dalam perumusan kalimat dan penggunaan kosakata perlu memperhatikan perkembangan kemampuan bahasa peserta tes. 4. Tes Isian Kaidah penulisan soal bentuk isian adalah seperti berikut (Tim Puspendik, 2008): 303 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



a. Soal harus sesuai dengan indikator b. Soal harus menggunakan bahasa yang baik dan benar, serta kalimat singkat dan jelas, sehingga peserta tes dapat memahami dengan muda. c. Jawaban yang dituntut oleh soal harus singkat dan pasti yaitu berupa kata, frase, angka, simbol, tempat, atau waktu. d. Soal tidak merupakan kalimat yang dikutip langsung dari buku. e. Soal tidak memberi petunjuk ke kunci jawaban. f. Bagian kalimat yang harus dilengkapi sebaiknya hanya satu bagian dalam ratio butir soal, dan paling banyak dua bagian, supaya tidak membingungkan siswa. 5.Tes Esai atau Uraian Kaidah penulisan soal uraian menurut Depdiknas (2008) sebagai berikut. a. Materi Soal harus sesuai dengan indikator, setiap pertanyaan harus diberikan batasan jawaban yang diharapkan, materi yang ditanyakan harus sesuai dengan tujuan pengukuran, dan materi yang ditanyakan harus sesuai dengan jenjang dan jenis sekolah atau tingkat kelas. b. Konstruksi Soal menggunakan kata tanya/perintah yang menuntut jawaban terurai, ada petunjuk yang jelas tentang cara mengerjakan soal, setiap soal harus ada pedoman



304 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



penskorannya, dan tabel, gambar, grafik, peta, atau yang sejenisnya disajikan dengan jelas, terbaca, dan berfungsi c. Bahasa Rumusan kalimat soal harus komunikatif, menggunakan bahasa Indonesia yang baik dan benar (baku), tidak menimbulkan penafsiran ganda, tidak menggunakan bahasa yang berlaku setempat/tabu, dan tidak mengandung kata/ungkapan yang menyinggung perasaan peserta didik. 6. Tes Jawaban Singkat Kaidah penulisan bentuk soal jawaban singkat adalah seperti berikut: a. Menggunakan kalimat pertanyaan langsung atau kalimat perintah. b. Pertanyaan atau perintah harus jelas, agar mendapat jawaban yang singkat. c. Panjang kata atau kalimat yang harus dijawab oleh siswa pada semua soal diusahakan relatif sama. d. Hindari penggunaan kata, kalimat, atau frase yang diambil langsung dari buku teks, sebab akan mendorong siswa untuk sekedar mengingat atau menghafal apa yang tertulis dibuku. e. Buatlah pedoman penskoran untuk digunakan pada waktu menskor.



B



C. Penulisan Soal Penalaran Tinggi Taksonomi Bloom dianggap merupakan dasar bagi berpikir tingkat tinggi. Pemikiran ini didasarkan bahwa 305 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



beberapa jenis pembelajaran memerlukan proses kognisi yang lebih daripada yang lain, tetapi memiliki manfaatmanfaat lebih umum. Dalam Taksonomi Bloom sebagai contoh, kemampuan melibatkan analisis, evaluasi dan mengkreasi dianggap berpikir tingkat tinggi (Pohl, 2000). Stein dan Lane (1996) menyatakan bahwa berpikir tingkat tinggi adalah the use of complex, nonalgorithmic thinking to solve a task in which there is not a predictable, wellrehearsed approach or pathway explicitly suggested by the task, task instruction, or a worked out example, artinya berpikir tingkat tinggi menggunakan pemikiran yang kompleks, non algorithmic untuk menyelesaikan suatu tugas, ada yang tidak dapat diprediksi, menggunakan pendekatan yang berbeda dengan tugas yang telah ada dan berbeda dengan contoh. Karakteristik berpikir tingkat tinggi adalah sebagai : solving tasks where no algorithm has been taught, where justification or explanation are required, and where more than one solution may be possible. Jadi berpikir tingkat tinggi adalah kemampuan untuk menyelesaikan tugastugas dimana tidak ada algoritma yang telah diajarkan, yang membutuhkan justifikasi atau penjelasan dan mungkin mempunyai lebih dari satu solusi yang mungkin (Lewy, Zulkardi, dan Aisyah, 2009). Adapun indikator soal untuk mengukur kemampuan berpikir tingkat tinggi adalah: (1) non algorithmic, (2) cenderung kompleks (3) memiliki solusi yang mungkin lebih dari satu (open ended approach), (4) membutuhkan usaha untuk menemukan struktur dalam ketidakteraturan 306 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(Lewy, Zulkardi, dan Aisyah, 2009). Sedangkan Krathwohl (2002) menyatakan bahwa indikator untuk mengukur kemampuan berpikir tingkat tinggi meliputi: (1) Menganalisis: yaitu (a) menganalisis informasi yang masuk dan membagi-bagi atau menstrukturkan informasi ke dalam bagian yang lebih kecil untuk mengenali pola atau hubungannya, (b) mampu mengenali serta membedakan faktor penyebab dan akibat dari sebua skenario yang rumit, (c)mengidentifikasi/merumuskan pertanyaan (2) Mengevaluasi: yaitu (a) memberikan penilaian terhadap solusi, gagasan, dan metodologi dengan menggunakan kriteria yang cocok atau standar yang ada untuk memastikan nilai efektivitas atau manfaatnya. (b) membuat hipotesis, mengkritik dan melakukan pengujian, (c) menerima atau menolak suatu pernyataan berdasarkan kriteria yang telah ditetapkan (3) Mengkreasi: yaitu (a)membuat generalisasi suatu ide atau cara pandang terhadap sesuatu, (b) merancang suatu cara untuk menyelesaikan masalah, (c) mengorganisasikan unsurunsur atau bagian-bagian menjadi struktur baru yang belum pernah ada sebelumnya Penulisan atau penyusunan soal yang menuntut penalaran tinggi dapat dibedakan atas: (1) mengukur kemampuan berpikir kritis, dan (2) mengukur keterampilan pemecahan masalah. Menurut Depdiknas (2008) untuk menuliskan butir soal yang menuntut penalaran tinggi, perlu memperhatikan pedoman berikut: a. Materi yang akan ditanyakan diukur dengan perilaku: C2/pemahaman, C3/penerapan, C4/sintesis,C5/analisis, 307 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



atau C6/evaluasi (bukan hanya C1/ingatan saja). Ingat Taksonomi Bloom. b. Setiap pertanyaan diberikan dasar pertanyaan (stimulus). Agar butir soal yang ditulis dapat menuntut penalaran tinggi, maka setiap butir soal selalu diberikan dasar pertanyaan (stimulus) yang berbentuk sumber/bahan bacaan seperti: teks bacaan, paragrap, teks drama, penggalan novel/cerita/dongeng, puisi, kasus, gambar, grafik, foto, rumus, tabel, daftar kata/simbol, contoh, peta, film, atau suara yang direkam. 1. Mengukur kemampuan berpikir kritis. Ada 11 kemampuan berpikir kritis yang dapat dijadikan dasar dalam menulis butir soal yang menuntut penalaran tinggi (Depdiknas, 2008). 1) Menfokuskan pada pertanyaan Contoh indikator soal: Disajikan sebuah masalah/problem, aturan, kartun, atau eksperimen dan hasilnya, peserta didik dapat menentukan masalah utama, kriteria yang digunakan untuk mengevaluasi kualitas, kebenaran argumen atau kesimpulan. 2) Menganalisis argumen Contoh indikator soal: Disajikan deskripsi sebuah situasi atau satu/dua argumentasi, peserta didik dapat: (1) menyimpulkan argumentasi secara cepat, (2) memberikan alasan yang 308 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



mendukung argumen yang disajikan, (3) memberikan alasan tidak mendukung argumen yang disajikan. 3) Mempertimbangkan yang dapat dipercaya Contoh indikator soal: Disajikan sebuah teks argumentasi, iklan, atau eksperimen dan interpretasinya, peserta didik menentukan bagian yang dapat dipertimbangan untuk dapat dipercaya (atau tidak dapat dipercaya), serta memberikan alasannya. 4) Mempertimbangkan laporan observasi Contoh indikator soalnya: Disajikan deskripsi konteks, laporan observasi, atau laporan observer/reporter, peserta didik dapat mempercayai atau tidak terhadap laporan itu dan memberikan alasannya. 5) Membandingkan kesimpulan Contoh indikator soal: Disajikan sebuah pernyataan yang diasumsikan kepada peserta didik adalah benar dan pilihannya terdiri dari: (1) satu kesimpulan yang benar dan logis, (2) dua atau lebihkesimpulan yang benar dan logis, peserta didik dapat membandingkan kesimpulan yang sesuai dengan pernyataan yang disajikan atau kesimpulan yang harus diikuti. 6) Menentukan kesimpulan Contoh indikator soal: 309 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Disajikan sebuah pernyataan yang diasumsikan kepada peserta didik adalah benar dan satukemungkinan kesimpulan, peserta didik dapat menentukan kesimpulan yang ada itu benar atau tidak, dan memberikan alasannya. 7) Mempertimbangkan kemampuan induksi Contoh indikator soal: Disajikan sebuah pernyataan, informasi/data, dan beberapa kemungkinan kesimpulan,peserta didik dapat menentukan sebuah kesimpulan yang tepat dan memberikan alasannya. 8) Menilai Contoh indikatornya: Disajikan deskripsi sebuah situasi, pernyataan masalah, dan kemungkinan penyelesaianmasalahnya, peserta didik dapat menentukan: (1) solusi yang positif dan negatif, (2) solusi mana yang paling tepat untuk memecahkan masalah yang disajikan, dan dapat memberikan alasannya. 9) Mendefinisikan Konsep Contoh indikator soal: Disajikan pernyataan situasi dan argumentasi/naskah, peserta didik dapat mendefinisikan konsep yang dinyatakan. 10) Mendefinisikan asumsi Contoh indikator soal 310 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Disajikan sebuah argumentasi, beberapa pilihan yang implisit di dalam asumsi, peserta didik dapat menentukan sebuah pilihan yang tepat sesuai dengan asumsi. 11) Mendeskripsikan Contoh indikator soal: Disajikan sebuah teks persuasif, percakapan, iklan, segmen dari video klip, peserta didik dapat mendeskripsikan pernyataan yang dihilangkan Menurut Linn dan Gronlund Keterampilan Berpikir Kritis adalah: 1). Membandingkan  Jelaskan persamaan dan perbedaan antara ... dan ....  Bandingkan dua cara berikut tentang .... 2). Hubungan sebab-akibat  Apa penyebab utama ....  Apa akibat .... 3). Memberi alasan (justifying)  Manakah pilihan berikut yang kamu pilih, mengapa?  Jelaskan mengapa kamu setuju/tidak setuju dengan pernyataan tentang 4). Meringkas  Tuliskan pernyataan penting yang termasuk ....  Ringkaslah dengan tepat isi ....



311 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



5). Menyimpulkan  Susunlah beberapa kesimpulan yang bersasal dari data ....  Tulislah sebuah pernyataan yang dapat menjelaskan peristiwa berikut .. 6). Berpendapat (inferring)  Berdasarkan ..., apa yang akan terjadi bila ....  Apa reaksi A terhadap .... 7). Mengelompokkan  Kelompokkan hal berikut berdasarkan ....  Apakah hal berikut memiliki ....  8). Menciptakan  Tuliskan beberapa cara sesuai dengan ide Anda tentang ....  Lengkapilah cerita ... tentang apa yang akan terjadi bila .... 9). Menerapkan  Selesaikan hal berikut dengan menggunakan kaidah ....  Tuliskan ... dengan menggunakan pedoman ....  10). Analisis  Manakah penulisan yang salah pada paragraf ....  Daftar dan beri alasan singkat tentang ciri utama .... 312 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



11). Sintesis  Tuliskan satu rencana untuk pembuktian ....  Tuliskan sebuah laporan .... 12). Evaluasi  Apakah kelebihan dan kelemahan ....  Berdasarkan kriteria ..., tuliskanlah evaluasi tentang .... 2 Mengukur keterampilan pemecahan masalah. Ada 17 keterampilan pemecahan masalah yang dapat dijadikan dasar dalam menulis butir soal yang menuntut penalaran tinggi. 1). Mengidentifikasi masalah Contoh indikator soal: Disajikan deskripsi suatu situasi/masalah, peserta didik dapat mengidentifikasi masalah yang nyata atau masalah apa yang harus dipecahkan. 2) . Merumuskan masalah dalam bentuk pertanyaan Contoh indikator soal: Disajikan sebuah pernyataan yang berisi sebuah masalah, peserta didik dapat merumuskanmasalah dalam bentuk pertanyaan. 3). Memahami kata dalam konteks Contoh indikator soal:



313 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Disajikan beberapa masalah yang konteks kata atau kelompok katanya digarisbawahi, peserta didik dapat menjelaskan makna yang berhubungan dengan masalah itu dengan kata‐katanya sendiri. 4). Mengidentifikasi masalah yang tidak sesuai Contoh indikator masalah: Disajikan beberapa informasi yang relevan dan tidak relevan terhadap masalah, peserta didik dapat mengidentifikasi semua informasi yang tidak relevan. 5). Memilih masalah sendiri Contoh indikator soal: Disajikan beberapa masalah, peserta didik dapat memberikan alasan satu masalah yang dipilih sendiri, dan menjelaskan cara penyelesaiannya. 6) . Mendeskripsikan berbagai strategi Contoh indikator soal: Disajikan sebuah pernyataan masalah, peserta didik dapat memecahkan masalah ke dalam dua cara atau lebih, kemudian menunjukkan solusinya ke dalam gambar, diagram, atau grafik. 7). Mengidentifikasi asumsi Contoh indikator soal: Disajikan sebuah pernyataan masalah, peserta didik dapat memberikan solusinya berdasarkan pertimbangan asumsi untuk saat ini dan yang akan datang. 314 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



8)



Mendeskripsikan masalah Contoh indikator soal: Disajikan sebuah pernyataan masalah, peserta didik dapat menggambarkan sebuah diagram atau gambar yang menunjukkan situasi masalah.



9) . Memberi alasan masalah yang sulit Contoh indikator soal: Disajikan sebuah masalah yang sukar dipecahkan atau informasi pentingnya dihilangkan, peserta didik dapat menjelaskan mengapa masalah ini sulit dipecahkan atau melengkapi informasi pentingnya dihilangkan. 10) Memberi alasan solusi Contoh indikator soal: Disajikan sebuah pernyataan masalah dengan dua atau lebih kemungkinan solusinya, peserta didik dapat memilih satu solusi yang paling tepat dan memberikan alasannya. 11) Memberi alasan strategi yang digunakan Contoh indikator soal: Disajikan sebuah pernyataan masalah dengan dua atau lebih strategi untuk menyelesikan masalah, peserta didik dapat memilih satu strategi yang tepat untuk menyelesaikan masalah itu dan memberikan alasannya.



315 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



12) Memecahkan masalah berdasarkan data dan masalah Contoh indikator soal: Disajikan sebuah cerita, kartun, grafik atau tabel dan sebuah pernyataan masalah, peserta didik dapat memecahkan masalah dan menjelaskan prosedur yang digunakan untuk menyelesaikan masalah. 13) Membuat strategi lain Contoh indikator soal: Disajikan sebuah pernyataan masalah dan satu strategi untuk menyelesaikan masalahnya, peserta didik dapat menyelesaikan masalah itu dengan menggunakan strategi lain. 14) Menggunakan analogi Contoh indikator soal: Disajikan sebuah pernyataan masalah dan strategi penyelesaiannya, peserta didik dapat: (1) mendeskripsikan masalah lain (analog dengan masalah ini) yang dapat diselesaikan dengan menggunakan strategi itu, (2) memberikan alasannya. 15) Menyelesaikan secara terencana Contoh indikator soal: Disajikan sebuah situasi masalah yang kompleks, peserta didik dapat menyelesaikan masalah secara terencana mulai dari input, proses, output, dan outcomenya.



316 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



16) Mengevaluasi kualitas solusi Contoh indikator soal: Disajikan sebuah pernyataan masalah dan beberapa strategi untuk menyelesaikan masalah, peserta didik dapat: (1) menjelaskan dengan menerapkan strategi itu, (2) mengevaluasinya, (3) menentukan strategi mana yang tepat, (4) memberi alasan mengapa strategi itu paling tepat dibandingkan dengan strategi lainnya. 17) Mengevaluasi strategi sistematika Contoh indikator soal: Disajikan sebuah pernyataan masalah, beberapa strategi pemecahan masalah dan prosedur, peserta didik dapat mengevaluasi strategi pemecahannya berdasarkan prosedur yang disajikan (Depdiknas, 2008).



317 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



318 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 14 PENSKORAN HASIL TES A.Penskoran Hasil Tes Penskoran (skoring) atau pemberian skor adalah proses pengubahan atau jawaban – jawaban soal tes menjadi angka-angka yang pasti. 1. Penskoran Tes Objektif a. Soal Bentuk Pilihan Ganda Dalam penskoran untuk soal bentuk pilihan ganda ragam biasa, ada 2 macam yaitu dengan hukuman dan tanpa hukuman. (1) Pemberian skor tanpa hukuman dengan rumus berikut: S = ∑R



dengan : S = Score , ∑R = Right, W = Wrong



319 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Skor yang diperoleh sebanyak jumlah soal yang benar. (2) Pemberian skor dengan hukuman menggunakan rumus, yaitu : S = ∑R dengan: S = skor yang dicari ∑R = jumlah jawaban benar ∑W = jumlah jawaban salah k = jumlah pilihan jawaban (option) Contoh: - Banyaknya soal = 10 buah (T) - Banyaknya yang betul = 8 buah (R) - Banyaknya yang salah = 2 buah (W) - Banyaknya pilihan = 4 buah (k) - Maka skornya menjadi : 8 - {2 / (4 - 1)} = 8 - (2 / 3) = 7,33 Untuk penskoran (pemberian skor) soal pilihan ganda selain ragam biasa (ragam-ragam: analisis antar hal, analisis kasus, komolek, dan membaca diagram) adalah menggunakan rumus pilihan ganda yang dikalikan bobot. jadi (1) Pemberian skor tanpa hukuman dengan rumus menjadi:



320 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



S = ∑R x Wt dengan S = Score , ∑R = Right, Wt = bobot yang diberikan guru pada setiap soal (2) Pemberian skor dengan hukuman dengan rumus : S = ∑R - (



) x Wt



b. Soal Bentuk Dua Pilihan Untuk penskoran soal yang hanya pilihan jawabannya dua, dapat digunakan rumus: Jika pemberian skor tanpa hukuman/denda (1) S = ∑R – ∑W Keterangan: S = skor yang dicari ∑R = jumlah jawaban betul ∑W = jumlah jawaban salah Contoh: - Banyaknya soal = 10 buah (T) - Banyaknya yang betul = 8 buah (R) - Banyaknya yang salah = 2 buah (W) - Skornya menjadi (S) : 8 - 2 = 6 Jika pemberian skor dengan hukuman/denda (2) S = T - 2W (T singkatan dari total, artinya jumlah soal dalam tes) Contoh . - Banyaknya soal = 10 buah (T) - Banyaknya yang betul = 8 buah (R) - Banyaknya yang salah = 2 buah (W) 321 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



- Skornya menjadi 10 - (2x2) = 10 - 4 = 6 c. Soal Bentuk Menjodohkan Untuk penskoran soal menjodohkan dapat digunakan rumus berikut: S= R-(



)(



)



dengan : S = skor yang dicari W = jumlah jawaban yang salah = jumlah butir pada lajur kiri (soal) = jumlah butir pada lajur kanan (jawaban) Selain itu sering juga penskoran dengan cara d. Soal Bentuk Jawaban Singkat Untuk pemberian skor soal jawaban singkat sebaiknya tiap soal diberi skor 2 (dua). Dapat juga skornya itu sama dengan skor pada bentuk betul salah atau pilihan ganda jika memang jawaban yang diharapkannya ringan atau mudah. Tetapi sebaliknya apabila jawabarmya bervariasi rnisalnva lengkap sekali, lengkap dan kurang lengkap, maka angkanya dapat dibuat bervariasi pula misalnya 2; 1,5; dan 1. 2. Penskoran Tes Essei Ada dua metode yang sering digunakan untuk penskoran soal Esei,yaitu: a) Metode Analitik, dan b) Metode Rating (Silverius, 1991)



322 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



a) Metode Analitik Langkah-langkah pelaksanaan cara analitik adalah: (1) Tulislah/buatlah jawaban sempurna dari tiap soal, yaitu jawaban yang dapat diberikan skor tertinggi (2) Analisislah dan tetapkan bagian-bagiannya (3) Skor tertinggi yang hendak diberikan kepada jawaban sempurna itu dibagi-bagi kepada tiap bagian (4) Baca jawaban tiap siswa dan berikan skor pada tiap bagian (5) Jumlahkan skor tiap bagian itu, dan ini merupakan skor jawaban siswa untuk soal tersebut. b) Metode Rating Dalam metode rating, jawaban sempurna tidak dibagi-bagi kepada bagian-bagian. Guru yang melakukan penskoran membaca dengan sekasama setiap soal, dan menangkap ruang lingkup yang ada dalam jawaban. Langkah-langkah penskorannya adalah: (1) Membaca jawaban siswa (3) Mengelompokkan jawaban siswa ke dalam salah satu kategori yang menunjukkan tingkat kualitas jawaban (sangat baik, baik, sedang, kurang, sangat kurang) (4) Membandingkan jawaban dengan kategori yang diberikan pada jawaban (3) Skor yang diberikan sesuai dengan kategori itu merupakan skor akhir jawaban siswa dari soal tersebut.



323 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



B. Konversi Skor



Konversi skor adalah proses transformasi skor mentah yang dicapai peserta didik (siswa) ke dalam skor terjabar atau skor standar untuk menetapkan nilai hasil belajar yang diperoleh (Arifin, 2009) Untuk melakukan konversi skor (pengolahan dan pengubahan skor mentah hasil tes) menjadi nilai dapat menggunakan berbagai macam skala, di antaranya : 1) Skala lima (stanfive) 2) Skala sembilan (stannine) 3) Skala seratus 4) Skala sebelas (eleven points standard) 5) Skala Z (Z score) 6) Skala T (T score) Gronlund dan Linn (1995) mengemukakan bahwa hasil tes dapat diinterpretasikan dengan dua cara (metode), yaitu berdasarkan standar absolut (criterionreferenced interpretation) yang kita kenal dengan PAP (Penilaian Acuan Patokan), dan standar relatif (normreferenced interpretation) yang kita kenal dengan PAN (Penilaian Acuan Norma) PAP pada dasarnya adalah penilaian yang membandingkan hasil pembelajaran peserta didik dengan Patokan (Batas Lulus) yang telah ditetapkan sebelumnya. Batas lulus itu tidak diambil dari hasil pengukuran kelompok (kelas), melainkan atas dasar Tingkat Penguasaan (Kompetensi) Minimal yang telah ditetapkan sebelumnya.Yang lulus adalah mereka yang nilainya melampaui Batas Lulus. Pendekatan PAP adalah 324 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



pendekatan yang menggunakan Standard Mutlak. Rumus yang digunakan untuk menghitung nilai adalah sebagai berikut. Nilai =



x skala



Pendekatan PAN (Penilaian Acuan Norma ) adalah penilaian yang menggunakan Norma Kelompok (Kelas) sebagai Norma Pembanding (Batas Lulus). Pendekatan PAN adalah pendekatan ” apa adanya ”. Batas lulus-nya diambil dari kenyataan yang diperoleh dari pengukuran dan penilaian yang sedang berlangsung. PAN pada dasarnya menggunakan kurve normal dan hasil-hasil penghitungannya sebagai dasar penilaian. Sebagai norma pembanding adalah nilai rata–rata (Mean) dan simpang– baku (standar–deviasi). Dapat dimengerti bahwa norma penilaian atas dasar kurve normal ini bersifat relative, dapat bergeser ke atas atau ke bawah, sesuai dengan kurve normal yang satu ke kurve normal lainnya. PAN adalah pendekatan yang menggunakan Standard Relatif. Rumus yang digunakan untuk menghitung nilai adalah sebagai berikut. Nilai =



x skala



1. Penilaian Acuan Patokan a. Konversi dengan Skala lima Skala lima adalah suatu pembagian tingkatan yang terbagi atas lima kategori. Misalnya masing-masing tingkatan itu adalah A, B, C, D, dan E. Langkah yang 325 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



ditempuh untuk mengkonversikan skor mentah menjadi skor standar skala lima adalah sebagai berikut: 1) Mencari skor maksimal ideal (SMI) dari tes. Skor maksimal ideal adalah skor yang mungkin dicapai siswa apabila semua butir soal dapat dijawb dengan benar. Cara mencari skor maksimal ideal adalah menghitung jumlah butir serta bobot dari masing-masing butir. 2) Membuat pedoman konversi. Pedoman konversi skor ini didasarkan pada tingkat penguasaan terhadap materi yang diberikan. Pedoman yang lazim digunakan untuk skala lima adalah: Tingkat Penguasaan Skor standar 90% - 100% A 80% - 89% B 65% - 79% C 55% - 64% D 0% - 54% E Contoh: Misalkan skor maksimal ideal (SMI) suatu tes hasil belajar 90, maka : Penguasaan 90% skor mentahnya = 90/100 x 90 = 81 Penguasaan 80% skor mentahnya = 80/100 x 90 = 72 Penguasaan 65% skor mentahnya = 65/100 x 90 = 58,5 Penguasaan 55% skor mentahnya = 55/100 x 90 = 49,5 Berdasarkan batas-batas tersebut, dapat dibuat tabel konversi, yaitu;



326 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Skor Mentah 81 – 90 72 – 80 58,5 - 71 49,5 – 57,5 0 – 48,5



Skor Standar A B C D E



Berdasarkan pedoman konversi tersebut, dapatlah diberikan nilai kepada siswa, misalnya siswa yanag memperoleh skor mentah 72 akan mendapat skor standar B, dan bagi siswa yang memperoleh skor mentahnya 71 maka akan mendapat skor standar C, dan seterusnya. b. Konversi dengan Skala Sembilan Skala sembilan adalah suatu pembagian tingkatan yang terbagi atas sembilan kategori. Untuk mengubah skor mentah menjadi skor standar pada skala sembilan adalah sama seperti pada langkah skala lima. Jadi skor siswa dapat dikonversi dengan pedoman berikut; Tingkat Penguasaan 85% - 100% 75% - 84% 65% - 74% 55% - 64% 45% - 54% 35% - 44% 25% - 34% 15% - 24%



Skor standar 9 8 7 6 5 4 3 2



327 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



0% - 14% 1 Untuk mencari tingkat penguasaan adalah sama seperti pada skala lima. Misalkan Skor Maksimal Idealnya adalah 90, maka; Penguasaan 85% skor mentahnya = 85/100 x 90 = 76,5 Penguasaan 75% skor mentahnya = 75/100 x 90 = 67,5 Penguasaan 65% skor mentahnya = 65/100 x 90 = 58,5 Penguasaan 55% skor mentahnya = 55/100 x 90 = 49,5 Penguasaan 45% skor mentahnya = 45/100 x 90 = 40,5 Penguasaan 35% skor mentahnya = 35/100 x 90 = 31,5 Penguasaan 25% skor mentahnya = 25/100 x 90 = 22,5 Penguasaan 15% skor mentahnya = 15/100 x 90 = 13,5 Untuk mengubah skor mentah menjadi skor standar pada skala sembilan adalah sama seperti pada langkah skala lima. Jadi skor siswa dapat dikonversi dengan pedoman berikut. Skor mentah Skor standar 76,5 – 90 9 67,5 – 75,5 8 58,5 – 66,5 7 49,5 –57,5 6 40,5 – 48,5 5 31,5 – 39,5 4 22,5 – 30,5 3 13,5 – 21,5 2 0,0 - 12,5 1



328 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Berdasarkan konversi skor mentah menjadi skor standar tersebut, maka sisw yang mendapat skor mentah 45 akan mendat skor standar 5, dan siswa yang mendapat skor mentah 52 mndapat skor standar 6, demikian seterusnya. c.Konversi dengan Skala Sebelas Untuk membuaat pedoman konversi skala sebelas adalah sama seperti konversi pada skala sepuluh, jadi pedoman konversi skala sebelas adalah: Tingkat Penguasaan 95 % - 100 % 85 % - 94 % 75 % - 44 % 65 % - 74 % 55 % - 64 % 45 % - 54 % 35 % - 44 % 25 % - 34 % 15 % - 24 % 5 % - 14 % 0% - 4%



Skor standar 10 9 8 7 6 5 4 3 2 1 0



Untuk mencari tingkat penguasaan adalah sama seperti pada skala sembilan. Misalkan Skor Maksimal Idealnya adalah 90, maka Penguasaan 95% skor mentahnya = 95/100 x 90 = 85,5 Penguasaan 85% skor mentahnya = 85/100 x 90 = 76,5 Penguasaan 75% skor mentahnya =75/100 x 90 = 67,5 329 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Penguasaan 55% skor mentahnya =65/100 x 90 = 58,5 Penguasaan 55% skor mentahnya = 55/100 x 90 = 49,5 Penguasaan 45% skor mentahnya = 45/100 x 90 = 40,5 Penguasaan 35% skor mentahnya =35/100 x 90 = 31,5 Penguasaan 25% skor mentahnya =25/100 x 90 = 22,5 Penguasaan 15% skor mentahnya =15/100 x 90 = 13,5 Penguasaan 5% skor mentahnya = 5/100 x 90 = 4,5 Untuk mengubah skor mentah menjadi skor standar pada skala sebelas adalah sama seperti pada langkah skala sepuluh. Jadi skor siswa dapat dikonversi dengan pedoman berikut. Skor mentah Skor standar 85,5 – 90 10 76,5 – 84,5 9 67,5 – 75,5 8 58,5 –66,5 7 49,5 – 57,5 6 40,5 – 48,5 5 31,5 – 39,5 4 22,5 – 30,5 2 4,5 - 12,5 1 0,0 - 3,5 0 d. Konversi skor dengan Skala Seratus Skala seratus (skala persentil) adalah skala yang bergerak antara nol sampai seratus. Untuk mengkonversikan skor mentah menjadi skor standardigunakan rumus berikut.



330 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



P=



x 100



dengan: P = persentil X = skor yang dicapai Contoh: Misalkan Skor Maksimal Ideal adalah 90. Jika seorang siswa memperoleh skor mentah 75, maka skor standar siswa tersebut adalah: P=



x 100 = 83,33



e. Konversi dengan Z skor Skala Z skor adalah suatu ukuran yang menunjukkan berapa besarnya penyimpangan standar seseorang berada di bawah atau di atas rata-rata dalam kelompok tersebut . Adapun rumus Z skor adalah: Z=



̅



dengan: ̅ = Skor rata-rata ideal



Langkah-langkah yang ditempuh untuk mengkonversikan skor mentah menjadi skor standar dengan Z skor adalah sebagai berikut a) Mencari skor maksimal ideal (SMI) b) Mencari angka rata-rata ideal dengan menggunakan rumus: ̅ = ½ x skor maksimal ideal (SMI) 331 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



c) Mencari standar deviasi ideal dengan rumus: = 1/3 x ̅ d) Mengkonversikan skor mentah menjai skor standar, dengan rumus Z skor. Contoh . Misalkan Skor Maksimal Ideal adalah 90. Jika seorang siswa memperoleh skor mentah 40, maka skor standar siswa tersebut dihitung sebagai berikut: SMI = 90 ̅ = ½ x 90 = 45 , maka Z=



̅



=



= - 0,33



f.Konversi dengan T skor Yang dimaksud dengan T skor adalah suatu skor terjabar yang mempunyai rata-rata (M atau ̅) = 50 dan besar standar deviasi (SD) = 10. Rumusnya adalah: T = 50 +



̅



x 10 atau T = 50 + 10 Z



Keterangan: X = skor mentah yang diperoleh siswa ̅ = rata-rata ideal = standar deviasi ideal



332 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Contoh: Kita ambil contoh soal di atas, jika siswa memperoleh skor mentah 40, maka skor standarnya (T skor) adalah; T = 50 + = 50 + = 50 +



̅



x 10 x 10



x 10



= 50 – 3,3 = 46,7 (dibulatkan 47) Kelebihan Penilaian Acuan Patokan Adapun kelebihan menggunakan konversi skor acuan patokan, yaitu: a) Dapat membantu guru merancang program remidial b) Tidak membutuhkan perhitungan statistik yang rumit c) Dapat mengukur ketercapaian tujuan pembelajaran d) Nilainya bersifat tetap selama standar yang digunakan sama. e) Hasil penilaian dapat digunakan untuk umpan balik atau untuk mengetahui apakah tujuan pembelajaran sudah tercapai atau belum. f) Banyak digunakan untuk kelas dengan materi pembelajaran berupa konsep. g) Mudah menilai karena ada patokan 2. Penilaian Acuan Norma Dalam Penilaian Acuan Norma (PAN), makna skor seorang siswa ditentukan dengan cara membandingkan 333 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



hasil belajarnya dengan hasil belajar siswa lainnya dalam satu kelompok kelasnya. Soal-soal tes dalam PAP harus dibuat dengan tingkat kesukaran yang bervariasi, mulai dari yang mudah sampai dengan yang sukar, sehingga memungkinkan penyebaran jawaban siswa bervariasi, sehingga dapat dibandingkan siswa yang satu dengan siwa lainnya. Sama seperti halnya pada pendekatan PAP, pendekatan PAN juga dilakukan konversi skala lima, skala 100, skala sembilan, dan skala sebelas. a. Konversi dengan Skala lima Adapun langkah yang ditempuh untuk mengkonversi skor mentah menjadi skor standar pada skala lima adalah: a) Menghitung angka rata-rata (M atau ̅) skor yang diperoleh siswa, dengan rumus: ̅=



atau ̅ =



dengan: x = skor peserta tes/siswa f = frekwensi skor peserta tes/siswa N = Jumlah peserta tes b) Mencari Standar Deviasi (SD) dari skor yang diperoleh siswa dengan rumus: SD =



(



)



atau SD =



--



(



)



c) Membuat pedoman konversi skala lima. Pedoman konversi skala lima berarti membagi nilai standar menjadi lima skala, atau lima kualifikasi. Cara menyusun skala lima adalah dengan membagi



334 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



wilayah di bawah lengkung kurva normal menjadi lima daerah, lihat gambar 14.1 berikut.



E



𝑥-



C



D



B



𝑥



𝑥-



𝑥



A



𝑥



Gambar 14.1. Kurva normal skala lima Kurva normal di atas terbagi menjadi lima daerah dan setiap daerah menunjukkan nilai/angka dari kanan ke kiri A, B, B, C, D dan E. Berdasarkan pembagian itu, pedoman konversi skala lima dapat disusun sebagai berikut. ̅̅̅+ 1,5 SD



A



̅ + 0,5 SD B C ̅ - 0,5 SD D ̅ - 1,5 SD E



Contoh: Misalkan skor hasil tes yang dikerjakan oleh siswa adalah sebagai berikut (Nurkancana &Sunartana, 1990). 335 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



46 37 51 42 34



39 24 49 30 11



32 38 40 35 28



31 58 45 36 27



43 17 41 35 33



32 48 25 20 53



44 38



Dengan menggunakan langkah-langkah di atas diperoleh: a) Mean (M atau ̅ ) skor siswa = 36,37 b) Standar Deviasi (SD) skor yang diperoleh siswa =10,15 c) Berdasarkan pedoman konversi skor skala lima acuan norma maka dapat disusun pedoman konversi sebagai berikut: ̅ + 1,5 SD = 36,37 + 1,5 x 10,15 =50,60 ̅ + 0,5 SD = 36,37 + 0,5 x 10,15 = 41,35 ̅ -+ 0,5 SD = 36,37 - 0,5 x 10,15 = 31,20



A B



C



D ̅ - 1,5 SD = 36,37 – 1,5 x 10,15= 21,05 E



Dengan menggunakan pedoman konversi tersebut, maka siswa yang memperoleh skor mentahnya 52, skor standarnya menjadi A. b. Konversi dengan Skala sembilan Adapun langkah yang ditempuh untuk mengkonversi skor mentah menjadi skor standar pada skala sembilan adalah sama seperti langkah pada skor 336 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



lima (point: a, dan b), kecuali pada pedoman konversinya. Pedoman konversi skala sembilan berarti membagi nilai standar menjadi sembilan skala atau sembilan angka.Cara menyusun skala sembilan adalah sama dengan skala lima yaitu dengan membagi wilayah di bawah lengkung kurva normal menjadi sembilan daerah, lihat gambar 14.2 berikut.



5 1



2



3



6



4



7



8



9



𝑥 𝑥-



𝑥



𝑥-



𝑥



𝑥-



𝑥



𝑥-



𝑥 Gambar 14.2. Kurva normal skala sembilan



Kurva normal tersebut terbagi menjadi sembilan daerah dan setiap daerah menunjukkan nilai/angka dari kiri ke kanan 1, 2, 3, 4, 5, 6, 7, 8, dan 9. Berdasarkan pembagian itu, pedoman konversi skala sembilan dapat disusun sebagai berikut. ̅ + 1,75 SD



9 8



337 | Pengukuran & Evaluasi Hasil Dan Proses Belajar 7



Prof. Dr. Yusrizal, M.Pd



̅ + 1,25 SD ̅ + 0,75 SD ̅ + 0,25 SD



6



̅ - 0,25 SD



5



̅ - 0,75 SD 4 ̅ - 1,25 SD 3 2 ̅ - 1,75 SD 1



Contoh: Misalkan skor hasil tes adalah seperti yang ada pada contoh di atas, dengan: Mean ( ̅ ) skor siswa = 36,37, dan Standar Deviasi (SD) skor =10,15. Menggunakan pedoman konversi skala sembilan,diperoleh sebagai berikut. 9



̅ + 1,75 SD = 36,37 + 1,75 x 10,15 = 54,13 8 ̅ + 1,25 SD = 36,37 + 1,25 x 10,15 = 49,06 7 ̅ + 0,75 SD = 36,37 + 0,75 x 10,15 = 43,98 6 ̅ + 0,25 SD = 36,37 + 0,25 x 10,15 = 38,91 5 ̅ - 0,25 SD = 36,37 – 0,25 x 10,15 = 33,83 4 ̅ - 0,75 SD = 36,37 – 0,75 x 10,15 = 28,76 3 ̅ - 1,25 SD = 36,37 – 1,25 x 10,15 = 23,68 2 ̅ - 1,75 SD = 36,37 – 1,75 x 10,15 = 18,61 1



338 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Dengan pedoman konversi skala sembilan di atas, maka siswa yang skor mentahnya 30 akan mendapat skor standarnya 4, sedangkan bagi siswa yang skor mentahnya 40, akan mendapat skor standarnya 6. b. Konversi dengan Skala sebelas Untuk mengkonversi skor mentah menjadi skor standar pada skala sebelas hanya menambah satu interval lagi ke atas dan satu interval lagi ke bawah pada pedoman konversi skor sembilan, sehingga ada sebelas interval. Langkah yang ditempuh untuk mengkonversi skor mentah menjadi skor standar pada skala sebelas adalah sama seperti langkah pada skor sembilan (point: a, dan b), kecuali pada pedoman konversinya. Pedoman konversi skor sebelas berarti membagi nilai standar menjadi sebelas skala. Cara menyusun skala sebelas sama dengan skala lima dan sembilan yaitu dengan membagi wilayah di bawah lengkung kurva normal menjadi sebelas daerah, perhatikan gambar 14.3 berikut.



5 0 1



𝑥-



𝑥-



2 3 4



𝑥-



𝑥𝑥-



𝑥



6



𝑥



7 8



9 10



𝑥 𝑥



𝑥



𝑥



339 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Gambar 14.3 Kurva normal skala sebelas Kurva normal tersebut terbagi menjadi sebelas daerah dan 10 nilai/angka dari kanan ke kiri setiap daerah menunjukkan 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, dan 10. Berdasarkan pembagian itu, pedoman konversi skala sebelas dapat disusun sebagai berikut. ̅ + 2,25 SD 9 ̅ + 1,75 SD 8 ̅ + 1,25 SD 7 ̅ + 0,75 SD 6 ̅ + 0,25 SD 5 ̅ - 0,25 SD ̅ - 0,75 SD 4 3 ̅ - 1,25 SD 2 ̅ - 1,75 SD 1 ̅ - 2,25 SD 0



Contoh: Misalkan skor hasil tes adalah seperti yang ada pada contoh di atas, dengan: Mean ( ̅ ) skor siswa = 36,37, dan Standar Deviasi (SD) =10,15. Menggunakan pedoman konversi skala sebelas diperoleh sebagai berikut. 10



̅ + 2,25 SD = 36,37 + 2,25 x 10,15 = 59,21 ̅ + 1,75 SD = 36,37 + 1,75 x 10,15 = 54,13 ̅ + 1,25 SD = 36,37 + 1,25 x 10,15 = 49,06



9 8



7 340 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



̅ + 0,75 SD = 36,37 + 0,75 x 10,15 = 43,98 ̅ + 0,25 SD = 36,37 + 0,25 x 10,15 = 38,91 ̅ - 0,25 SD = 36,37 - 0,25 x 10,15 = 33,83 ̅ - 0,75 SD = 36,37 - 0,75 x 10,15 = 28,76 ̅ - 1,25 SD = 36,37 - 1,25 x 10,15 = 23,68 ̅ - 1,75 SD = 36,37 – 1,75 x 10,15 = 18,61 ̅ - 2,25 SD = 36,37 – 2,25 x 10,15 =13,53



6 5 4



3 2



1 0



Jadi menggunakan pedoman konversi skala sebelas, siswa yang memperoleh skor mentahnya 40 akan mendapat skor standarnya 5, sedangkan bagi siswa yang skor mentahnya 50, akan mendapat skor standarnya 8. d. Konversi dengan Skala Z skor Rumus Z skor acuan norma adalah sama saja dengan rumus Z skor acuan patokan. Letak perbedaannya adalah dalam mencari angka rata-rata (M atau ̅) dan Standar Deviasi (SD)nya saja. Kalau pada rumus Z skor acuan patokan M atau ̅ berdasarkan Skor



Maksimal Ideal (SMI), sedangkan pada rumus Z skor acuan norma M atau ̅ berdasarkan distribusi skor yang ril dicapai oleh peserta tes (Nurkancana dan Sunartana,1990). Adapun rumus Z skor untuk acuan norma adalah: Z=



̅



341 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



dengan: x = skor ̅ = rata-rata



Jadi kalau diketahui Mean ( ̅ ) skor siswa = 36,37, dan Standar Deviasi (SD) =10,15 maka konversi skor mentah menjadi skor standar (Z skor) adalah sebagai yang terlihat dalam Tabel berikut: Contoh: Tabel Konversi skor mentah menjadi skor standar (Z skor) Nama Skor Skor standar Siswa mentah (Z skor) Aini 70 (70 – 36,37)/10,15 = 3,31 Budi. 60 (60 – 36,37)/10,15 = 2,32 Dian 55 (55 – 36,37)/10,15 = 1,86 Eka 50 (50 – 36,37)/10,15 = 1,34 Fitri 45 (45 – 36,37)/10,15 = 0,85 Leli 35 (35 – 36,37)/10,15 = -0,13 Sari 30 (30 – 36,37)/10,15 = -0,62 e.Konversi dengan Skala T skor Rumus T skor untuk acuan norma juga sama dengan rumus T skor untuk acuan patokan. Juga yang berbeda hanya dalam cara mencari M atau ̅ . Rumus T skor untuk acuan norma adalah: T = 50 +



̅



x 10 atau T = 50 + 10 Z



342 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Keterangan: x = skor mentah yang diperoleh siswa ̅ = rata-rata skor siswa = Standar Deviasi Contoh: Konversi skor mentah menjadi skor standar (T skor) adalah sebagai yang terlihat pada Tabel berikut. Tabel konversi skor mentah menjadi skor standar (T skor) Nama Siswa Aini Budi. Dian Eka Fitri Leli Sari



Skor mentah 70 60 55 50 45 35 30



Skor standar (T skor) 50 + 10 x 3,31 = 63,30 50 + 10 x 2,32 = 62,32 50 + 10 x 1,86 = 61,86 50 + 10 x 1,34 = 61,34 50 + 10 x 0,85 = 60,85 50 + 10 x -0,13 = 59,87 50 + 10 x -0,62 = 59,38



Kelebihan Penilaian Acuan Norma a) Dapat digunakan untuk menetapkan nilai secara maksimal b) Dapat membedakan kemampuan peserta didik yang pintar dan kurang pintar. Membedakan kelompok atas dan bawah. c) Fleksibel: dapat menyesuaikan dengan kondisi yang berbeda-beda d) Mudah menilai karena tidak ada patokan e) Dapat digunakan untuk menilai ranah kognitif, afektif dan psikomotor .



343 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



344 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



UNIT VI PENGUKURAN DAN PENILAIAN AFEKTIF Keberhasilan pembelajaran pada ranah kognitif dan psikomotor dipengaruhi oleh kondisi afektif siswa. Siswa yang memiliki minat belajar dan sikap positif terhadap pelajaran akan merasa senang mempelajari mata pelajaran tertentu, sehingga dapat mencapai hasil pembelajaran yang optimal. Ranah afektif menentukan keberhasilan belajar seseorang. Oleh karena itu semua guru atau pendidik harus mampu membangkitkan minat semua siswa untuk mencapai kompetensi yang telah ditentukan. Untuk itu semua guru dalam merancang program pembelajaran,



345 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



harus memperhatikan ranah afektif. Pencapai hasil belajar yang optimal, dalam mencapai program pembelajaran dan kegiatan pembelajaran bagi peserta didik, pendidik harus memperhatikan karakteristik afektif siswa. Aderson (1981) berpendapat bahwa karakteristk manusia meliputi cara yang tipikal dari berpikir, berbuat, dan perasaan. Tipikal perasaan berkaitan dengan ranah afektif. Penilaian afektif dilakukan oleh guru melalui pengamatan terhadap perkembangan afeksi siswa. Ada dua hal yang berhubungan dengan penilaian afektif yang harus dinilai. Pertama, kompetensi afektif yang ingin dicapai dalam pembelajaran meliputi tingkatan pemberian respons, apresiasi, penilaian dan internalisasi. Kedua, sikap dan minat siswa terhadap mata pelajaran dan proses pembelajaran. Dalam proses pembelajaran terdapat lima tipe karakteristik afektif yang penting yaitu sikap, minat, konsep diri dan nilai dan moral. Seorang guru atau pendidik sebaiknya mengetahui afektif siswa sehingga dapat diketahui status afektif siswanya. Jika afektif tinggi maka perlu mempertahankannya, jika rendah perlu upaya untuk meningkatkannya.



346 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 15 BENTUK-BENTUK SKALA PENGUKURAN A.Skala Pengukuran Skala adalah alat untuk mengukur nilai, sikap, minat dan perhatian dan lain-lain yang disusun dalam bentuk pernyataan untuk dinilai oleh responden dan hasilnya dalam bentuk rentangan nilai sesuai dengan kriteria yang ditentukan (Sudjana (2009). Skala terbagi tiga, yaitu: skala penilaian, skala sikap, dan skala minat. Skala terdiri atas daftar pernyataan/pertanyaan yang disampaikan kepada responden untuk dijawab secara tertulis. Ada beberapa model atau bentuk skala yang dikembangkan oleh para pakar untuk mengukur sikap.



347 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Beberapa bentuk skala sikap antara lain adalah (1) Skala Likert (2) Skala Semantik Diferensiasi (3) Skala Guttman, dan (4) Skala Thrustone.



1.Skala Likert Skala Likert dikembangkan oleh Rensis Likert pada tahun 1932 dalam mengukur sikap masyarakat. Dalam skala ini hanya menggunakan item yang secara pasti baik dan secara pasti buruk. Item yang pasti disenangi, disukai, yang baik, diberi Gambar 15.1. Rensis tanda negatif (-). Total skor Likert merupakan penjumlahan skor responsi dari responden yang hasilnya ditafsirkan sebagai posisi responden. Skala Likert tersusun atas beberapa pernyataan positif (favorable statements) dan pernyataan negatif (unfavorable statements) yang mempunyai lima kemungkinan jawaban (option) dengan kategori yang continuum, dari mulai jawaban sangat setuju (strongly agree) sampai sangat tidak setuju (strongly disagree). Item-item Likert menyediakan respon dengan kategori yang berjenjang. Biasanya banyaknya jenjang adalah lima, yaitu : sangat setuju, setuju, ragu-ragu, tidak setuju dan sangat tidak setuju. Setiap kategori respon,



348 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



selanjutnya diberi skor. Penskoran untuk skala sikap Likert dapat dilakukan sebagai berikut. Pernyataan Positif Sangat Setuju (SS) Setuju (S) Netral (N) Tidak Setuju (TS) Sangat Tidak Setuju (STS)



5 4 3 2 1



Pernyataan Negatif Sangat Setuju (SS) Setuju (S) Netral (N) Tidak Setuju (TS) Sangat Tidak Setuju (STS)



1 2 3 4 5



a. Langkah-langkah penyusunan: Adapun langkah-langkah penyusunan Skala Likert (Likert Scales) dapat dirinci sebagai berikut. 1. Menentukan objek sikap --- misalnya sikap terhadap pelajaran fisika. 2. Menyusun kisi-kisi atau konstruk skala sikap berisi rincian aspek sikap berikut jumlah dan jenis pernyataan (positif atau negatif). 3. Menulis pernyataan (statement) secara tepat dengan memperhatikan kaedah sebagai berikut. a. menghindari kalimat yang mengandung banyak interpretasi; b. rumusan pernyataan hendaknya singkat; c. satu pernyataan hendaknya hanya mengandung satu pikiran yang lengkap; d. sedapat mungkin, pernyataan hendaknya dirumuskan dalam kalimat yang sederhana; e. menghindari penggunaan kata-kata: semua, selalu, tidak pernah, dan sejenisnya; 349 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



4. Mengkaji/menganalisis setiap pernyataan secara rasional (isi telah mewakili aspek/objek sikap dan struktur kalimat benar) 5. Menganalisis tingkat kebaikan skala sikap (reliabilitas, validitas, ketepatan skala 6. Antara pernyataan positif dan pernyataan negatif hendaknya relatif berimbang. 7. Setiap pernyataan diikuti dengan skala sikap (bisa genap, misanya 4 atau ganjil, misalnya 5). b. Penskoran dan Interpretasi Untuk menghitung total skor tiap responden adalah dengan cara menjumlahkan skor-skor item yang diperoleh responden. Oleh karena itu, prosedur penskalaan Likert sering disebut sebagai : Likert’s Summeted Rating. Skor yang dicapai oleh siswa adalah jumlah dari seluruh angka untuk seluruh penyataan yang direspon atau diberi tanda cek (√). Perbedaan jumlah angka yang dicapai oleh para siswa dapat ditafsirkan sebagai perbedaan sikap, positif atau negatif, terhadap objek sikap. Untuk menilai sikap individu atau kelompok (skor rata-rata), yaitu dengan cara membanding skor yang diperoleh dengan kriteria tertentu. Caranya adalah sebagai berikut. Jika jumlah butir skala sikap 5, maka: a. Menentukan skor maksimal, yaitu skor jawaban terbesar di kali banyak item 5 x 5 = 25 b. Menentukan skor minimal, yaitu skor jawaban terkecil dikali banyak item 1 x 5 = 5



350 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



c. Menentukan nilai median, yaitu hasil penjumlahan skor maximal dengan skor minimal dibagi dua (25 + 5) : 2 = 15 d. Menentukan nilai kuartil 1, yaitu hasil penjumlahan skor minimal dengan median dibagi dua (5 + 15): 2 = 10 e. Menentukan kuartil 3, yaitu hasil penjumlahan skor maksimal dengan median dibagi dua (25 + 15): 2 = 20 Selanjutnya berdasarkan angka-angka tersebut dibuatkan skalanya, sebagai berikut. 5



10



Minimal



Kuartil 1



15



Median



20



Kuartil 3



30



Maksimal



Gambar 15.2. Skala Berdasarkan gambar skala di atas maka skor dari keempat kategori adalah : Sikap sangat setuju : (kuartil 3  x  skor maksimal) Sikap setuju : (median  x < kuartil 3) Sikap tidak setuju : (kuartil 1  x < median) Sikap sangat tidak setuju : (skor minimal  x kuartil 1)



351 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



c. Kelebihan skala likert: 1) Dalam menyusun skala, item-item yang tidak jelas korelasinya masih dapat dimasukkan dalam skala. 2) Lebih mudah membuatnya dari pada skala thurstone. 3) Mempunyai reliabilitas yang relatif tinggi dibanding skala thurstone untuk jumlah item yang sama. Juga dapat memperlihatkan item yang dinyatakan dalam beberapa responsi alternatif. 4) Dapat memberikan keterangan yang lebih nyata tentang pendapatan atau sikap responden. d. Kelemahan skala likert: 1) Hanya dapat mengurutkan individu dalam skala, tetapi tidak dapat membandingkan berapakali individu lebih baik dari individu lainya. 2) Kadang kala total skor dari individu tidak memberikan arti yang jelas, banyak pola responsi terhadap beberapa item akan memberikan skor yang sama. 3) Validitas dari skala likert masih memerlukan penelitian empirik.



2. Skala Semantik Diferensial Teknik Pengukuran semantik differensial idiperkenalkan oleh Charles Osgood (1957) yang menekankan pada aspek semantik sebuah kata. Skala ini merupakan salah satu teknik self report untuk pengukuran sikap dimana subjek diminta memilih satu kata sifat atau



352 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



frase dari sekelompok pasangan kata sifat atau pasangan frase yang disediakan yang paling mampu menggambarkan perasaan mereka terhadap suatu objek. Teknik semantik differensial merupakan penyempurnaan dari skala Likert yang tidak mampu menjangkau respon yang bersifat multidimensi, misalnya sikap terhadap standar nilai UAN Skala Diferensiasi Semantik memiliki dua kelebihan dibandingkan dengan berbagai teknik yang lain. Pertama, teknik ini dapat digunakan dalam berbagai bidang. Kedua, teknik ini sederhana dan mudah diimplementasikan dalam pengukuran dan penilaian sikap, termasuk dalam pengukuran dan penilaian sikap siswa di kelas. a.Langkah-langkah pengembangan Langkah-langkah pengembangan skala Diferensial Semantik ini adalah sebagai berikut. 1) Menentukan objek sikap yang akan dikembangkan skalanya, misalnya "Sikap terhadap Mata Pelajaran Fisika". 2) Memilih dan membuat daftar dari konsep dan kata sifat yang relevan dengan objek penilaian sikap. Misalnya: menarik; penting; menyenangkan; mudah dipelajari; dan sebagainya. 3) Memilih kata sifat yang tepat dan akan digunakan dalam skala. 4) Menentukan rentang skala pasangan bipolar dan penskorannya. b. Penskoran dan interpretasi



353 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Penskoran untuk skala ini dapat dilakukan dalam rentang 1 sampai dengan 7. Arah paling kiri adalah paling besar, yakni diskor 7, karena menunjukkan sikap paling positif terhadap objek sikap, mata pelajaran Fisika. Arah paling kanan adalah paling kecil, karena menunjukkan sikap paling negatif terhadap mata pelajaran tersebut. Andaikan jumlah pernyataan sikap ada 5 maka: Skor maksimum adalah: 5 x 7 = 35 Skor minimum adalah: 1 x 7 = 7 Jika siswa memperoleh skor semakin mendekati angka 7 (skor terendah), dapat diinterpretasikan semakin negatif sikap siswa terhadap mata pelajaran Fisika. Sebaliknya, jika siswa memperoleh skor semakin mendekati angka 35 (skor tertinggi), dapat diinterpretasikan semakin positif sikap siswa terhadap mata pelajaran Fisika. Jika siswa memilih sikap netral terhadap mata pelajaran Fisika, siswa akan memberi tanda cek pada interval skala tengah. Pada interval skala ini skor yang diberikan adalah 3. Dengan demikian, apabila siswa memilih sikap netral untuk semua pernyataan sikap (andaikan jumlah pernyataan sikap ada 5), maka siswa akan memperoleh skor 15. Dengan demikian skor yang diperoleh siswa dengan skala tersebut dapat diinterpretasikan sebagai berikut.



354 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Skor 15 = Sikap siswa adalah netral. Skor > 15 = Sikap siswa adalah positif. Skor < 15 = Sikap siswa adalah negatif.



3. Skala Thrustone Skala Thurstone, skala ini mula-mula dikembangkan oleh L.L Thurstone dari metoda psikofisikal yang bertujuan untuk mengurutkan responden berdasarkan ciri atau kriteria tertentu. Skala Thurstone, digunakan untuk mengukur tentang sikap, persepsi seseorang atau sekelompok orang tentang fenomena tertentu yang ingin diketahui. Skala Thurstone memuat jumlah pernyataan yang harus dipilih oleh responden, yang masing-masing telah diberi skor (bobot) tertentu.



a. Langkah-langkah penyusunan 1) Pembuat skala menyusun sebanyak-banyaknya pernyataan yang berhubungan dengan masalah yang dinilai ,kira-kira 100-300 butir. Gambar 15. 3. L.L Thurstone



2) Pernyataan yang disajikan dengan menggunakan skala Thurstone ini biasanya dibuat sebanyak 9 atau 11



butir. 3) Misalkan pembuat skala menentukan bahwa skor yang akan dipakai untuk pernyataan yang kontribusinya



355 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



paling tinggi adalah 9 dan untuk yang paling rendah diberi skor 1, sehingga skor tengahnya sama dengan 5 4) Berdasarkan hasil pertimbangannya, ia menetapkan bahwa pernyataan yang paling tinggi kontribusinya terhadap sikap positif (misalnya terhadap Fisika) adalah pernyataan nomor 2 sehingga ia memberi bobot skor 9. 5) Agar hasil pertimbangan itu lebih objektif, ia meminta bantuan kepada teman seprofesinya yang dianggap mampu atau lebih mampu daripada dirinya sendiri. Misalkan ada 4 orang yang diminta pertimbangan itu, hasil pertimbangan untuk butir nomor 2 dari keempat orang itu masing-masing 8, 8, 9 dan 9. Dengan demikian skor untuk butir soal nomor 2 itu adalah



=



8,6 6) Untuk butir nomor 8 pembuat skala memberi skor 2 karena ia menganggap kontribusinya rendah terhadap sikap siswa Keempat teman lainnya masing-masing memberi skor 3, 4, 1, 2 sehingga skor untuk butir nomor 8 adalah



= 2,4



Begitulah seterusnya cara pemberian skor untuk setiap butir pernyataan. 7) Misalkan skor untuk setiap butir soal, berturut-turut dari butir soal nomor 1 sampai dengan nomor 9 adalah sebagai berikut : 9,0; 8,6; 8,2; 7,6; 4,5; 6,0; 7,6; 2,4; 4,0; 5,3 Setelah skala diberikan kepada responden (siswa), misalkan Eva memilih butir-butir nomor 1, 4, 6, 7 dan 10. Rerata skor dari Eva adalah 9,0 + 7,6 + 6,0 + 7,6 + 5,3 = 7,1 356 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



8) Ini berarti sikap Eva terhadap fisika positif, karena skornya lebih dari skor tengah (= 5).



4. Skala Guttman Skala Guttman dikembangkan oleh Louis Guttman. Skala ini mempunyai ciri penting, yaitu (1) merupakan skala kumulatif, artinya jika seseorang mengiakan pernyataan yang berbobot lebih berat, maka ia juga akan Gambar 15.4. Louis mengiakan pernyataan yang kurang Guttman berbobot lainnya, (2) dan mengukur satu dimensi saja dari satu variabel yang multi dimensi, sehingga skala ini termasuk mempunyai sifat undimensional. Skala Guttman ialah skala yang digunakan untuk jawaban yang bersifat jelas (tegas dan konsisten. Misalnya yakin-tidak yakin ;ya – tidak; benar-salah; positif – negatif; pernah-belum pernah ; setuju – tidak setuju; dan sebagainya. Pengukuran dengan menggunakan skala Guttman apabila ingin mendapatkan jawaban jelas (tegas) dan konsisten terhadap suatu permasalahan yang ditanyakan. Contoh: a. Yakin atau tidakkah anda, pergantian Kurikulum akan dapat meningkatkan mutu pendidikan ?



357 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



1. Yakin 2. Tidak b. Pernahkah atasan saudara mengajak rembuk bersama? 1. Pernah 2. Tidak Pernah Skala Guttman yang disebut juga metode scalogram atau analisa skala (scale analysis) sangat baik untuk menyakinkan peneliti tentang kesatuan dimensi dari sikap atau sifat yang diteliti, yang sering disebut isi universal (universe of content) atau atribut universal (universe attribute). Dalam prosedur Guttman, suatu atribut universal mempunyai dimensi satu jika menghasilkan suatu skala kumulatif yang sempurna,yaitu semua responsi diatur sebagai berikut (Nazir,1983): Pernyataan-pernyataan dalam skala Guttman disusun sedemikian rupa hingga jika responden menjawab YA pada butir pernyataan nomor 1, 2, dan 3 kemudian menjawab TIDAK pada butir nomor 4, untuk butir berikutnya ia menjawab TIDAK. Jadi diharapkan responden menjawab YA pada butir-butir awal, sekali ia menjawab TIDAK pada suatu butir pernyataan maka ia akan menjawab TIDAK pada butir selanjutnya. Dengan demikian penilaian cukup dengan mempertimbangkan atau menghitung batas jawaban YA yang diberikan responden. Interpretasi untuk menentukan sikap responden bisa dilakukan dengan cara menghitung persentase banyaknya jawaban YA dari seluruh butir pernyataan yang disajikan. 358 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Skor 4 3 2 1 0



4 1 x x



YA 3



x x



2



x x



TIDAK 4 3



2



1



x x x x



x x



x



x x x



x x x x



a. Langkah-langkah penyusunan 1. Susunlah sejumlah pertanyaan yang relevan dengan masalah yang ingin diselidiki. 2. Lakukan penelitiaan permulaan pada sejumlah responden dari populasi yang akan diselidiki, sampel yang diselidiki minimal besarnya 50. 3. Jawaban yang diperoleh dianalisis, dan jawaban yang ekstrim dibuang. Jawaban yang ekstrim adalah jawaban yang disetujui atau tidak disetujui oleh lebih dari 80% responden. 4. Susunlah jawaban pada tabel Guttman. 5. Hitunglah koefisien reprodusibilitas dan koefisien skalabilitas.



359 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Koefisien Reprodusibilitas, yang mengukur derajat ketepatan alat ukur yang telah dibuat (yaitu daftar pertanyaan) dihitung dengan menggunakan rumus: Kr = 1dengan: n = total kemungkinan jawaban, yaitu jumlah pertanyaan x jumlah responden. e = jumlah error. Kr = koefisien reprodusibilitas Sedangkan Koefisien Skalabilitas ditentukan dengan rumus Ks 1dengan: e = jumlah error. P = jumlah kesalahan yang diharapkan. Ks = koefisien skalabilitas. b . Kelemahan Skala Guttman, yaitu: 1. Skala ini bisa jadi tidak mungkin menjadi dasar yang efektif baik intuk mengukur sikap terhadap objek yang kompleks atau pun untuk membuat prediksi tentang perilaku objek tersebut. 2. Satu skala bisa saja mempunyai dimensi tunggal untuk satu kelompok tetapi ganda untuk kelompok lain, ataupun berdimensi satu untuk satu waktu dan mempunyai dimensi ganda untuk waktu yang lain.



360 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



B. Pengukuran dan Penilaian Sikap 1.Pengertian Sikap Edward (1957) mengemukakan “Attitude as the degree of positive or negative affect associated with some psychological object “Artinya Sikap adalah afeksi positif atau negatif yang berhubungan dengan beberapa objek psikologis. Menurut Thrustone (1970) Sikap adalah penilaian tentang suka atau tidak suka, tanggapan positif/negatif terhadap suatu objek psikologis. Anastasi (Depdiknas, 2007) mendefinisikan sikap sebagai kecenderungan untuk bertindak secara suka atau tidak suka terhadap sesuatu objek. Sedangkan menurut Birrent, et all (1981) mendefinisikan sikap sebagai kumpulan hasil evaluasi seseorang terhadap objek, orang, atau masalah tertentu. Jadi sikap adalah suatu bentuk dari perasaan, yaitu perasaan mendukung atau memihak (favourable) maupun perasaan tidak mendukung (Unfavourable) pada suatu objek. Sikap belum merupakan tindakan/aktivitas, melainkan berupa kecenderungan (tendency) atau predisposisi tingkah laku. Sikap lebih merupakan ”stereotype” seseorang. Melalui sikap seseorang, kita dapat mengenal siapa orang itu yang sebenarnya. Menurut Mouly (1967) sikap memiliki tiga komponen yaitu (1). Komponen afektif- kehidupan emosional individu, yakni perasaan tertentu (positif atau negatif) yang mempengaruhi penerimaan atau penolakan terhadap objek sikap, sehingga timbul rasa senang-tidak senang, takun-tidak takut. (2) Komponen kognitif yaitu aspek intelektual yang berhubungan dengan bilief, idea



361 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



atau konsep terhadap objek sikap, dan (3). Komponen behavioral, yakni kecenderungan individu untuk bertingkah laku tententu terhadap objek sikap. Menurut Mar’at (1984): (1) Komponen kognisi berhubungan dengan belief (kepercayaan atau keyakinan), ide, konsep, persepsi, stereotipe, opini yang dimiliki individu mengenai sesuatu. (2) Komponen Afeksi berhubungan dengan kehidupan emosional seseorang, menyangkut perasaan individu terhadap objek sikap dan menyangkut masalah emosi, dan (3) Komponen Kognisi yang merupakan kecenderungan bertingkah laku . Sikap adalah salah satu tipe karakteristik afektif yang penting. Tipe karakteristik penting lainnya yaitu : minat, konsep diri, nilai, dan moral. 2. Sikap dan Objek Sikap yang Perlu Dinilai Penilaian sikap dalam berbagai mata pelajaran secara umum dapat dilkakukan dalam berkaitan dengan berbagai objek sikap sebagai berikut. a) Sikap terhadap mata pelajaran. Siswa perlu memiliki sikap positif terhadap mata pelajaran. Dengan sikap positif dalam diri siswa akan tumbuh dan berkembang minat belajar, akan lebih mudah diberi motivasi, dan akan lebih mudah menyerap materi pelajaran yang diajarkan. Oleh karena itu, guru perlu menilai tentang sikap siswa terhadap mata pelajaran yang diajarkannya. b) Sikap terhadap guru mata pelajaran. Siswa perlu memiliki sikap positif terhadap guru, yang mengajar 362 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



suatu mata pelajaran. Siswa yang tidak memiliki sikap positif terhadap guru, akan cenderung mengabaikan halhal yang diajarkan. Dengan demikian, siswa yang memiliki sikap negatif terhadap guru pengajar akan sukar menyerap materi pelajaran yang diajarkan oleh guru tersebut. c) Sikap terhadap proses pembelajaran. Siswa juga perlu memiliki sikap positif terhadap proses pembelajaran yang berlangsung. Proses pembelajaran disini mencakup: suasana pembelajaran, strategi, metodologi, dan teknik pembelajaran yang digunakan. Tidak sedikit siswa yang merasa kecewa atau tidak puas dengan proses pembelajaran yang berlangsung, namun mereka tidak mempunyai keberanian untuk menyatakan. Akibatnya mereka terpaksa mengikuti proses pembelajaran yang berlangsung dengan perasaan yang kurang nyaman. Hal ini dapat mempengaruhi terhadap penyerapan materi pelajarannya. d) Sikap terhadap materi dari pokok-pokok bahasan. Siswa juga perlus memiliki sikap positif terhadap materi pelajaran yang diajarkan, sebagai kunci keberhasilan proses pembelajaran.



C. Metode Pengukuran Sikap Menurut Zakaria (2008), pengukuran sikap dapat dilakukan dengan beberapa cara. Cara-cara tersebut antara



363 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



lain: observasi perilaku, pertanyaan langsung, laporan pribadi, dan penggunaan skala sikap. 1. Observasi perilaku Observasi merupakan teknik penilaian yang dilakukan secara berkesinambungan dengan menggunakan indera, baik secara langsung maupun tidak langsung dengan menggunakan pedoman observasi yang berisi sejumlah indikator perilaku yang diamati. Observasi langsung dilaksanakan oleh guru secara langsung tanpa perantara orang lain. Sedangkan observasi tidak langsung dengan bantuan orang lain, seperti guru lain, orang tua, siswa, dan karyawan sekolah. Oleh karena itu guru dapat melakukan observasi terhadap siswa, bisa menggunakan daftar cek (checklists), kemudian hasil observasi dapat dijadikan sebagai umpan balik dalam pembinaan. Observasi dilakukan dengan menggunakan buku catatan Bentuk instrumen yang digunakan untuk observasi adalah pedoman observasi yang berupa daftar cek atau skala penilaian (rating scale) yang disertai rubrik. Daftar cek digunakan untuk mengamati ada tidaknya suatu sikap atau perilaku. Sedangkan skala penilaian menentukan posisi sikap atau perilaku siswa dalam suatu rentangan sikap. Observasi perilaku di Sekolah dapat dilakukan dengan Buku Catatan Harian.



364 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Contoh : Buku Catatan Harian dapat berisi sebagai berikut : No



Hari/tanggal



Nama Siswa



Kejadian (positif/negatif)



Tindak Lanjut



2. Pertanyaan langsung Guru juga dapat menanyakan secara langsung tentang sikap siswa berkaitan dengan sesuatu hal. Berdasarkan jawaban dan reaksi lain dari siswa dalam memberi jawaban dapat dipahami sikapnya terhadap objek sikap tersebut. Jika guru ingin mengetahui sikap siswa terhadap materi pelajaran yang diampunya dengan cara menanyakan langsung, maka guru tersebut dapat menggunakan instrumen penilaian sikap seperti berikut 3. Laporan pribadi Penggunaan teknik ini di sekolah, misalnya: siswa diminta membuat ulasan yang berisi pandangan atau tanggapannya tentang suatu masalah, keadaan, atau hal, yang menjadi objek sikap. Dari ulasan yang dibuat oleh 365 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



siswa tersebut dapat dibaca dan pahami kecenderungan sikap yang dimilikinya. 4. Skala Sikap Menggunakan skala-skala sikap sebagaimana yang telah diuraikan di atas, kita dapat menilai sikap siswa. Kita boleh menggunakan skala Likert atau skala diferensial semantik. Yang perlu diperhatikan adalah konstruksi butirbutirnya harus berpedoman pada indikator dari variabel yang ingin dinilai. Sebagai contoh di bawah, ingin dinilai sikap siswa terhadap pelajaran fisika. Contoh sikap siswa terhadap pelajaran fisika a) Menggunakan skala Likert No Sikap siswa STS TS R 1 Pelajaran fisika bermanfaat 2 Pelajaran fisika sulit 3 Tidak semua siswa harus Belajar fisika 4 Pelajaran fisika harus dibuat mudah 5 Harus banyak latihan pada Pelajaran fisika



366 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



S



SS



Prof. Dr. Yusrizal, M.Pd



b) Menggunakan skala Semantik Differensial



Menarik



√ !------!------!------!-------!------!-------!-------! Membosankan



Bermanfaat !------!------!-------! ------!-------!-------!-------! Sia-sia Banyak !------!------!-------!-------!------!-------!-------! Banyak Pemahaman Hafalan Mudah



!-------!------!------!------!-------!-------!-------! Sukar



367 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



368 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 16 PENGEMBANGAN I NSTRUMEN AFEKTIF A. Prosedur Pengembangan Instrumen Gable (1986) memberikan secara garis besar 15 langkah kerja yang harus ditempuh dalam mengembangkan instrumen, yaitu sebagai berikut: (1) mengembangkan definisi konseptual, (2) mengembang- kan definisi operasional, (3) memilih teknik pemberian skala, (4) melakukan review justifikasi butir, yang berkaitan dengan teknik pemberian skala yang telah ditetapkan, (5) memilih format respons atau ukuran sampel, (6) penyusunan petunjuk untuk respons, (7) menyiapkan draf instrumen, (8) menyiapkan instrumen akhir, (9) pengumpulan data ujicoba awal, (10) analisis data ujicoba dengan 369 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



menggunakan teknik analisis faktor, analisis butir dan reliabilitas, (11) revisi instrumen, (2) melakukan ujicoba final, (13) menghasilkan instrumen, (14) melakukan analisis validitas dan reliabilitas tambahan, dan (15) menyiapkan manual tes. Menurut Djaali dan Muljono (2008) langkahlangkah pengem- bangan instrumen adalah sebagai berikut: (1) merumuskan konstruk berdasarkan sintesis dari teori-teori yang dikaji, (2) dari konstruk dikembangkan dimensi dan indikator variabel yang hendak diukur, (3) membuat kisi-kisi instrumen dalam bentuk tabel spesifikasi yang memuat dimensi, indikator, nomor butir dan jumlah butir, (4) menetapkan besaran atau parameter dalam suatu rentangan kontinum, (5) menulis butir-butir instrumen dalam bentuk pernyataan atau pertanyaan, (6) melakukan proses validasi, (7) melakukan validasi teoritik, (8) merevisi berdasarkan hasil panel, (9) melakukan penggandaan instrumen untuk ujicoba, (10) ujicoba di lapangan yang merupakan validasi empirik, (11) pengujian validitas empiris dengan menggunakan kriteria internal maupun eksternal, (12) berdasarkan kriteria diperoleh kesimpulan mengenai valid atau tidaknya sebuah butir atau perangkat instrumen, (13) berdasarkan hasil analisis butir, butir-butir yang tidak valid dikeluarkan atau diperbaiki, butir-butir yang valid dirakit kembali, (14) menghitung koefisien reliabilitas, dan (15) perakitan kembali butir-butir instrumen yang valid untuk dijadikan instrumen.



370 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Dari uraian di atas dapat diimpulkan bahwa dalam upaya pengembangan instrumen, pertama-tama harus ditetapkan konstruk variabel yang merupakan sintesis dari teori-teori yang telah dibahas dan dianalisis. Kemudian konstruk tersebut dijelaskan dalam definisi konseptual dan definisi operasional yang mencakup dimensi/sub dimensi dan indikator dari variabel yang hendak diukur. Baru kemudian dibuat kisikisi instrumen dan butir-butir instrumen untuk mengukur indikator-indikator yang telah ditetapkan. Alur tahapan penyusunan dan pengembangan instrumen tersebut dapat dilihat pada gambar 16.1 berikut. Variabel



Teori Konstruk



Definisi Konseptual



Penulisan Butir Ujicoba Instrumen Analisis Hasil Ujicoba



Definisi Operasional Revisi Instrumen



Penetapan Instrumen Finalisasi



Kisi-Kisi Instrumen Perbanyakan Instrumen



Gambar 16.1. Alur Penyusunan dan Pengembangan Instrumen



371 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



B. Penulisan Butir Instrumen Terkait dengan penulisannya, Edwards (1957) memberikan kriteria informal yang dapat digunakan dalam penulisan pernyataan sikap, adalah sebagai berikut: (1) menghindari menulis pernyataan yang membicarakan kejadian yang telah lewat kecuali kalau objek sikapnya berkaitan dengam masa lalu, (2) menghindari menulis pernyataan yang berupa fakta atau dapat ditafsirkan sebagai fakta, (3) menghindari menulis pernyataan yang dapat menimbulkan lebih dari satu penafsiran, (4) menghindari menulis pernyataan yang tidak relevan dengan objek psikologisnya, (5) menghindari menulis pernyataan yang sangat besar kemungkinannya akan disetujui oleh hampir semua orang atau hampir tak seorangpun yang akan menyetujuinya, (6) memilih pernyataan-pernyataan yang diperkirakan akan mencakup keseluruhan liputan skala afektif yang diinginkan, (7) mengusahakan agar setiap pernyataan ditulis dalam bahasa yang sederhana, jelas, dan langsung, (8) pernyataan sebaiknya pendek, tidak melebihi dari 20 kata, (9) setiap pernyataan harus berisi hanya satu ide yang lengkap, (10) pernyataan yang berisi unsur universal seperti “tidak pernah, “semuanya”, “selalu”,”tak seorangpun, dan tak pernah, seringkali menimbulkan penafsiran yang berbeda-beda, karenanya sedapat mungkin dihindari, (11) kata-kata seperti “hanya”, “sekedar”, “semata-mata” dan sejenisnya harus digunakan seperlunya saja, (12) jika memungkinkan, pernyataan sebaiknya menggunakan bentuk kalimat sederhana, bukan kalimat umum dan 372 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



komplek, (13) menghindari kata atau istilah yang berkemungkinan tidak dimengerti oleh para responden, (14) menghindari pernyataan yang berisi kata negatif ganda.



373 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



374 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



BAB 17 CONTOH PENGEMBANGAN INSTRUMEN: KINERJA GURU A.Instrumen Kinerja Guru Misakan kita ingin mengembangkan instrumen untuk mengukur kinerja guru, jadi variable disini adalah kinerja guru. Berdasarkan teori pengembangan pada BAB 16 di atas, maka langkah pertama adalah membaca sejumlah literatur untuk mengetahui apa itu kinerja guru, dan apa indicator-indikatornya. 1. Mencari pengertian kinerja guru dan indikatornya. Misalkan Rowland (1960) mengemukakan bahwa kinerja merupakan terjemahan dari kata performance yang berarti tindakan untuk melakukan suatu pekerjaan. 375 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Whitmore (1997) mengemukakan pengertian kinerja sebagai suatu perbuatan, suatu prestasi atau apa yang diperlihatkan seseorang melalui keterampilannya yang nyata. Dan Lase (2003) mengemukakan definisi konseptual kinerja sebagai penilaian seseorang tentang potensi dan tingkat pemenuhan kerja yang terdiri dari perbuatan, prestasi, keterampilan di depan umum, kompetensi, dan juga tuntutan mengemban tanggungjawab. Pandangan lain seperti yang dikemukakan King (1984) menyatakan bahwa kinerja adalah aktivitas seseorang melaksanakan tugas pokok yang dibebankan kepadanya. Mengacu pada pandangan ini, dapat diinterpretasikan bahwa kinerja seseorang dihubungkan dengan tugas-tugas rutin yang dikerjakannya. Sebagai guru, misalnya tugas rutinnya adalah mengajar. Hasil yang dicapai secara optimal dari tugas tersebut merupakan kinerja guru. Shackelford dan Henak dalam Soekartawi (1995) memberikan sepuluh kriteria dalam upaya mendefinisikan ciri-ciri pengajar yang efektif, yaitu (a) mempunyai intusiastik, (b) mempunyai keterampilan berkomunikasi, (c) dapat menjelaskan persoalan atau topik secara jelas, (d) menguasai bahan ajar, (e) mampu membuat suasana kelas menjadi hidup, (f) fleksibel, (g) memberikan bahan ajar terorganisasi secara rapi sesuai dengan silabus, (h) adil dalam memberi nilai, (i) mau menerima umpan balik, dan (j) akrab dengan situasi kelas. Menurut Riyanto (2003) komponen-komponen mengajar adalah meliputi (1) tujuan, (2) bahan, (3) 376 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



metode, (4) guru, (5) siswa, (6) fasilitas, (7) interaksi, dan (8) evaluasi. Sumiyati (2005) mengemukakan bahwa kinerja guru adalah aktivitas guru dalam melaksanakan pembelajaran dan yang dapat diamati oleh siswa yang mencakup: (1) pengelolaan kelas, (2) kualitas personal, (3) hubungan guru siswa, (4) teknik mengajar, dan (5) perilaku. Selanjutnya masih terkait dengan proses belajar mengajar, Mcbeath (1992) mengemukakan bahwa dalam menyiapkan pembelajaran guru harus: (1) memilih materi, (2) mengorganisir materi, (3) memilih contoh-contoh dan sumber-sumber, (4) menyeleksi format penyajian, (5) membuat kondisi untuk kesuksesan pembelajaran, (6) melakukan evaluasi keefektifan pembelajaran, (7) membuat ringkasan, dan (8) memberikan tugas. Guru adalah sebuah jabatan yang mempunyai tugas pokok mendidik, mengajar dan melatih. Mendidik berarti meneruskan dan mengembangkan nilai-nilai hidup, mengajar berarti meneruskan dan mengembangkan pemahaman siswa terhadap ilmu pengetahuan dan teknologi, sedangkan melatih berarti mengembangkan keterampilan-keterampilan pada siswa. Kinerja guru adalah kemampuan guru untuk menampilkan atau mengerjakan tugas guru. Berdasarkan uraian dalam kajian pustaka di atas, maka dapat disimpulkan bahwa enam indikator kinerja guru di dalam kelas. Keenam indikator tersebut masing-masing yaitu: (1) Strategi Pembelajaran, (2) Penguasaan Materi, (3) Pengelolaan Kelas, (4) Komunikasi dengan Siswa, (5) Teknik Mengajar, dan (6) Penilaian Hasil Belajar Siswa.



377 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



2. Konstruk Instrumen Konstruk kinerja adalah variabel yang merupakan sintesis dari teori-teori kinerja yang telah dibahas di atas. Konstruk tersebut dijelaskan dalam definisi konseptual dan definisi operasional yang di dalamnya tercakup dimensi, dan indikator dari variabel kinerja guru yang hendak diukur. Definisi Konseptual kinerja guru Kinerja guru adalah capaian yang diperoleh guru dalam melaksanakan tugas profesinya sebagai pengajar yang meliputi antara lain: (1) Strategi Pembelajaran, (2) Penguasaan Materi, (3) Pengelolaan Kelas, (4) Komunikasi dengan Siswa, (5) Teknik Mengajar, dan (6) Penilaian Hasil Belajar Siswa. Definisi Operasional kinerja guru Kinerja ukuran satuan kinerja yang dinyatakan dalam skor yang diperoleh guru atas pelaksanaan tugas profesinya sebagai pengajar yang ditunjukkan melalui kegiatan antara lain (1) Strategi Pembelajaran, (2) Penguasaan Materi, (3) Pengelolaan Kelas, (4) Komunikasi dengan Siswa, (5) Teknik Mengajar, dan (6) Penilaian Hasil Belajar Siswa yang diukur berdasarkan penilaian oleh siswa . Pengembangan Dimensi dan Indikator a. Pengembangan Dimensi (kalau ada) Dari variabel kinerja guru yang diukur tercakup di dalamnya dimensi 378 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



(tidak ada) dan indikator-indikator. b. Pengembangan Indikator Adapun indikator yang dikembangkan adalah: (1) Strategi Pembelajaran, (2) Penguasaan Materi, (3) Pengelolaan Kelas, (4) Komunikasi dengan Siswa, (5) Teknik Mengajar, dan (6) Penilaian Hasil Belajar Siswa. Penetapan Instrumen Kita misalkan untuk mengembangkan instrument kinerja guru ini digunakan skala semantic diferensial Kisi-Kisi Instrumen Rancangan awal kisi-kisi dan penyebaran nomor butir instrumen penilaian kinerja guru adalah seperti terlihat pada Tabel 17. 1 berikut. Tabel 17.1 Kisi-Kisi Instrumen Penilaian Kinerja Guru Variabel Kinerja Guru



Indikator 1. Strategi Pembelajaran 2.Penguasaan Materi 3.Pengelolaan Kelas 4.Komunikasi Guru dengan Siswa



No.Butir 1, 2, 3, 4, 5, 6, 7,8, 9



Jlh.Butir 9



10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 30, 31, 32, 33, 34, 35,



9



379 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



11



6



Prof. Dr. Yusrizal, M.Pd



5.Teknik Mengajar 6.Penilaian hasil belajar siswa Jumlah



36, 37, 38, 39, 40, 41, 42 43, 44, 45, 46, 47



7 5 47



3. Penulisan Butir Butir instrumen dibuat untuk setiap indikator. Setiap indikator dikembangkan menjadi beberapa butir pernyataan. Dari enam indikator dikembangkan sebanyak 47 butir pernyataan, dengan rincian sebagai berikut. Untuk indikator strategi pembelajaran ada 9 butir, indikator penguasaan materi 9 butir, indikator pengelolaan kelas 11 butir, komunikasi dengan siswa 6 butir, teknik mengajar ada 7 butir, dan indikator penilaian hasil belajar siswa ada 5 butir. Adapun rincian butir-butir instrumen penilaian kinerja guru. Indikator: Strategi Pembelajaran 1. Guru mengaitkan materi pembelajaran dengan realita kehidupan 2. Guru memberikan aplikasi konsep pada perkembangan kehidupan 3. Dalam mengajar, guru mengaitkan hubungan materi yang satu dengan materi yang lainnya 4. Guru mengawali pelajaran dengan hal-hal yang menarik



380 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



5. Guru mengajukan pertanyaan kepada siswa pada waktu memulai kegiatan pembelajaran 6. Guru mengecek apakah siswa membawa buku pelajaran atau tidak pada waktu kegiatan pembelajaran 7. Guru mengulangi pertanyaan kepada siswa yang tidak dapat menjawab pertanyaan sebelumnya 8. Guru menggunakan metode pembelajaran yang bervariasi 9. Prosedur penilaian guru diberitahukan kepada semua siswa Indikator Penguasaan Materi 1. Guru menjelaskan pentingnya suatu topik bahasan pada awal mengajar 2. Guru menjelaskan pokok - pokok bahasan yang harus dipelajari siswa 3. Guru menjelaskan materi pelajaran dengan lancar 4. Materi yang disajikan guru dapat /mudah dipahami siswa 5. Guru dapat menjawab pertanyaan-pertanyaan siswa 6. Guru menjelaskan materi pelajaran secara berurutan 7. Guru mengulangi materi pelajaran yang kurang dipahami siswa 8. Di dalam menyajikan materi pelajaran guru memberikan contoh serta aplikasi yang memadai 9. Guru merangkum materi pelajaran sebelum kegiatan pembelajaran 381 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



berakhir Indikator Pengelolaan Kelas 1. Guru memiliki kesiapan dalam menyajikan materi pelajaran 2. Guru terbuka terhadap pendapat siswa yang bersumber dari buku/sumber lain 3. Guru memberi respon terhadap pertanyaan siswa 4. Guru memperhatikan tanggapansiswa terhadap materi yang disampaikan dalam pembelajaran 5. Guru memberi perhatian secara merata kepada semua siswa 6. Guru tanggap terhadap masalah yang dihadapi oleh siswa pada saat berlangsung proses belajar mengajar 7. Guru mengakhiri pembelajarannya sesuai dengan waktu yang telah ditentukan 8. Guru bersikap ramah terhadap setiap siswa 9. Guru peduli terhadap siswa yang mengalami kesulitan pada waktu kegiatan pembelajaran berlangsung 10. Guru memperhatikan siswa pada waktu kegiatan pembelajaran berlangsung 11. Guru menghargai gagasan siswa yang berkaitan dengan usulan untuk menyelesaikan tugas-tugas



382 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Indikator Komunikasi Guru dengan Siswa 1. Guru memperkuat penyajian materi dengan memberikan tugas-tugas kepada siswa 2. Guru mengecek siswa apakah telah mengerjakan tugas-tugas atau belum 3. Guru memberikan soal-soal PR/kuis sesuai dengan materi pembelajaran yang disajikan 4. Guru mau menjawab pertanyaan - pertanyaan siswa di luar jam mengajar 5. Guru memberikan balikan kepada siswa dengan menyerahkan kembali hasil pemeriksaan jawaban siswa 6. Guru memuji siswa yang dapat menjawab pertanyaan dengan benar Indikator Teknik Mengajar 1. Guru memberikan waktu yang cukup kepada siswa untuk menjawab pertanyaan yang diajukannya. 2. Guru memberikan contoh yang cukup untuk menanamkan pengertian dalam penjelasannya 3. Guru memberi catatan mengenai hal-hal yang penting di papan tulis 4. Guru mengelompokkan siswa ke dalam kelompok belajar untuk mendiskusikan materi pelajarannya 5. Guru menggunakan metode diskusi pada pokok bahasan yang menghendaki pemahaman yang lebih mendalam.



383 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



6. Guru mendorong siswa untuk menyatakan hal -hal yang tidak jelas dari penyajian materi ajarnya 7. Guru mendorong siswa untuk berperan aktif selama proses belajar mengajar Indikator Penilaian Hasil Belajar Siswa 1. Guru mengumumkan hasil pekerjaan terbaik ketika melakukan penilaian terhadap kegiatan kerja kelompok 2. Guru memberitahukan hasil PR/ kuis/ tugas-tugas siswa 3. Bentuk soal ujian yang dibuat guru hanya satu macam saja 4. Selainujian melalui tes tertulis, guru juga memberi ujian secara lisan 5. Guru memberi nilai kepada siswa hanya berdasarkan hasil ujian saja 4. Uji coba pakar Setelah draft instrumen selesai dibuat, dilakukan uji kesesuaian konstruk secara teoritik. Uji ini dilakukan dengan menanyakan kesesuaian antara butir-butir pernyataan dengan indikator kinerja guru. Untuk kegiatan penilaian ini diminta pada pakar-pakar evaluasi. Beberapa komentar/masukan pakar yaitu: (a) butir 13: materi yang disajikan guru dapat dipahami siswa, butir ini perlu dibuat lebih jelas, (b) butir 15: sistematis itu hanya bisa dijustifikasi oleh orang yang paham, kata sistematis diganti saja dengan berurutan. Selanjutnya draf instrumen direvisi 384 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



berdasarkan masukan-masukan dari pakar tersebut, kemudian diperbanyak guna dilakukan ujicoba lapangan. 5. Uji coba lapangan Pada pelaksanaan uji coba lapangan (empiris) instrumen yang digunakan adalah instrumen yang telah direvisi berdasarkan masukan pakar yang terdiri atas 47 butir pernyataan. Menurut Gabel (1986) jumlah reponden uji coba instrumen non kognitif adalah: 5, 6, 7, 8, 9 , 10 kali jumlah butir soal. Karenanya Instrumen ini diujicobakan kepada 300-an siswa . ` Untuk ujicoba lapangan ini, maka instrumen sudah dalam format yang lengkap dengan skalanya. Karena yang digunakan adalah skala semantic dferensial, maka bentuk instrumen ujicoba adalah seperti berikut N o



1



2



3



Pernyataan Strategi Pembelajaran Guru mengaitkan materi pembelajaran dengan realita kehidupan Guru memberikan aplikasi konsep pada perkembangan kehidupan Dalam mengajar, guru mengaitkan hubungan materi



1 2 3 4 5 6 7



Tidak Pernah



Sela lu



Tidak Pernah



Sela lu



Tidak Pernah



Sela lu



385 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



yang satu dengan materi yang lainnya Guru mengawali pelajaran dengan 4 hal-hal yang menarik Guru mengajukan pertanyaan kepada siswa 5 pada waktu memulai kegiatan pembelajaran Guru mengecek apakah siswa membawa buku 6 pelajaran atau tidak pada waktu kegiatan pembelajaran dan seterusnya Guru mendorong siswa untuk 42 berperan aktif selama proses belajar mengajar Penilaian Hasil Belajar Siswa Guru mengumumkan hasil pekerjaan 43 terbaik ketika melakukan penilaian terhadap kegiatan kerja



Tidak Pernah



Sela lu



Tidak Pernah



Sela lu



Tidak Pernah



Sela lu



Tidak Perna h



Sela lu



Tidak Perna h



Sela lu



386 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



kelompok



44



45



46



47



Guru memberitahukan hasil PR/ kuis/ tugas-tugas siswa Bentuk soal ujian yang dibuat guru hanya satu macam saja Selain ujian melalui tes tertulis, guru juga memberi ujian secara lisan Guru memberi nilai kepada siswa hanya berdasarkan hasil ujian saja



Tidak Perna h



Sela lu



Tidak Perna h



Sela lu



Tidak Perna h



Sela lu



Tidak Perna h



Sela lu



B. Analisis Hasil Ujicoba Ada dua cara yang dilakukan untuk menguji validitas konstruk instrumen afektif (non kognitif) yaitu (1) korelasi butir dengan totalnya menggunakan rumus korelasi product moment, dan (2) menggunakan teknik analisis faktor dengan bantuan program SPSS. Pengujian validitas konstruk instrumen kinerja guru ini menggunakan teknik análisis faktor.



387 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Analisis faktor adalah kajian tentang kesalingtergantungan antara variabel-variabel, dengan tujuan untuk menemukan himpunan variabel-variabel baru, yang lebih sedikit jumlahnya dari pada variabel semula, dan menunjukkan yang mana di antara variabel-variabel semula itu yang merupakan faktor-faktor persekutuan (Suyanto, 1988). Adapun langkah-langkah dalam analisis faktor menurut De Vaus (Hidayati dan Listyani, 2010:89) adalah (1) memilih variabel yang akan dianalisis, (2) ekstraksi awal seperangkat faktor, (3) ekstraksi akhir seperangkat faktor dengan rotasi, dan (4) menyusun skala untuk digunakan analisis lanjut. Menurut Gorsuch (1995:82) tujuan penggunaan analisis faktor yaitu meringkas saling hubungan antar variabel–variabel yang ada, tetapi dengan arti yang tepat, sebagai suatu penolong dalam membuat sejumlah pengertian. Metode tersebut dilakukan dengan bantuan komputer untuk menilai apakah butir-butir yang beragam dalam suatu survei memiliki kebersamaan dalam suatu faktor atau skala (Litwin, 1995). Untuk mengembangkan suatu tes yang sifatnya psikologis, maka analisis faktor sangat relevan untuk menguji kesahihan konstruk. Teknik ini dilakukan dengan cara menganalisis butir-butir instrumen yang terdapat dalam sejumlah faktor tertentu. Butir-butir yang memiliki unsur kebersamaan (common factor) digabung menjadi suatu faktor baru. Sebagai uji persyaratan untuk menentukan ukuran kecukupan sampel digunakan rumus Kaiser-Meyer-Olkin (KMO), yang merupakan suatu indeks untuk membandingkan nilai koefisien korelasi observasi dengan nilai koefisien korelasi parsial (Norusis, 1993). Ukuran KMO menyatakan sesuai tidaknya digunakan analisis faktor terhadap ubahan-ubahan (butir-butir instrumen). Menurut Kaiser (1974) dalam Jae-On 388 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Kim dan Charles W. Mueller (1978:54) jika nilai KMO 0,90 termasuk kategori sempurna, 0,80 termasuk baik, 0,70 termasuk sedang, 0,60 termasuk cukup, 0,50 termasuk kurang, dan di bawah 0,50 tidak dapat diterima. Jadi untuk dapat melakukan analisis faktor, persyaratan pokok yang harus dipenuhi ialah angka KMO Measure of Sampling Adequacy harus di atas 0,50. Untuk menguji apakah matrik korelasi berasal dari matrik identitas atau bukan digunakan Bartlett test of spherity (



 2 ) . Suatu ketentuan bahwa bila matrik korelasi merupakan matrik identitas (matrik berdiagonal 1, sedang yang lainnya 0) maka tidak dapat digunakan analisis faktor, demikian sebaliknya bila matrik korelasi bukan matrik identitas maka dapat digunakan analisis faktor. Sarwono (2006) mengemukakan jika probabilitas (sig) < 0,05 maka variabel dapat dianalisis lebih lanjut, dan jika probabilitas (sig) > 0,05 maka variabel tidak dapat dianalisis lebih lanjut. Banyaknya faktor ditetapkan berdasarkan aturan yang dikemukakan oleh Jae-On Kim dan Charles W. Mueller (1985:56) bahwa jumlah faktor diekstraksi harus sama dengan jumlah faktor yang mempunyai variansi (eigen value) sama atau lebih besar dari 1,0. Selanjutnya muatan faktor (factor loading) diseleksi setelah melalui ekstraksi komponen utama dengan rotasi orthogonal. Butir pernyataan yang akan dipertahankan bila pada rotasi muatan faktor di atas 0,30, sesuai dengan aturan bahwa muatan faktor yang lebih dari 0,30 cenderung signifikan, dan kurang dari 0,30 tidak dapat memberikan konstribusi yang signifikansi terhadap suatu faktor. Comrey (1973) yang dikutip Barbara dan Linda S. Fidell menjelaskan bahwa muatan faktor melebihi 0,71 dianggap istimewa, 0,63 sangat baik, 0,55 baik, 0,45 cukup, dan 0,32 kurang (Tabachnick and Linda S, 1989).



389 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Hasil pengujian validitas konstruk instrumen dengan menggunakan analisis faktor, didapatkan nilai KMO instrumen sebesar 0,908. Nilai ini lebih besar dari 0,50 berarti analisis faktor dapat dilanjutkan untuk menganalisis data dalam bentuk matriks korelasi (Santoso, 2003). Di samping itu nilai Bartlett’s test of Sphericity sebesar 7617,499 pada derajat kebebasan 948 dengan taraf signifikansi 0,000 < 0,05), dengan demikian matriks korelasi yang terbentuk bukan matriks identitas, jadi analisis faktor bisa dilanjutkan. Tabel 17.2. Hasil Analisis untuk KMO MSA KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity



Approx. Chi-Square



.908 7617.499



Df Sig.



.948 .000



Pada Tabel Total Variance Explained dari 47 butir yang dimasukkan dalam analisis faktor didapatkan nilai akar karakteristik (eigen value) di atas 1 (  1) ada sebanyak 7 faktor. Hasil rotated component matrix yang dilakukan 8 putaran atau iterasi, menunjukkan ada butir yang melewati muatan faktor “ cut off point” lebih kecil dari 0,30 (< 0,30). Dari jumlah butir 47 yang dianalisis ada 6 butir yang muatan faktornya lebih kecil dari 0,30 sehingga didrop. Butir-butir yang didrop yaitu butir-butir nomor: 2, 17, 19, 20, 22, dan 46, sehingga butir yang terpilih untuk instrumen tinggal 41 butir. Distribusi butir yang tinggal 390 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



hasil analisis yaitu Indikator Strategi Pembelajaran tinggal 8 butir, Penguasaan Materi tinggal 8 butir, Pengelolaan Kelas tinggal 8 butir, Komunikasi Guru dengan Siswa tinggal 6 butir, Teknik Mengajar tinggal 7 butir, dan Penilaian Hasil Belajar Siswa tinggal 4 butir. Butir yang terpilih untuk instrumen tinggal 41 butir. Distribusi butir hasil analisis yaitu: Tabel 17.3. Distribusi Butir Instrumen Kinerja Guru No 1 2 3



Komponen Kinerja Guru Strategi Pembelajaran Penguasaan Materi Pengelolaan Kelas



4



Komunikasi Guru dengan Siswa Teknik Mengajar 31, 32, 33, 34, 35, 36, 37, Penilaian Hasil Belajar 38, 39, 40, 41 Siswa



5 6



Nomor Butir 1, 2, 3, 4, 5, 6, 7, 8 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30,



Perhitungan reliabilitas terhadap 41 butir instrumen yang dilakukan dengan menggunakan bantuan program SPSS 391 versión 12.0 Windows diperoleh koefisien sebesar 0,944. Sebagaimana telah dikemukakan di atas bahwa koefisien reliabilitas 0,60 ke atas untuk instrumen dikategorikan baik. Dengan demikian dapat dinyatakan bahwa instrumen penilaian kinerja guru yang dikembangkan ini memiliki validitas konstruk yang baik dan mempunyai reliabilitas yang sangat tinggi. Adapun instrumen penilaian kinerja guru hasil analisis adalah seperti berikut.



391 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



No



1



2



3



4



5



6



7



Pernyataan Guru mengaitkan materi pembelajaran dengan realita kehidupan Dalam mengajar, guru mengaitkan hubungan materi yang satu dengan materi yang lainnya Guru mengawali pelajaran dengan hal-hal yang menarik Guru mengajukan pertanyaan kepada siswa pada waktu memulai kegiatan pembelajaran Guru mengecek apakah siswa membawa buku pelajaran atau tidak pada waktu kegiatan pembelajaran Guru mengulangi pertanyaan kepada siswa yang tidak dapat menjawab pertanyaan sebelumnya Guru menggunakan metode



1



2



3



4 5 6 7



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



392 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



8



9



10



11



12



13



14



15



16



pembelajaran yang bervariasi Prosedur penilaian guru diberitahukan kepada semua siswa Guru menjelaskan pentingnya suatu topik bahasan pada awal mengajar Guru menjelaskan pokok - pokok bahasan yang harus dipelajari siswa Guru menjelaskan materi pelajaran dengan lancar Materi yang disajikan guru dapat /mudah dipahami siswa Guru dapat menjawab pertanyaanpertanyaan siswa Guru menjelaskan materi pelajaran secara berurutan Guru mengulangi materi pelajaran yang kurang dipahami siswa Guru merangkum materi pelajaran sebelum kegiatan pembelajaran berakhir



Tidak Pernah



Selalu



Tidak Pernah



Tidak Pernah Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



393 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



17



18



19



20



21



22



23



24



Guru memberi respon terhadap pertanyaan siswa Guru memberi perhatian secara merata kepada semua siswa Guru tanggap terhadap masalah yang dihadapi oleh siswa pada saat berlangsung proses belajar mengajar Guru mengakhiri pembelajarannya sesuai dengan waktu yang telah ditentukan Guru bersikap ramah terhadap setiap siswa Guru peduli terhadap siswa yang mengalami kesulitan pada waktu kegiatan pembelajaran berlangsung Guru memperhatikan siswa pada waktu kegiatan pembelajaran berlangsung Guru menghargai gagasan siswa yang berkaitan dengan usulan untuk



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



394 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



menyelesaikan tugas-tugas



25



26



27



28



29



30



Guru memperkuat penyajian materi dengan memberikan tugas-tugas kepada siswa Guru mengecek siswa apakah telah mengerjakan tugas-tugas atau belum Guru memberikan soal-soal PR/kuis sesuai dengan materi pembelajaran yang disajikan Guru mau menjawab pertanyaan pertanyaan siswa di luar jam mengajar Guru memberikan balikan kepada siswa dengan menyerahkan kembali hasil pemeriksaan jawaban siswa Guru memuji siswa yang dapat menjawab pertanyaan dengan benar



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



395 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



31



32



33



34



35



36



Guru memberikan waktu yang cukup kepada siswa untuk menjawab pertanyaan yang diajukannya. Guru memberikan contoh yang cukup untuk menanamkan pengertian dalam penjelasannya Guru memberi catatan mengenai hal-hal yang penting di papan tulis Guru mengelompokkan siswa ke dalam kelompok belajar untuk mendiskusikan materi pelajarannya Guru menggunakan metode diskusi pada pokok bahasan yang menghendaki pemahaman yang lebih mendalam. Guru mendorong siswa untuk menyatakan hal hal yang tidak jelas dari penyajian materi ajarnya



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



396 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



37



38



39



40



41



Guru mendorong siswa untuk berperan aktif selama proses belajar mengajar Guru mengumumkan hasil pekerjaan terbaik ketika melakukan penilaian terhadap kegiatan kerja kelompok Guru memberitahukan hasil PR/ kuis/ tugas-tugas siswa Bentuk soal ujian yang dibuat guru hanya satu macam saja Guru memberi nilai kepada siswa hanya berdasarkan hasil ujian saja



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



Tidak Pernah



Selalu



397 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



398 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



DAFTAR PUSTAKA Aiken,



Lewis R. (1994). Psychological Testing an Assessment,(Eight Edition), Boston: Allyn and Bacon.



Alexander, P., Schallert, D., Hare, V. 1991. Coming to Terms: How Researcher in Learning and Literacy Talk about Knowledge. Review of Educational Research, 61: 315 – 343. Allen, M.J. & Yen, W.M. (1979). Introduction to measurement theory. Monterey, CA: Brooks/Cole Publishing Company. Anastasi. Anne and Urbina, Susana. (1997). Psicoholological Testing. (Seventh Edition). New Jersey: PrenticeHall, Inc.



399 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Anderson, Scarvia.B, at.all (1981), Encyclopedia Of Education Evaluation, San Francisco: Jossey-Bass, Inc Publishers. Anderson, L.W and D.R. Krathwohl (Eds). (2001). A Taxonomy for Learning Teaching and Assessing. Airasian, P. W. (1994). Classroom assessment. New York: McGraw-Hill. Arifin, Zaenal. (2009). Evaluasi Pembelajaran,. Bandung: PT remaja Rosdakarya. Asaad, Abubakas,S and Hailaya, Wilham, M (2004). Measurement And Evaluation, Manila: Rex Nbook Store. Azwar, Syaifuddin (2010). Tes Prestasi: Fungsi dan Pengembangan Pengukuran Prestasi Belajar, edisi II, cetakan ke 4 :Pustaka Pelajar. Azwar, Syaifuddin (2012). Reliabilitas dan Yogyakarta: Pustaka Pelajar.



Validitas,



Bahri, Djamarah, Saiful (2008). Psikologi Belajar. Jakarta : PT Rineka Cipta. Basuki, Ismet dan Hariyanto (2014). Asesmen Pembelajaran, Bandung: PT Remaja Rosdakarya. Berk, R.A. (1986). Performance assessment. London: The Johns Hopkins Press Ltd.



400 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Bloom, B.S., (Ed.). (1956). Taxonomy of educational objectives: The classification of educational goals: Handbook I, cognitive domain. New York: Longman. Bodgard & Seaborne, 2001. Perfect Empowerment (Edisi terjemahan) Jakarta : Gramedia Brennan, Robert L (2006). Educational Measurement. Fourth Editon. Road West, Westport CT: Praeger Publishers. Butler and McMunn (2006). A Teacher’s Guide to ClassroomAssessment, San Francisco:Jossey Bass Brown, Frederick G (1981). Measuring Classroom Achievement, New York: Holt, Rinehart and Winston. Brown, Frederick G (1976). Principles of Educational and Psychological Testing, New York: Holt, Rinehart and Winston. Brown, Douglas H. (2004). Language Assessment Principles and Classroom Practices. New York: Longman. Brown. W. and Thornton. J.W. Jr (1971). College teaching: A s~\lenirrlic approach (2nd 4.). New York: McGrawHill. Bryman, Alan (2001). Social Research Methods. New York: Oxford University Press Inc. Cangelosi James S.(1995). Merancang Tes Untuk Menilai Prestasi Siswa. Bandung: Institut Teknologi Bandung. 401 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Cohen, R. J., & Swerdlik, M. (Eds.). (2009). Psychological testing and assessment: An introduction to tests and measurement (7th ed.). Washington DC: McGrawHill. Crocker, L. & Algina, J. (1986). Introduction to Classical and Modern Test Theory_. New York: Holt, Rinehart and Winston, Inc. Cronbach, L.I (1990), Essentials of psychological testing, New York: Harper Collins. Cronbach, L., J., and others. (1980). Toward reform of program evaluation: aims, methods, and institutional arrangements. San Fransisco: Jossey-Bass. Dave, R.H. (1967). Taxonomy of educational objectives and achievement testing. London: University of London Press. Deblassie, Richard .R (1974). Measuring And Evaluating Pupil Progress, New York: MSS Information Corporation. Depdiknas (2008). Pandiuan Penulisdan Butir Soal, Jakarta: Dirjen Manajemen Pendidikan Dasar dan Menengah. Depdiknas (2008). Panduan Analisis Butir Soal, Jakarta: Direktorat Pembinaan SMA. Depdiknas (2007). Panduan Penulisan Soal Pilihan Ganda, Jakarta: Pusat Penilaian Pendidikan. 402 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Desmita.(2006).Psikologi Perkembangan. Bandung : PT. Remaja Rosdakarya. Ditjen Dikti. (2005). Pedoman sistem asesmen berbasis kompetensi. Jakarta : Depdiknas. Dizney, Henry (1971). Classroom Evaluation for Teachers, Dubuque, Iowa: Wm. C. Brown Company Publisher. Djaali & Mulyono, Pudji (2007). Pengukuran dalam Bidang Pendidikan, Jakarta: Grasindo. Djamarah (1994). Prestasi Belajar dan Kompetensi Guru. Surabaya : Usaha Nasional. Ebel, Robert L. & David A. Frisbie (1991) Essential Of Educational Measurement (5th Edition). New Delhi: Prentice‐Hall, Inc. Echols, John M dan Shadily, Hassan (1989). Kamus Inggris Indonesia, Jakarta: PT Gramedia. Edwards, Allen L (1957). Techniques of Attitude Scale Construction. New York: Appleton-Century-Croffs, Inc. Erickson, Richard. C & Tim L.Wentling (1976). Measuring Student Growth, Boston : Allyn and Bacon, Inc. Fernandes,H.J.X (1984). Testing And Measurement, Jakarta: National Education Planning, Evaluation and Curriculum Development.



403 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Gabel, D.L. (1993). Handbook of Research on Science Teaching and Learning.New York: Maccmillan Company. Gable, Robert K (1986). Instrumen Development in Affective Domain. Boston: Kluwer-Nijhoff Publishing. Gay, L.R. (1976). Educational research: Competencies for analysis and application. Columbus, OH: Bell & Howell Company. Gerst. Glass, Gene V. and Stanley, Julian C. (1970). Statistical Methods in Education and Psychology. New Jersey: Prentice Hall, Inc. Gorsuch, Richard L (1983). Factor Analysis. Lawrence Erlbaum Associates Publisher.



Hillsdale:



Griffin, P. & Nix, P. (1991). Educational Assessment and Reporting. Sydney: Harcout Brace Javanovich, Publisher. Gronlund, N.E. (1982). Constructing Achievement Test, 3rd edition. Eaglewood Cliffs, N.J: prentice–Hall inc. Gronlund, Norman E. and Linn, Robert L. (1995). Measurement and Assessment in teaching (Seventh Edition). Ohio: Merrill, an immprint of Prentice Hall. Gronlund, N.E. (1976). Measurement and evaluation in teaching. New York: Macmillan Publishing Company. Gronlund, N.E & R.L Linn (1990). Measurement and Evaluation in Teaching. 6th. Ed. New York: MacMillan Publishing Company. 404 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Guilford, J. P. (1954). Pychometric Methods. New Delhi: Tata Mc-Graw Hill Publishing Co.Ltd. Haladyna, Thomas M. (1994). Developing and MultipleChoice Test Items. New Jersey: Lawrence Erlbaum Associates, Publishers. Hamalik, Omar (1983). Strategi Belajar dan Pembelajaran, Jakarta ; Sinar Utama Habeyb. (1983). Supervisi Pendidikan, Jakarta: P2LPTK Harrow, A. J. (1972). A taxonomy of the psychomotor domain: A guided fordeveloping behavioral objective. New York: David Mc Key Company. Heer, R. 2012. A Model of Learning Objectives (Online). (www.celt.iastate.edu/teaching/RevisedBlooms1.html,) Heaton, J.B. (1988). Writing English Language Tests. 2nd Edition, 21. New York: Longman Inc. Herman, J. L. (1997). Large-scale assessment in support of school reform: Lessons learned in the search for alternative measures. International Journal of Educational Research, 27, 395-413. Hopkins, Kenneth D. and Julian C. Stanley. (1981). Educational and Psychological Measurement and Evaluation. Englewood Cliffs, NJ: Prentice-Hall, Inc.



405 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Hopkins, Charles D. dan Richard L. Antes (1989). Classroom Testing Construction. Illinois: F. E. Peacock. Jae-On Kim and Charles W. Muller (1978). Factor Analysis: Statistical Methods and Practical Issues. London: Sage Publication. Jihat, Asep dan Haris, Abdul (2008). Evaluasi Pembelajaran, Yogyakarta: Multi Pressindo Joesmani (1988). Pengukuran dan Evaluasi Dalam Pengajaran, Jakarta: Departemen Pendidikan dan Kebudayaan. Kapplan, Robert M & Saccuzzo, Dennis P (2001). Psychological Testing (5th ed). Singapore: Wordworth Thomson Learning. Kartowagiran, Badrun (2009). Makalah disampaikan pada Pelatihan penulisan analisis butir dengan pendekatan TTK dan TRB tanggal 11 – 12 April 2009 di Lemlit UNY. Kemdikbud (2010). Panduan Pengembangan Penulisan Soal, Jakarta: Direktorat Ketenagaan Dirjen Pendidikan Tinggi. Kerlinger, Fred N (2003). Azas-Azas.Penelitian Behavioral. Yogyakarta: Gajah Mada Press. King, Patricia (1984). Performance Planning & Appraisal. New York: Mc Graw Hill Book Company.



406 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Koyan, I Wayan (2012). Konstruksi Tes, Singaraja: Universitas Pendidikan Ganesha Press. Krathwohl, D. R. (2002). A Revision of Bloom’s Taxonomy: An Review. Theory Into Practice. Volume 41, Number 4. College Education. The Ohio State University. . Krathwohl, D. R. et.all (1964).Taxanomy of Educational Objectives, Handbook II; Affective Domain, New York; McKay. Kumano, Y (2001). Authentic Assessment and Portfolio Assessment-Its Theory and Practice, Japan: Shizuoka University Lase,



Jason.(2003).Motivasi Berprestasi, Kecerdasan Emosional, Percaya Diri dan Kinerja. Jakarta: PPs FKIP UKI.



Lewy, Zulkardi, Aisyah (2009). Pengembangan Soal Untuk Mengukur Kemampuan Berpikir Tingkat Tinggi Pokok Bahasan Barisan dan Deret Bilangan di Kelas IX Akselerasi SMP Xaverius Maria Palembang, Jurnal Pendidikan Matematika, Vol. 3.No.2, Desember 2009 Litwin, Mark S (1995). How To Measure Survey Reliability and Validity. London: Sage Publications. Lord, F.M. and Novick, M.R. (1974). Statistical Theories of Mental Test Scores. Reading, MA: Addison-Wesley. Mar’at, (1984). Sikap Manusia :Perubahan Pengukurannya. Jakarta: Ghalia Indonesia. 407 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Serta



Prof. Dr. Yusrizal, M.Pd



Mardapi, Djemari (2004). Penyusunan tes hasil belajar. Yogyakarta: Program Pascasarjana Universitas Negeri Yogyakarta. Mardapi, Djemari (2008). Teknik Penyusunan Instrumen Tes dan Nontes, Jogyakarta: Mitra Cendekia Press. Maskul (1998). Pembelajaran Remaja, Jakarta ; Raja Grafindo Persada. McBeath, Ron J (1992). Instructing And Evaluating In Higher Education. New Jersey: Educational Technology Publications Englewood Cliffs, Mehrens, W. A. & Lehmann, I. J. (1984). Measurement and evaluation in education and psychology, Third edition. New York: Holt, Rinehart and Winston. Messick, S. (1989). “Validity” dalam Linn, R. L. (Eds.), Educational measurement third edition. (pp. 13103). New York: McMillan. Miller, M.David, Robert l.Linn and Norman E. Gronlund (2009). Measurement and Assessment in Teaching, New Jersey: Pearson Education International. Morris, L.L. & Fitz Gibbon. C. T. (1978). How to Measure Achievement. Los Angeles, CA: Sage Publication. Mouly, George J. (1967), Training of Research Center Personnel, U. S. Department of Health,



408 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Education,and Welfare, Final Report Project No. 62562 , Office of Education Bureau of Research Mueller, John. (2008). Authentic Assessment Toolbox. North Central Collegehttp://www.noctrl.edu/, Mueller, D. J. (1986). Measuring social attitudes. New York: Teachers College,Columbia University. Muhamad (1999). Bimbingan Belajar di Perguruan Tinggi, Jakarta; Depdikbud. Muhson, Ali, dkk (2012). Analisis Butir Soal dengan Anbuso, Makalah yang disampaikan pada Pelatihan Analisis Butir Soal dan Program Remidial dengan Software AnBuso ,di FE UNY pada tanggal 12‐13 Juli 2012. Nawawi. (2001). Dasar – Dasar Perencanaan Pengajaran. Jakarta Raja Grafindo Persada. Nasoetion, Noehi (2006). Tes, Pengukuran dan Evaluasi, Jakarta:Universitas Terbuka Nazir, M. (1983). Metode Penelitian. Penerbit Ghalia Indonesia. Nelson, Clarence.H (1970). Measurement and Evaluation in the Classroom, London: The Macillan Company. Nitko, Anthony J. (1996). Educational Assessment of Students, Second Edition. Ohio: Merrill an imprint of Prentice Hall Englewood Cliffs.



409 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Nitko, Anthony J,. & Brookhart, Susan M. (2007). Educational assessment of Student. Pearson Education Inc., Upper Saddle River, New Jersey. Nitko, Anthony J.(1996). Educational Assessment of Students. Englewood Cliffs,New Jersey: PrenticeHall, Inc. Norusis, Marija J (1993). SPSS for Windows Professional Statistics Release 6,0 , Chicago: Marketing Department SPSS Inc. Nurkancana, Wayan & Sumartana (1990). Evaluasi Hasil Belajar, Surabaya: Usaha Nasional. Paulson, F.Leon, Parsl R & Meyer, Carol A. (1991).What makes a portofolio? Eight thoughtful guidelines will help educator encourage self-directed lerning. Educatonal Leardership, February 1991 Pedhazur, Elazar J and Liora Pedhazur Schmelkin (1991). Measurement, Design and Analysis: An Integrated Approach. New Jersey: Lawrence Erlbaum Associates Publishers, 1991. Pohl . (2000). Learning to Think, Thinking to Learn: tersedia di www.purdue.edu/geri Popham,W James (1995). Classroom Assessment: What Teacher Need to Know. Boston: Allyn and Bacon. Purwanto (2009), Evaluasi Hasil Belajar, yogyakarta: PustakaPelajar.



410 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Purwanto, Ngalim (1992), Evaluasi Pengajaran, Jakarta Rineka Cipta. Reynolds, Cecil.R, at.all (2009). Measurement and Assessment in Education, New Jersey: Upper Saddle River. Retnawati, Heri (2015). Validitas, Reliabilitas & Karakteristik Butir, Yogyakarta: Parama Publishing Riyanto, Astin (2003). Proses Belajar Mengajar Efektif di Perguruan Tinggi. Bandung: Yapemdo. Rolheiser, C. & Ross, J. A. (2005). Student Self-Evaluation: What Research Says and What Practice Shows. Internet download. Rowland, Virgil K (1960). Managerial Standards. New York: Craffsmen,Inc.



Performance



Sax, Gilbert. (1980). Principles of Educational and Psychological Measurement and Evaluation. nd



(2 ed.). California : Wadsworth Publishing Company. Salvia, J. & Ysseldyke, J.E. (1996). Assessment. 6th Edition. Boston:Houghton Mifflin Company. Setiadi, Hari (2008). Penilaian Kinerja, Jakarta: Pusat Penilaian Pendidikan, Departemen Pendidikan Nasional. Silverius, Suke (1991). Evaluasi Hasil Belajar dan Umpan Balik, Jakarta: PT.Grasindo.



411 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Singer,R.N (1972). The psychomotor domain: Movement behavior. London: Henry Kimton Publisher. Simpson, E.J (1972). The Classification of Educational Objectives, Psychomotor Domain, Ilinois: Teacher of Home Economic. Singh, Arun Kumar. (1986). Tests, Measurement and Research Methods in Behavioral Sciences. New Delhi: Tata McGraw Hill. Skinner, Charles E. (ed.) (t.t), Essentials of Educational Psichology, (Englewood Cliffs :Prentice-Hall, Inc.Stalnaker, J. M. (1951). The Essay Type of Examination. In E. F. Lindquist (Ed.), Educational Measurement (pp. 495-530). Menasha, Wisconsin: George Banta. Streiner DL, Norman GR (2000). Health measurement scales: A practical guide to their development and use. Oxford: Oxford University Press. Sudjana (2005). Dasar-Dasar dalam Proses Belajar Mengajar. Bandung: Sinar Baru Algesindo. Sudjana, Nana (2009). Perencanaan Pengajaran. Jakarta. P2LPTK. Sudjana, Nana, (2004). Penilaian Hasil Proses Belajar Mengajar, Bandung:Remaja Rosdakarya. Soekartawi, dkk. (1995). Meningkatkan Rancangan Instruksional, Jakarta: PT Raja Grafindo Persada.



412 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Suyanto (1988). Metode Statistika Multivariat. Jakarta: Departemen Pendidikan dan Kebudayaan. Suryabrata, Sumadi. (2000). Pengembangan Alat Ukur Psikologis. Yogyakarta: Penerbit Andi. Susetyo, Budi (2011). Menyusun Tes Hasil Belajar, Bandung: CV Cakra. Suyanto (1977). Metode Statistika Multivariat, Jakarta: Departemen Pendidikan dan kebudayaan. Sudijono (2006). Pengantar Evaluasi Pendidikan, Jakarta: PT Raja Grafindo Persada. Surapranata, Sumarna dan Muhammad Hatta (2006). Penilaian Portofolio: Implementasi Kurikulum 2004. Bandung: PT Remaja Rosdakarya. Surapranata, Sumarna. (2005). Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes. Bandung: PT Remaja Rosdakarya Offset. Stufflebeam, Daniel L., (l974). Evaluation models. Boston: Kluwer-nijhoff Publishing. Tabachnick, Barbara G and Linda S. Fidell (1989). Using Multivariate Statistics. California: Harper Collins Publishers.. Taufina. (2009). Authentic Assesment dalam Pembelajaran Bahasa Indonesia di Kelas Rendah SD. Pedagogi, IX(1) 113-120. Diperoleh 20 Juni, dari http://www.google.com/url?



413 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Thomas, G.H & Dawson, J.B. & (1972). Item analysis and examination statics. Birmingham: The Union of Educational Institutions. Thorndike, Robert M. (1997). Measurement and Evaluation in Pschology and Education, Sixth Edition. Ohio: Merrill, an imprint of Prentice Hall. Thorndike, Robert, L., & Hagen, Elizabeth. P. (1977). Measurement and Evaluation in Psychology and Education. New York: John Wiley & Sons. Tim Puspendik. (2008). Tes Tertulis. Puspendik Balitbang Depdiknas. Jakarta. Tola, Burhanuddin (2008). Penilaian Diri, Jakarta: Pusat Penilaian Pendidikan, Departemen Pendidikan Nasional. Tuckman, B. W (1975). Measuring Educational Outcomes Fundamentals of Testing. New York: Harcourt Brace Javanovich Inc. Wandt, Edwin and Brown, Gerald, W (1957). Essentials of Educational Evaluation, New York: Holt Rinehart and Winston. Wiersma, W and Jurs (1990). Educational Measurement And Testing, Boston: Allyn and Bacon. Widoyoko, S. Eko Putra (2014). Penilaian Hasil Pembelajaran di Sekolah, Yigyakarta: Pustaka Pelajar.



414 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Widoyoko, S. Eko Putra (2009). Evaluasi Program Pembelajaran: Panduan Praktis Bagi Pendidik dan Calon Didik, Yogyakarta: Pustaka Belajar. Wind, Edwind and Brown, Gerald W.(1975). Essential of Educational Evaluation, New York: Holt Rinehart and Winston Winkel, W.S.(1983). Psikologi Pendidikan dan Evaluasi Belajar, Jakarta : PT. Gramedia. Whitmore, John (1997). Coaching For Performace: Seni Mangarahkan Untuk Mendongkrak Kinerja. terjemahan Y. Dwi Helly Purnomo, Jakarta:Gramedia Pustaka Utama. Zainul, Asmawi dan Noehi Nasution (2005). Penilaian Hasil Belajar. Pusat Antar Universitas, Direktorat Jenderal Pendidikan Tinggi: Departemen Pendidikan Dan kebudayaan. Zakaria, Ramli (2006). Pedoman Penilaian Sikap. Jakarta: Puspendik Balitbang Depdiknas



415 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



416 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



TENTANG PENULIS



Prof. Dr. Yusrizal, M.Pd



Prof. Dr. Yusrizal, M.Pd dilahirkan di Pidie, Aceh pada 31 Desember 1952. Setelah lulus Sarjana Pendidikan Fisika dari FKIE-IKIP Yogyakarta pada 1981, langsung diangkat menjadi staf pengajar pada Jurusan Fisika FKIP Universitas Syiah Kuala, Darussalam-Banda Aceh. Gelar Magister Pendidikan (bidang Pendidikan Sains) diperolehnya dari PPs Universitas Negeri Surabaya (UNESA) pada tahun 2000. Gelar Doktor diperolehnya dari PPs Universitas Negeri Jakarta (UNJ) pada tahun 2008 dalam Bidang Penelitian dan Evaluasi Pendidikan. Pada thun 2011 diangkat menjadi Guru Besar bidang ilmu Evaluasi pendidikan Unsyiah. Selain mengajar mata kuliah Evaluasi pengajaran Fisika di FKIP Unsyiah, juga mengajar mata kuliah Tes dan Pengukuran pada Program Studi Pendidikan Keolahragaan, mengajar Language Testing and Evaluation pada Program Studi Pendidikan Bahasa Inggris, mengajar 417 | Pengukuran & Evaluasi Hasil Dan Proses Belajar



Prof. Dr. Yusrizal, M.Pd



Evaluasi Pendidikan di Program StudiProgram Studi: Pendidikan IPA, Pendidikan Matematika, Pendidikan Bahasa dan Sastra Indonesia serta di Program Studi Magister Administrasi Pendidikan PPs Unsyiah. Bercita-cita untuk dapat menerbitkan sejumlah buku mengenai Evaluasi Pendidikan / Pembelajaran, Buku Pengukuran & Evaluasi Proses dan Hasil Belajar ini merupakan buku kedua dari cita-citanya tersebut.



418 | Pengukuran & Evaluasi Hasil Dan Proses Belajar