Makalah Pengukuran, Penilaian, Dan Evaluasi Pembelajaran [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

PENGUKURAN, PENILAIAN, DAN EVALUASI DALAM PENGAJARAN BAHASA Makalah Diajukan dalam Rangka Memenuhi Tugas Mata Kuliah Metodologi Penelitian Dosen Pengampu: Prof. Dr. Zainal Rafli, M.Pd. dan Dr. Ninuk Lustyantie, M.Pd.



Disusun oleh



Marita Wijayanti Muhammad Jalalludin ‘Wiwik Wahyuni



PROGRAM STUDI PENDIDIKAN BAHASA PASCASARJANA UNIVERSITAS NEGERI JAKARTA JAKARTA, 2016 PENGUKURAN, PENILAIAN, DAN EVALUASI DALAM PENGAJARAN BAHASA



Marita Wijayanti Muhammad Jalalludin ‘Wiwik Wahyuni



Program Studi Pendidikan Bahasa Pascasarjana, Universitas Negeri Jakarta



A. PENDAHULUAN Dalam kegiatan sehari-hari kita selalu mengadakan pengukuran dan penilaian. Namun tidak semua orang menyadari kalau kita setiap saat melakukan pekerjaan evaluasi. Dari dua kalimat tersebut, kita menemukan tiga istilah yaitu: pengukuran, penilaian, dan evaluasi. Sementara orang memang lebih cenderung mengartikan ketiga kata tersebut sebagai suatu pengertian yang sama sehingga dalam memakainya hanya tergantung dari kata mana yang sedang siap untuk diucapkannya. Oleh karena itu, makalah ini lebih jauh akan membahas mengenai pengukuran, penilaian, dan evaluasi dalam pembelajaran. B. PEMBAHASAN 1. Pengukuran Pengukuran adalah penentuan besaran, dimensi, atau kapasitas, biasanya terhadap suatu standar atau satuan pengukuran. Pengukuran tidak hanya terbatas pada kuantitas fisik, tetapi juga dapat diperluas untuk mengukur hampir semua benda yang bisa dibayangkan, seperti tingkat ketidakpastian, atau kepercayaan konsumen. Menurut Lyle F. Bachman bahwa “ Measurement is the process of quantifying the characteristics of an object of interest according to explicit rules and procedures atau Pengukuran adalah proses mengukur karakteristik dari sebuah objek yang menarik sesuai dengan aturan dan prosedur yang eksplisit . Sebuah produk atau hasil dari proses ini juga disebut sebagai pengukuran atau ukuran. pengukuran adalah salah satu jenis penilaian yang melibatkan kuantifikasi atau menugaskan dari jumlah dan karakteristik ini. langkah-langkah disinguishes dari penilaian non-kuantitatif seperti deskripsi verbal atau gambar visual. Kami tidak menetapkan nomor orang atau kelompok, tetapi untuk atribut orang atau kelompok. Selanjutnya dalam pengujian bahasa, atribut kita umumnya ingin mengukur tidak fitur fisik langsung diamati seperti tinggi atau warna mata tetapi kemampuan yang tidak teramati atau atribut kadang-kadang dirujuk sebagai sifat-sifat seperti ilmu tata bahasa, keterkaitannya strategis atau 1



sikap bahasa. Seperti dengan jenis lain dari assesment, pengukuran harus dilakukan sesuai dengan aturan eksplisit dan procedure, seperti yang disediakan dalam spesifikasi tes, kriteria dan prosedur penilaian dan arah untuk administrasi tes. spesifikasi dan prosedur memberikan hubungan antara kemampuan teramati yang kita ukur dan nomor kami tetapkan untuk kinerja yang akan diamati. Dengan demikian, pengukuran dalam bidang pendidikan berarti mengukur atribut atau karakteristik peserta didik tertentu. Dalam hal ini yang diukur bukan peserta didik tersebut, akan tetapi karakteristik atau atributnya. Senada dengan pendapat tersebut, Secara lebih ringkas, Arikunto dan Jabar (2004) menyatakan pengertian pengukuran (measurement) sebagai kegiatan membandingkan suatu hal dengan satuan ukuran tertentu sehingga sifatnya menjadi kuantitatif a. Langkah-langkah dalam proses pengukuran Seperti ditunjukkan di atas, pengukuran adalah proses untuk menempatkan sejumlah atribut dari individu atau kelompok sesuai dengan aturan dan prosedur tertentu. Proses ini terdiri dari tiga langkah logis yaitu : (1) Menentukan gagasan konseptual, (2) dan (3) mendefinisikan konstruk operasional dan mengukur pengamatan (Bachman, 1990: 40-45). Tidak seperti atribut fisik seperti tinggi, warna mata dan ukuran sepatu, atribut biasanya kita ingin menilai sebagai gaya kognitif, akurasi pronounciation, pengetahuan tentang tata bahasa, atau jenis perencanaan, tidak dapat diamati secara langsung, dan untuk alasan ini kita perlu mendefinisikan dengan cara yang akan memungkinkan kita untuk menghubungkan pengamatan kami dari cara itu, seperti tanggapan tertulis yakni kuesioner, ucapan lisan, tulisan sampel dan waktu dalam tes, Langkah-langkah dalam pengukuran memberikan dasar untuk usia link ini atau untuk membuat kesimpulan tentang atribut observatioable atas dasar kinerja yang diamati. 1) Konstruk konseptual Meskipun cukup memadai, untuk tujuan gambaran umum atau diskusi untuk menggunakan istilah-istilah seperti kemampuan bahasa, pengetahuan tentang tata bahasa atau bacaan untuk describe atribut individu tanpa mengembangkan definisi yang tepat untuk tes, untuk tujuan mengukur atribut seperti ini , kita harus mendefinisikan mereka cukup tepat untuk membedakan mereka mondar-mandir lainnya, suatu atribut untuk memahami hubungan mereka dengan atribut lain yang sejenis. Jadi, jika kita ingin mengembangkan prosedur untuk mengukur atribut atau kemampuan, kita perlu membangun definisi precies ini, ini definisi berikut misalnya, mengidentifikasi pengetahuan organisasi 'sebagai komponen pengetahuan bahasa, sebagai lawan pengetahuan topikal atau Pengembangan 2



strategi keterkaitannya, sementara juga menunjukkan bahwa terdiri dari beberapa subkomponen: Pengetahuan organisasi adalah komponen taht pengetahuan bahasa yang terlibat dalam mengontrol struktur formal bahasa untuk memproduksi atau pemahaman ucapan tata bahasa yang diterima atau kalimat untuk mengatur ini untuk membentuk teks, baik lisan maupun tulisan. Ada dua bidang pengetahuan organisasi, pengetahuan grammaticall dan pengetahuan tekstual. Ketika kita mendefinisikan kemampuan dengan cara ini, menjadi konstruk tentang apa yang kita ingin membuat kesimpulan untuk situasi pengujian tertentu , maka atribut yang telah ditetapkan dengan cara tertentu untuk tujuan situasi pengukuran tertentu. (Bachman 1996) point bahwa membangun definisi umumnya didasarkan pada salah satu teori kemampuan bahasa atau profiency atau isi silabus pembelajaran 2) Konstruk operasional Langkah kedua dalam pengukuran adalah untuk menentukan prosedur dan kondisi di mana kita akan mengamati atau menimbulkan kinerja yang akan memungkinkan kita untuk membuat kesimpulan tentang konstruk kita yang ingin kita ukur, ini prosedur dan kondisi spesified dalam spesifikasi tes atau blueprint yang mencakup informasi rinci tentang jenis dan jumlah tugas tes untuk dimasukkan dan bagaimana ini akan memerintahkan dalam ujian, jumlah waktu yang diizinkan dan bagaimana tanggapan untuk tugas tes ini akan mencetak gol. Dalam menentukan prosedur ini, kita mendefinisikan untuk konstruk operasional dan prosedur pengukuran ini yang tugas tes dan bagaimana mereka menjadi kedua sehingga menjadi definisi konstruk operasional. 3) Mengukur pengamatan Langkah ketiga dalam pengukuran adalah untuk menentukan prosedur spesifik kita akan ikuti untuk quantify atau anggota assign pengamatan dari pertunjukan atau variabel, Ini adalah langkah yang membedakan pengukuran dari bentuk-bentuk ketetapan. Prosedur pengukuran tertentu yang kita gunakan akan tergantung pada sifat dari atribut kita ingin mengukur dan cara di mana kami telah memperoleh kinerja yang akan diukur. Ketika kita menggunakan prosedur elisitasi seperti tes, questinnaores atau wawancara untuk memperoleh kinerja pada dasarnya ada dua cara yang berbeda di mana kita dapat menetapkan nomor 1. hakim kualitas atau tingkat kinerja sesuai dengan skala penilaian dengan tingkat ditentukan atau 2. menghitung skor atau tanda untuk tugas individu atau item. a) Pengukuran skala



3



Ketika kita menggunakan pengukuran untuk menetapkan jumlah pengamatan, ini adalah variabel yang mewakili atribut inted untuk mengukur. Informasi nomor ini akan tergantung pada bagaimana kita mendefinisikan atribut sebagai konstruksi dan peraturan dan prosedur kami telah digunakan untuk mengukur. Dari contoh di atas jelaslah bahwa kita dapat menggunakan berbagai prosedur untuk mengukur pengamatan dan prosedur yang berbeda, pengukuran ini menghasilkan set angka atau skala pengukuran, yang berisi berbagai jenis dan jumlah informasi yang dapat mengidentifikasi merangkak skala pengukuran yang berbeda, nominal, ordinal, interval dan rasio, Karena ini skala yang berbeda memberikan peningkatan jumlah informasi dari skala nominal sampai dengan rasio skala mereka kadang-kadang disebut tingkat pengukuran. b) Pembatasan pengukuran Sama seperti itu penting untuk memahami proses maesurement dan sifat data yang dapat memberikan untuk analisis, juga penting untuk memahami keterbatasan pada proses itu, karena ini juga akan membatasi kesimpulan dan menggunakan kita membuat skor tes. Aku akan briefy menjelaskan enam pembatasan tersebut, ada underspesification, indirectness(ketidaklangsungan) ketidaklengkapan, ketidaktepatan, subjektivitas dan relativitas.







Underspecification



Berbagai macam faktor seperti pengetahuan topik, dampak, gaya kognitif dan kecemasan di samping kemampuan bahasa yang kita ingin ukur, dapat mempengaruhi kinerja tes bahasa. Kita tidak mungkin menjelaskan semua ini, baik dalam cara merancang prosedur pengukuran kami atau dalam cara kita menafsirkan hasil dari prosedur ini. 



Ketidaklangsungan



Tidak seperti atribut fisik seperti tinggi dan berat badan, atribut atau kemampuan yang umumnya kita ingin ukur tidak dapat diamati secara langsung, tetapi hanya dapat infered dari pengamatan kinerja. Karena ukuran kami adalah indikator necessarlly tidak langsung dari kemampuan kita ingin mengukur, validitas interpretasi dan penggunaan skor tergantung pada perawatan dan kekakuan dengan yang langkah-langkah dalam pengukuran telah diikuti dalam membangun hubungan yang jelas antara skor dan konstruk. 



Ketidaklengkapan



Pengamatan kinerja kami buat adalah tidak lengkap, dalam bahwa mereka tidak merupakan kinerja lengkap individu. Kinerja kita amati



4



prosedur pengukuran kami sehingga hanya menyediakan sampel total penggunaan bahasa apapun individu tertentu ini. 



Ketidaktelitian



Kemampuan kita untuk mengukur atribut yang menarik bagi kita dibatasi oleh ketepatan prosedur pengukuran. Ketepatan atau akurasi tindakan bergantung pada dua faktor, jumlah titik atau tingkatan dalam skala pengukuran dan komparabilitas poin skala ini. 



Subyektivitas



Hampir setiap aspek dari proses pengukuran yang dijelaskan di atas melibatkan keputusan subjektif dari pihak pengembang tes, pengambil tes dan usesrs tes. desain pengujian dan pengembangan keputusan seperti menentukan tujuan tes, konstruk yang akan diukur, merancang prosedur pengukuran dan memilih prosedur statistik yang sesuai untuk menganalisis skor tes semua dibuat secara subjektif oleh individu.







Relativeness



Tidak seperti tindakan atribut fisik seperti kekuatan genggaman dan denyut jantung, atribut kita ingin mengukur umumnya tidak dapat ditafsirkan atau dilaporkan dalam hal skala mutlak dan untuk alasan ini mereka hanya bisa ditafsirkan relatif terhadap beberapa kerangka acuan atau standar, di luar ukuran itu sendiri. 2. Pengaturan untuk Penilaian Bahasa Penilaian bahasa berlangsung dalam berbagai macam situasi, termasuk program-program pendidikan dan pengaturan dunia nyata. Dalam program pendidikan, hasil penilaian yang paling sering digunakan untuk menggambarkan proses dan hasil belajar selama mendiagnosis tujuan atau mengevaluasi prestasi, atau membuat keputusan yang akan meningkatkan kualitas pengajaran dan pembelajaran dari program itu sendiri. Dalam pengaturan dunia nyata, penilaian bahasa sering digunakan untuk menginformasikan keputusan tentang pekerjaan, sertifikasi profesional, dan kewarganegaraan. a. Konsep penilaian dan persyaratan 1) Penilaian Istilah 'Assessment' umumnya digunakan dengan berbagai pengertian yang berbeda. Memang, istilah tersebut telah sampai untuk digunakan secara luas dalam berbagai cara yang berbeda di bidang pengujian bahasa dan pengukuran pendidikan yang ada tampaknya tidak ada konsensus apa tepatnya



5



artinya. Selanjutnya, sejumlah istilah lainnya sering digunakan kurang lebih sinonim untuk merujuk penilaian. Dalam tujuan bukunya, Bachman mengungkapkan bahwa penilaian dapat dianggap secara luas sebagai proses pengumpulan informasi tentang objek tertentu yang menarik sesuai dengan prosedur yang sistematis dan subtantif mendasar. Sebuah produk, atau hasil dari proses ini, seperti skor tes atau deskripsi verbal, juga disebut sebagai penilaian. Objek yang menarik dalam penilaian bahasa yaitu paling sering beberapa aspek dari kemampuan bahasa. Dalam beberapa situasi mereka mungkin tertarik mengumpulkan informasi tentang kualitas individu lainnya seperti sikap mereka terhadap tes, atau karakter latar belakang mereka, seperti usia, bahasa ibu, atau tingkat pendidikan. Ada dua persyaratan yang membedakan penilaian dari pengamatan informal dan laporan; bahwa penilaian sistematis dan substantif mendasar. Dengan sistematis berarti penilaian dirancang dan dilaksanakan dengan cara yang jelas dideskripsikan dan berpotensi ditiru oleh orang lain. Artinya, penilaian dilakukan sesuai dengan prosedur yang eksplisit yang terbuka untuk pengawasan publik. Prosedur ini memberikan hubungan antara apa yang kita ingin menilai dan pengamatan kami. Jadi, meskipun saya mungkin bisa menjelaskan secara detail kualitas dari orang tertentu atas dasar pengamatan saya dan percakapan di sebuah pesta, ini tidak akan merupakan suatu penilaian. Hal ini karena saya mungkin tidak akan mampu untuk menggambarkan cara saya mengamati orang ini dan sifat percakapan kami dengan cukup presisi bagi saya untuk meniru dan datang dengan deskripsi yang sama, atau untuk orang lain untuk meniru pengamatan dan percakapan saya. Persyaratan sistematis ini adalah penilaian berhubungan erat dengan keandalan. Hal ini juga penting untuk penilaian bahasa yang akan secara substantif mendasar, karena memberikan dasar untuk menafsirkan hasil penilaian kami, apakah ini bersifat kuantitatif atau kualitatif. Dengan substantif yang mendasar berarti penilaian harus berdasarkan teori yang diterima secara luas tentang sifat kemampuan bahasa, penggunaan bahasa atau belajar bahasa, atau penelitian sebelumnya, atau diterima dan praktek saat ini di bidang tertentu. observasi informal dan laporan, seperti dalam contoh pihak di atas, umumnya gagal persyaratan substantif penilaian, karena kebanyakan orang, selain penguji bahasa, tidak terlibat dalam kegiatan tersebut dengan maksud untuk menilai kapasitas individu untuk digunakan bahasa. Artinya, pengamatan informal dan percakapan umumnya tidak diberitahu oleh teori eksplisit penggunaan bahasa atau silabus. Persyaratan ini substantif dalam penilaian terkait erat dengan kualitas validitas.



6



Penilaian dapat menarik informasi dari berbagai prosedur elisitasi, observasi dan pengumpulan data. Termasuk tes, tanggapan diperpanjang pilihan ganda, seperti esai dan portofolio, kuesioner, wawancara lisan, introspeksi dan observasi. Hasil penilaian dapat dilaporkan baik secara kuantitatif, angka, seperti nilai ujian, penilaian, atau peringkat, dan kualitatif, sebagai deskripsi verbal, atau sebagai gambar visual atau audio. Penggunaan penilaian bahasa Salah satu penggunaan penilaian adalah untuk membuat gangguan tentang kemampuan atau atribut seperti pengetahuan leksikal, kesadaran sosiolinguistik, bahasa pembekalan atau orientasi motivasional. Penilaian dapat memberikan informasi tentang atribut individu seperti keluarga mereka kekuatan dan kelemahan. prestasi mereka dalam kuliah bahasa, atau tingkat kemahiran mereka dalam bahasa. Deskripsi, kesimpulan, atau interpretasi kita membuat atas dasar penilaian memberikan masukan kepada keputusan kita mungkin perlu untuk membuat, baik tentang individu dan tentang program. Gambar 1.1 Hubungan antara penilaian, pengukuran, tes, dan menggunakan mereka untuk deskripsi dan evaluasi dalam pengaturan yang berbeda.



Dalam bukunya, Bachman menggunakan penilaian sebagai dasar untuk membuat keputusan. keputusan ini dapat tentang baik individu atau program, yang Bachman (1981) disebut sebagai 'evaluasi mikro' dan 'evaluasi makro', masing-masing. Bachman (1980) menjelaskan secara rinci berbagai jenis keputusan yang dibuat atas dasar penilaian dalam program pendidikan, dan ini dapat diringkas sebagai berikut: • Keputusan tentang individu, seperti:  Seleksi untuk masuk atau pekerjaan  Penempatan  Diagnosis



7



 Grading / menandai  Sertifikasi • Keputusan tentang program  formatif, yang berkaitan dengan membuat perubahan untuk meningkatkan program yang ada;  sumatif, yang berkaitan dengan membuat melanjutkan program yang ada atau menerapkan program baru. Pemilihan Keputusan Relatif dan Mutlak Keputusan yang kita buat atas dasar penilaian adalah dua jenis umum; relatif dan mutlak. Sebuah keputusan relatif adalah satu di mana kita dipilih atau hadiah dari pengambilan tes berdasarkan kedudukan relatif mereka dalam kelompok pada beberapa kemampuan atau atribut. keputusan relatif khas dari situasi di mana tempat atau sumber daya yang tersedia terbatas dan dapat dialokasikan untuk hanya sejumlah tetap individu. Dalam situasi seperti itu, pembuat keputusan umumnya ingin mengalokasikan tempat ini untuk individu yang merupakan tertinggi di antara kelompok yang dipertimbangkan. keputusan penerimaan perguruan tinggi, misalnya, biasanya relatif, karena merupakan sebagian besar kasus hanya sejumlah individu dapat diterima, dan mereka yang mengaku umumnya di atas kelompok yang berlaku. Contoh lain dari keputusan relatif akan 'gradasi pada kurva'. Di mana hanya lima persen di atas mengatakan, dari siswa di kelas terima, dan mempekerjakan orang terbaik untuk pekerjaan, dari kumpulan pelamar. Sebuah keputusan mutlak adalah satu di mana pilih atau hasil pengambil tes atas dasar tingkat pengetahuan mereka atau kemampuan, menurut beberapa kriteria yang telah ditentukan. keputusan mutlak yang khas dari situasi di mana tempat atau sumber daya yang tersedia terbatas dan dapat diberikan kepada jumlah yang tidak terbatas dari individu, yang memiliki pengetahuan atau tingkat kemampuan yang dibutuhkan. keputusan sertifikasi adalah keputusan mutlak, karena hanya orang-orang yang mencapai tingkat pra yang ditentukan tertentu kinerja pada pemeriksaan dapat dianggap memenuhi syarat di daerah tertentu. Contoh uji yang digunakan untuk keputusan sertifikasi termasuk daerah, ujian bar dalam mengemudi untuk pengacara dan pemeriksaan medis untuk dokter. Contoh lain dari keputusan mutlak akan pemberian kelas A untuk semua siswa yang menunjukkan penguasaan isi kursus, atau menyewa orang-orang yang memenuhi standar minimum tertentu, terlepas dari berapa banyak individu ini mungkin 2) Penilaian informal dan formal Penilaian informal dapat mengambil sejumlah bentuk, dimulai dengan insidental, komentar yang tidak direncanakan dan tanggapan, bersama dengan pembinaan dan umpan balik dadakan lainnya kepada siswa. Contohnya termasuk mengatakan "Nice Job!" Kerja bagus! Apakah Anda mengatakan bisa atau tidak bisa? "Saya pikir Anda bermaksud mengatakan Anda memecahkan



8



kaca, bukan memecahkan kaca," atau menempatkan pada beberapa pekerjaan rumah. Penilaian informal tidak Berhenti di sana. Sebuah kesepakatan yang baik dari guru penilaian informal tertanam dalam tugas-tugas kelas yang dirancang untuk memperoleh kinerja tanpa merekam hasil dan membuat penilaian tetap tentang kompetensi siswa. Contoh di akhir ini kontinum adalah komentar marjinal di atas kertas, menanggapi draft esai, saran tentang cara yang lebih baik mengucapkan kata, saran untuk strategi untuk mengkompensasi kesulitan membaca, dan menunjukkan bagaimana memodifikasi catatan siswa -mengambil untuk lebih mengingat coment dari kuliah. Di sisi lain, penilaian formal adalah latihan atau prosedur khusus dirancang untuk memasuki gudang keterampilan dan pengetahuan. Sistematis mereka, teknik sampling direncanakan dibangun untuk memberikan guru dan siswa penilaian dari prestasi siswa. Untuk memperpanjang analogi tenis, penilaian formal adalah game turnamen yang terjadi secara periodik dalam rangka rejimen latihan. Apakah penilaian formal sama dengan ujian? Kita dapat mengatakan bahwa semua tes penilaian formal, tetapi tidak semua penilaian formal pengujian. Misalnya, Anda mungkin menggunakan jurnal siswa atau portofolio sebagai bahan penilaian formal pencapaian tujuan program tertentu, tetapi bermasalah untuk memanggil dua prosedur "tes." Satu set sistematis pengamatan frekuensi siswa partisipasi lisan di kelas ini tentunya penilaian formal, tetapi juga hampir tidak apa yang orang sebut tes. tes biasanya relatif dibatasi-waktu (biasanya mencakup periode kelas atau paling beberapa jam) dan menarik pada sampel yang terbatas perilaku. 3) Penilaian formatif dan sumatif Perbedaan lain yang berguna untuk diingat adalah fungsi penilaian: Bagaimana prosedur yang harus digunakan? Dua fungsi biasanya diidentifikasi dalam literatur: penilaian formatif dan sumatif. Sebagian besar penilaian kelas adalah penilaian formatif: mengevaluasi siswa dalam proses "membentuk" kompetensi dan keterampilan mereka dengan tujuan membantu mereka untuk melanjutkan proses pertumbuhan. Kunci untuk pembentukan tersebut adalah pengiriman (oleh guru) dan internalisasi (oleh siswa) umpan balik yang sesuai pada kinerja, dengan mata ke arah kelanjutan masa depan (atau pembentukan) pembelajaran. Untuk semua tujuan praktis, hampir semua jenis penilaian informal (atau seharusnya) formatif. Mereka memiliki sebagai fokus utama mereka dalam pembangunan berkelanjutan dari bahasa pembelajar. Jadi, ketika Anda memberikan mahasiswa komentar atau saran, atau meminta perhatian untuk



9



kesalahan, umpan balik yang ditawarkan dalam rangka meningkatkan kemampuan bahasa pembelajar. Penilaian sumatif bertujuan untuk mengukur, atau meringkas, apa yang telah ditangkap seorang mahasiswa dan biasanya terjadi pada akhir kuliah atau unit pengajaran. Sebuah penjumlahan dari apa yang telah dipelajari siswa berarti melihat kembali dan menginventarisasi tujuan berupa seberapa baik siswa telah dicapai, tetapi tidak selalu menunjukkan jalan untuk kemajuan di masa depan. ujian akhir dalam kuliah dan ujian keahlian umum adalah contoh dari penilaian sumatif. Salah satu masalah dengan sikap yang berlaku terhadap pengujian adalah pandangan bahwa semua tes (kuis, review tes periodik, ujian tengah semester, dll) yang sumatif. Pada berbagai titik dalam pengalaman pendidikan masa lalu Anda, tidak diragukan lagi Anda telah mempertimbangkan tes seperti sumatif. Anda mungkin memiliki tbought. "Wah! Aku senang itu lebih. Sekarang saya tidak harus ingat hal-hal itu lagi!" Tantangan untuk Anda sebagai guru adalah untuk mengubah sikap antara siswa Anda: Dapatkah Anda menanamkan kualitas yang lebih formatif dengan apa yang siswa Anda mungkin sebaliknya melihat sebagai tes sumatif? Anda dapat menawarkan Siswa Anda kesempatan untuk mengkonversi tes menjadi "pengalaman belajar"? 4) Norma merujuk dan kriteria dirujuk tes Dikotomi lain yang penting untuk menjelaskan di sini dan yang membantu dalam memilah terminologi umum dalam penilaian adalah perbedaan antara norma direferensikan dan kriteria direferensikan pengujian. Dalam tes mengacu-norma, nilai masing-masing pengambil tes ditafsirkan dalam kaitannya dengan mean (rata skor), median (nilai tengah), standar deviasi (tingkat varians dalam skor), dan / atau peringkat persentil. Tujuan dalam tes tersebut adalah untuk menempatkan peserta ujian sepanjang kontinum matematika di urutan peringkat. Skor biasanya dilaporkan kembali ke peserta tes dalam bentuk skor numerik (misalnya, 230 oul 300) dan peringkat persentil (seperti: adalah 84 persen, yang berarti bahwa skor tes pengambil lebih tinggi dari 84 persen dari jumlah peserta tes, tetapi lebih rendah dari 16 persen dalam administrasi itu). Khas tes norma yang direferensikan adalah tes standar seperti Scholastic Aptitude Test (SAT) atau Test Bahasa Inggris sebagai Bahasa Asing (TOEFL), dimaksudkan untuk diberikan kepada khalayak yang besar, dengan hasil efisien disebarluaskan ke tes pengambil. Tes tersebut harus memiliki tetap, tanggapan yang telah ditentukan dalam format yang dapat mencetak gol cepat di minimum beban. Uang dan efisiensi keprihatinan utama dalam tes ini. Di sisi lain, tes kriteria direferensikan, dirancang untuk memberikan umpan balik tes pengambil, biasanya dalam bentuk nilai, pada tes Kelas kuliah atau



10



tujuan pasal tertentu yang melibatkan siswa dalam satu kelas, dan terhubung ke kurikulum, yang khas dari kriteria pengujian direferensikan. Di sini, banyak waktu dan usaha pada bagian dari guru (test kepengurusan) kadang-kadang diperlukan dalam rangka untuk memberikan manfaat, umpan balik yang sesuai untuk siswa, atau apa yang oller (1979: 52) yang disebut "nilai instruksional. "Dalam tes kriteria direferensikan, distribusi skor siswa di sebuah kontinum mungkin sedikit perhatian karena sebagai instrumen menilai tujuan yang tepat. Dalam Penilaian Bahasa, dengan penonton guru bahasa kelas dan guru dalam pelatihan, dan dengan penekanan pada penilaian berbasis kelas (sebagai lawan standar, pengujian skala besar), kriteria pengujian direferensikan adalah kepentingan lebih menonjol dari norma dirujuk pengujian. 3. Evaluasi dalam Pembelajaran a. Pengertian evaluasi Ada tiga hal yang saling berkaitan dalam kegiatan evaluasi pembelajaran yaitu evaluasi, pengukuran dan tes. Ketiga istilah itu sering disalahartikan sehingga tidak jelas makna dan kedudukannya. Gronlund (1976) mengemukakan evaluasi adalah suatu proses yang sistematis dari pengumpulan, analisis dan intrepretasi informasi/data untuk menentukan sejauh mana siswa telah mencapai tujuan pembelajaran. Hopkins dan Antes (1990) mengemukakan evaluasi adalah pemeriksaan secara terus menerus untuk mendapatkan informasi yang meliputi siswa, guru, program pendidikan dan proses belajar mengajar untuk mengetahui tingkat perubahan siswa dan ketepatan keputusan tentang gambaran siswa dan efektivitas program. Berdasarkan kedua pendapat di atas, dapat disimpulkan bahwa evaluasi lebih bersifat komprehensif yang meliputi pengukuran, dan tes merupakan salah satu alat atau bentuk dari pengukuran. Pengukuran lebih membatasi kepada gambaran yang bersifat kuantitatif (berupa angka-angka) tentang kemajuan belajar siswa (learning progress) sedangkan evaluasi atau penilaian bersifat kualitatif. Di samping itu, evaluasi pada hakikatnya merupakan suatu proses membuat keputusan tentang nilai suatu objek. Keputusan penilaian (value judgement) tidak hanya didasarkan kepada hasil pengukuran (quantitative description), dapat pula didasarkan kepada hasil pengamatan (qualitative description). Hal itu didasarkan kepada hasil pengukuran (measurement) dan bukan didasarkan kepada hasil pengukuran (nonmeasurement) pada akhirnya menghasilkan keputusan nilai tentang suatu objek yang dinilai. Mursell mengatakan ada tiga hal pokok yang dapat di evaluasi dalam pembelajaran, yaitu (a) hasil langsung dari usaha belajar, (b) transfer sebagai akibat dari belajar, dan (c) proses belajar itu sendiri. Hasil dari usaha belajar nampak dalam bentuk perubahan tingkah laku, baik secara subtantif maupun 11



secara komprehensif. Perubahan itu ada yang dapat diamanati secara langsung ada pula yang tidak dapat diamati secara langsung. Perubahan itu juga ada yang terjadi dalam jangka pendek ada pula yang terjadi dalam jangka panjang. Namun demikian, bagaimanapun baiknya alat evaluasi yang digunakan hanya mungkin dapat mengungkap sebagian tingkah laku dari keseluruhan hasil belajar yang sebenarnya. Evaluasi yang baik harus menilai hasil-hasil yang autentik dan hal ini dilakukan dengan mengetes hingga manakah hal itu dapat ditransferkan. Evaluasi harus dilakukan dengan tepat, teliti dan objektif terhadap hasil belajar sehingga dapat menjadi alat untuk mengecek kemampuan siswa dalam belajarnya dan mempertinggi prestasi belajarnya. Di samping itu evaluasi dapat menjadi alat pengontrol bagi cara mengajar guru, serta dapat membimbing murid untuk memahami dirinya (keunggulan dan kelemahannya). b. Tujuan dan fungsi evaluasi pembelajaran Mursell mengemukakan bahwa evaluasi menurut syarat-syarat psikologis bertujuan agar guru mengenal siswa selengkap mungkin dan agar siswa mengenal dirinya sesempurna-sempurnanya. Di samping itu, evaluasi juga berguna untuk meningkatkan hasil pengajaran, karena itu evaluasi tidak dapat dipisahkan dari belajar dan mengajar, dan intinya adalah penilaian belajar dengan tujuan untuk memperbaikinya. Penilaian harus dilakukan oleh semua yang bersangkutan, bukan hanya guru tapi juga siswa sendiri, dan harus ditinjau dari keseluruhan. Berdasarkan hasil evaluasi, guru dapat mengetahui sampai di mana penguasaan bahan pelajaran atau kecakapan masing-masing siswa. Selain itu evaluasi juga dapat digunakan guru sebagai alat untuk memperbesar motivasi belajar siswa, sehingga dapat mencapai prestasi belajar yang lebih tinggi. Evaluasi dalam pembelajaran dapat membantu guru dalam mengambil keputusan-keputusan yang epektif dalam pembelajaran. Gronlund (1976) mengemukakan ada tiga jenis keputusan yang dapat dilakukan oleh guru berkaitan dengan proses evaluasi.   



keputusan pada permulaan pengajaran keputusan pada saat pengajaran berlangsung, dan keputusan pada akhir pembelajaran



Keputusan pada awal pengajaran berkaitan dengan informasi mengenai sejauh mana kemampuan dan keterampilan yang harus dimiliki siswa untuk memulai pelajaran (entering behavior), dan sejauh mana bahan pelajaran yang akan diberikan telah diketahui siswa (pre-test). Keputusan pada saat pengajaran berlangsung berkaitan dengan tugas-tugas belajar mana yang dapat dilakukan oleh siswa dengan baik, dan tugas-tugas mana yang memerlukan pertolongan (perlu dibantu), siswa mana yang menghadapi kesulitan dalam belajarnya sehingga memerlukan program remedial. Keputusan



12



pada akhir pengajaran berkaitan dengan informasi tentang siswa manakah yang telah menguasai bahan pelajaran yang diberikan serta dapat melanjutkan kepada program pengajaran berikutnya, dan nilai apa yang harus diberikan kepada setiap murid. Selanjutnya Gronlund (1976) mengemukakan bahwa evaluasi dalam pembelajaran dapat membantu siswa (a) memperkuat motivasi belajarnya, (b) memperbesar daya ingat dan transfer belajarnya, (c) memperbesar pemahaman siswa terhadap keberadaan dirinya, dan (d) memberikan bahan unpan balik tentang keefektifan pembelajaran. Dari pendapat-pendapat di atas dapat disimpulkan bahwa tujuan evaluasi dalam pembelajaran adalah meliputi: (a) untuk melihat produktivitas dan efektivitas kegiatan belajar mengajar, (b) untuk memperbaiki, dan menyempurnakan kegiatan guru, (c) untuk memperbaiki, menyempurnakan dan mengembangkan program belajar mengajar, (d) untuk mengetahui kesulitankesulitan apa yang dihadapi oleh siswa selama kegiatan belajar dan mencarikan jalan keluarnya, dan (e) untuk menempatkan siswa dalam situasi belajar mengajar yang tepat sesuai dengan kemampuannya. Adapun fungsi utama evaluasi dalam pembelajaran dapat dikelompokan ke dalam empat fungsi, yaitu (a) formatif, evaluasi dapat memberikan unpan balik bagi guru sebagai dasar untuk memperbaiki proses belajar mengajar dan mengadakan program remedial bagi siswa yang belum menguasai sepenuhnya materi yang dipelajari, (b) sumatif, yaitu dapat mengetahui tingkat penguasaan siswa terhadap materi pelajaran, menentukan angka nilai sebagai bahan keputusan kenaikan kelas dan laporan perkembangan belajar siswa, serta dapat meningkatkan motivasi belajar siswa, (c) diagnostik, yaitu dapat mengetahui latar belakang siswa (psikologis, fisik, dan lingkungan), yang mengalami kesulitan belajar, dan (d) seleksi dan penempatan, yaitu hasil evaluasi dapat dijadikan dasar untuk menyeleksi dan menempatkan siswa sesuai dengan minat dan kemampuannya. Tujuan pokok evaluasi pembelajaran adalah untuk mengetahui keefektifan proses belajar mengajar yang telah dilaksanakan. Indikator keefektifan itu dapat dilihat dari perubahan tingkah laku yang terjadi pada peserta didik . Perubahan tingkah laku yang terjadi itu dibandingkan dengan perubahanan tingkah laku yang diharapkan sesuai dengan tujuan dan isi program pembelajaran. Oleh karena itu, instrumen evaluasi harus dikembangkan bertitik tolak kepada tujuan dan isi program, sehingga bentuk dan format tes yang dikembangkan sesuai dengan tujuan dan karakteristik bahan ajar serta proporsinya sesuai dengan keluasan dan kedalaman materi pelajaran yang diberikan. Hasil evaluasi harus dianalisis dan ditafsirkan secara hati-hati sehingga informasi yang diperoleh betul-betul akurat mencerminkan keadaan siswa secara objektif. Informasi yang objektif dapat dijadikan bahan masukan untuk perbaikan proses dan program 13



selanjutnya. Evaluasi dalam pembelajaran tidak semata-mata untuk menentukan ratting siswa melainkan juga harus dijadikan sebagai teknik atau cara pendidikan. Sebagai teknik atau alat pendidikan evaluasi pembelajaran harus dikembangakan secara terencana dan terintegratif dalam program pembelajaran, dilakukan secara kontinue, mengandung unsur paedagogis, dan dapat lebih mendorong siswa aktif belajar. c. Prinsip-prinsip umum evaluasi dalam pembelajaran Prinsip-prinsip evaluasi dalam pembelajaran sangat diperlukan sebagai panduan dalam prosedur pengembangan evaluasi, karena jangkauan sumbangan penilaian dalam usaha perbaikan pembelajaran sebagian ditentukan oleh prinsip-prinsip yang mendasari pengembangan dan pemakaiannya. Berkaitan dengan prinsip-prinsip penilaiai tersebut, Gronlund (1976) mengemukakan enam prinsip penialaian, yaitu tes hasil belajar hendaknya:      



mengukur hasil-hasil belajar yang telah ditentukan dengan jelas dan sesuai dengan tujuan pembelajaran, mengukur sampel yang representatif dari hasil belajar dan bahan-bahan yang tercakup dalam pengajaran, mencakup jenis-jenis pertanyaan/soal yang paling sesuai untuk mengukur hasil belajar yang diinginkan, direncanakan sedemikian rupa agar hasilnya sesuai dengan yang akan digunakan secara khusus, dibuat dengan reliabilitas yang sebesar-besarnya dan harus ditafsirkan secara hati-hati, dan dipakai untuk memperbaiki hasil belajar.



Sejalan dengan pendapat di atas, Nana Sujana (1990) mengemukakan bahwa penilaian hasil belajar hendaknya (a) dirancang sedemikian rupa sehingga jelas kemampuan yang harus dinilai, materi penilaian, alat penilaian dan iterpretasi hasil penilaian, (b) menjadi bagian yang integral dari proses belajar mengajar, (c) agar hasilnya obyektif, penilaian harus menggunakan berbagai alat penilaian dan sifatnya komprehensif, (d) diikuti dengan tindak lanjutnya. Pengukuran, penilaian dan evaluasi merupakan kegiatan yang bersifat hierarki. Artinya ketiga kegiatan tersebut dalam kaitannya dengan proses belajar mengajar tidak dapat dipisahkan satu sama lain dan dalam pelaksanaannya harus dilaksanakan secara berurutan. Evaluasi Menurut Suharsimi Arikunto (2004) adalah kegiatan untuk mengumpulkan informasi tentang bekerjanya sesuatu, yang selanjutnya informasi tersebut digunakan untuk menentukan alternatif yang tepat dalam mengambil keputusan. Dalam bidang pendidikan, evaluasi sebagaimana dikatakan Gronlund (1976) merupakan proses yang sistematis tentang mengumpulkan, menganalisis dan menafsirkan informasi untuk menentukan 14



sejauhmana tujuan pembelajaran telah dicapai oleh siswa. Menurut Djemari Mardapi (2004: 19) evaluasi adalah proses mengumpulkan informasi untuk mengetahui pencapaian belajar kelas atau kelompok. Dari pendapat di atas, ada beberapa hal yang menjadi ciri khas dari evaluasi yaitu: (1) sebagai kegiatan yang sistematis, pelaksanaan evaluasi haruslah dilakukan secara berkesinambungan. Sebuah program pembelajaran seharusnya dievaluasi disetiap akhir program tersebut, (2) dalam pelaksanaan evaluasi dibutuhkan data dan informasi yang akurat untuk menunjang keputusan yang akan diambil. Asumsi-asumsi ataupun prasangka. bukan merupakan landasan untuk mengambil keputusan dalam evaluasi, dan (3) kegiatan evaluasi dalam pendidikan tidak pernah terlepas dari tujuan-tujuan pembelajaran yang telah ditetapkan sebelumnya. Karena itulah pendekatan goal oriented merupakan pendekatan yang paling sesuai untuk evaluasi pembelajaran. C. PENUTUP Pengukuran adalah membandingkan sesuatu dengan satu ukuran. Pengukuran bersifat kuantitatif. Penilaian adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik buruk. Penilaian bersifat kualitatif. Sedangkan evaluasi meliputi kedua langkah di atas, yakni pengukuran dan penilaian. Prinsip umum dan penting dalam kegiatan evaluasi yaitu adanya triangulasi (hubungan erat tiga komponen) yaitu tujuan pembelajaran, kegiatan pembelajaran (KBM), dan evaluasi. Tujuan evaluasi hasil belajar yaitu untuk mengetahui capaian penguasaan kompetensi oleh setiap siswa sesuai rencana pembelajaran yang disusun oleh guru mata pelajaran. Kompetensi yang harus dikuasai oleh siswa mencakup koginitif, psikomotorik dan afektif.



DAFTAR PUSTAKA



15



Arikunto, Suharsimi. 2012, Dasar-dasar Evaluasi Pendidikan (Edisi kedua). Jakarta: PT Bumi Aksara Bachman, Lyle F. 2004. Statistical Analyses for Language Assessment, The Cambridge Language Assessment Series. Cambridge: New York. Brown, Douglas. 2004. Language Assesment Principles and Classroom Parctices. Longman. Gronlund, Norman E. 1976. Measurement and Evaluation in Teaching, Fifth Edition. New York : McMillan Publising. Hopkins, Charles D. dan Richard L. Antes. 1990. Clasroom Measurement and Evaluation, Third Edition. Indiana : F.E Peacok Publisher, Inc. Mursell, James. Mengajar dengan Sukses, terjemahan S. Nasution. Bandung : C.V Jemars. Sujana, Nana. 1990. Penilaian Hasil Proses Belajar Mengajar. Bandung : P.T Remaja Rosdakarya.



16