12 2 344 KB
MAKALAH EVALUASI PEMBELAJARAN “Menguji butir soal dan meperbaiki kualitas soal”
Dosen Pengampu: Dr. Rayendra, M.Pd
Disusun Oleh: Kelompok 4
Dwi Yuan Nadhilla (23004009) Isnani Utiya Hasanah (23004016) Tatsbita Ciakita Novit (23004038)
PROGRAM STUDI TEKNOLOGI PENDIDIKAN FAKULTAS ILMU PENDIIKAN UNIVERSITAS NEGERI PADANG 2024
KATA PENGANTAR Puji Syukur kami panjatkan kehadirat Tuhan Yang Maha Esa karena dengan Rahmat, karunia, dan hidayah-Nya kami dapat menyelesaikan makalah yang berjudul “Menguji butir soal dan meperbaiki kualitas soal”. Tujuan kami membuat makalah ini adalah untuk memenuhi tugas mata kuliah Evaluasi Pembelajaran. Kami berharap makalah ini dapat berguna untuk menambah wawasan serta pengetahuan kita mengenai bagaimana cara menguji butir soal dan memperbaiki kualitas soal. Dalam pembuatan makalah ini kami sadar bahwa di dalam makalah ini terdapat kekurangan dan jauh dari kata sempurna. Maka dari itu, kami sangat berharap adanya kritik, saran dan usulan yang membangun dari semua pihak untuk perbaikan makalah selanjutnya.
Padang, 26 September 2024
Kelompok 4
i
DAFTAR ISI KATA PENGANTAR…………………………………………………… i DAFTAR ISI…………………………………………………………….. ii BAB I PENDAHULUAN……………………………………………….. 1 A. Latar Belakang…………………………………………………… 1 B. Rumusan Masalah………………………………………………... 2 C. Tujuan Penulisan…….…………………………………………… 2 BAB II PEMBAHASAN………………………………………………..
3
A. Validitas…………………………………………………………..
3
B. Reliabilitas……………………………………………………….. 4 C. Daya Beda…..……………………………………………………
6
D. Indeks Kesukaran………………………………………………… 8 E. Fungsi Distraktor………………………………………………… 9 BAB III PENUTUP……………………………………………….. ….
11
A. Kesimpulan……………………………………………………..
11
B. Saran……………………………………………………………
11
DAFTAR PUSTAKA…………………………………………………..
12
ii
BAB I PENDAHULUAN A. Latar Belakang Evaluasi pembelajaran merupakan salah satu aspek penting dalam proses pendidikan, karena hasil evaluasi dapat memberikan gambaran tentang efektivitas suatu program pembelajaran dan perkembangan kemampuan siswa. Dalam praktiknya, evaluasi pembelajaran tidak hanya sekadar memberikan nilai, tetapi juga harus mempertimbangkan berbagai aspek teknis yang memastikan hasil penilaian tersebut akurat dan dapat diandalkan. Beberapa aspek penting yang harus diperhatikan dalam evaluasi pembelajaran meliputi validitas, reliabilitas, daya beda, indeks kesukaran, dan fungsi distraktor. Validitas merupakan sejauh mana tes mengukur apa yang seharusnya diukur, sedangkan reliabilitas adalah konsistensi hasil pengukuran ketika dilakukan pengukuran berulang. Untuk mengevaluasi kualitas butir soal, daya beda digunakan untuk menilai kemampuan suatu soal dalam membedakan siswa yang berkemampuan tinggi dan rendah, serta indeks kesukaran mengukur seberapa mudah atau sulit suatu soal bagi siswa. Selain itu, fungsi distraktor dalam tes objektif juga sangat penting karena dapat menentukan apakah opsi jawaban yang salah berfungsi dengan baik dalam mengarahkan siswa yang tidak memahami materi ke pilihan yang tidak tepat. Dengan memahami dan menghitung aspek-aspek ini, guru dan pengembang tes dapat merancang evaluasi yang tidak hanya adil dan akurat, tetapi juga mampu memberikan umpan balik yang berharga bagi peningkatan proses belajar-mengajar. Makalah ini akan membahas lebih lanjut mengenai pengertian, rumus, dan bagaimana menggunakan aspek tersebut dalam konteks evaluasi pembelajaran.
1
B. Rumusan Masalah 1. Apa itu validitas dan bagaimana cara menguji validitas? 2. Apa itu reliabilitas dan bagaimana cara menguji reliabilitas? 3. Apa itu daya beda dan bagaimana menganalisis daya beda? 4. Apa itu indeks kesukaran dan bagaimana menganalisis indeks kesukaran? 5. Apa itu fungsi distraktor dan bagaimana menganalisis fungsi distraktor? C. Tujuan Penulisan 1. Untuk mengetahui pengertian dan cara menguji atau menggunakan rumus validitas. 2. Untuk mengetahui pengertian dan cara menguji atau menggunakan rumus reliabilitas. 3. Untuk mengetahui pengertian dan cara menganalisis daya beda. 4. Untuk mengetahui pengertian dan cara menganalisis indeks kesukaran. 5. Untuk mengetahui pengertian dan cara menganalisis fungsi distraktor.
2
BAB II PEMBAHASAN A. Validitas 1. Pengertian Validitas Azwar (2019) menyatakan bahwa validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrumen
pengukur
(tes)
dalam
melakukan
fungsi
ukurnya.
Validitas adalah kualitas yang menunjukkan korelasi antara pengukuran dan makna dari
kriteria
atau
perilaku
pembelajaran.
Validitas
mengacu pada penentuan alat evaluasi untuk konsep yang akan dievaluasi. Validitas adalah tingkat
kemampuan tes
untuk mengukur apa
yang diukur dalam pembelajaran. Validitas juga dapat diartikan sebagai ukuran
seberapa ketepatan alat ukur
dalam melakukan fungsinya,
sehingga akan mendapatkan hasil sesuai dengan apa yang hendak di ukur. Ada yang mengatakan bahwa valid itu sama dengan sahih, sehingga validitas sama dengan kesahihan. Ada juga yang mengartikan valid sama dengan tepat, sehingga validitas sama dengan ketepatan. Validitas juga dapat diartikan sebagai proses penafsiran suatu data dengan cara tertentu. Maka dari itu, validitas ini bersifat relative, artinya ketepatan tergantung kepada situasi sosial dan tujuannya. Jadi
validitas
instrument
merupakan
suatu
usaha
untuk
memperoleh pembenaran yang ril berdasarkan pada bukti yang tersedia. Bukti tersebut dapat berupa skor, hasil pengamatan, atau alat instrumen lainnya. Dari pengertian di atas dapat disimpulkan, validitas merupakan suatu ukuran yang menunjukkan kevalidan atau kesahihan suatu instrumen. Jadi pengujian validitas itu mengacu pada sejauh mana suatu instrument dalam menjalankan fungsinya.
3
2. Pengukuran Menggunakan Rumus Validitas Rumus validitas merujuk pada formula matematis yang digunakan untuk menghitung seberapa baik suatu instrumen pengukur (seperti tes atau kuesioner) dapat mengukur apa yang dimaksudkan untuk diukur. Ada beberapa jenis validitas, dan masing-masing memiliki rumus atau metode penghitungan yang berbeda. Berikut adalah rumus validitas yang umum digunakan: •
Validitas Internal: Untuk menghitung validitas internal, koefisien korelasi antara skor item dan skor total digunakan. Rumus yang sering digunakanadalah: rit=∑(Xi−Xˉ)2∑(Xt−Xtˉ)2∑(Xi−Xˉ)(Xt−Xtˉ) Di mana:
•
o
Xi = skor item ke-i
o
Xt = skor total
o
Xˉ dan Xtˉ adalah rata-rata dari skor item dan skor total.
Koefisien Korelasi Biserial: Untuk item dikotomi, rumus yang digunakan adalah: rbis=S(M1−M0)p(1−p) Di mana: o M1 = rata-rata skor total untuk responden yang menjawab benar o M0 = rata-rata skor total untuk responden yang menjawab salah o S = standar deviasi skor total o p = proporsi responden yang menjawab benar.
B. Reliabilitas 1. Pengertian Reliabilitas Reliabilitas berasal dari kata reliability yang berarti sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu hasil pengukuran dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama, selama aspek yang diukur dalam diri subyek memang belum berubah.
4
Reliabilitas
mempunyai
nama
lain keandalan,
keteguhan,
terpercaya, stabilitas, dan konsistensi, tetapi gagasan utama yang termuat dalam konsep reliabilitas yakni tentang dimana pengukuran dapat
diandalkan
(Azwar,
2019).
Reliabilitas
(keterandalan)
berhubungan dengan masalah kepercayaan yaitu tingkat kepercayaan bahwa suatu evaluasi mampu memberikan hasil yang tepat. Maksud dari pernyataan ini adalah jika suatu eveluasi dilakukan pada subjek yang sama, maka evaluasi senantiasa menunjukkan hasil evaluasi yang sama atau sifatnya ajeg dan stabil. 2. Pengukuran Menggunakan Rumus Reliabilitas Rumus reliabilitas adalah formula matematis yang digunakan untuk mengukur sejauh mana hasil pengukuran dari suatu instrumen (seperti tes atau kuesioner) dapat dipercaya dan konsisten. Reliabilitas menunjukkan seberapa stabil dan konsisten hasil pengukuran ketika instrumen tersebut digunakan berulang kali dalam kondisi yang sama. Berikut adalah beberapa rumus yang umum digunakan untuk menghitung reliabilitas: •
Koefisien Reliabilitas KR-20: o
Digunakan untuk instrumen yang memiliki item dikotomi (jawaban benar/salah). Rumusnya adalah: rKR−20=k−1k (1−S2∑pi(1−pi)) Di mana:
o
k = jumlah item dalam tes
o
pi = proporsi responden yang menjawab benar untuk item kei
o
•
S2 = varians total skor.
Koefisien Reliabilitas Alpha Cronbach: o
Digunakan untuk instrumen yang memiliki item dengan skala likert
atau
item
yang
bersifat
adalah: α=N−1N(1−St2∑Si2) Di mana:
5
politomi.
Rumusnya
•
o
N = jumlah item
o
Si2 = varians dari skor item ke-i
o
St2 = varians total skor.
Koefisien Reliabilitas Test-Retest: o
Mengukur
konsistensi
hasil
pengukuran
dengan
membandingkan skor dari tes yang sama yang diberikan pada dua waktu yang berbeda. Rumusnya adalah: rtest−retest=SX1 SX2Cov(X1,X2) Di mana: o
Cov(X1,X2) = kovarians antara skor pada dua waktu
o
SX1 dan SX2 = standar deviasi dari skor pada waktu pertama dan kedua.
•
Koefisien Reliabilitas Split-Half: o
Mengukur konsistensi internal dengan membagi tes menjadi dua bagian dan membandingkan hasilnya. Rumusnya adalah: rsplit−half=1+rhalf2rhalf Di
mana rhalf adalah
koefisien korelasi antara dua bagian tes. C. Daya Beda 1. Pengertian Daya Beda Untuk mengetahui intensitas sebuah soal dalam hal kesukaran dibutuhkan sebuah daya pembeda, yaitu kemampuan antara butir soal dapat membedakan antara peserta didik yang menguasai materi yang diujikan dan peserta didik yang belum menguasai materi yang diujikan. Menurut Zainul, daya beda butir soal ialah indeks yang menunjukkan tingkat kemampuan butir soal membedakan kelompok yang berprestasi tinggi dari kelompok yang berprestasi rendah diantara para peserta tes.
6
2. Rumus Daya Beda Besarnya daya pembeda ditunjukkan dengan indeks diskriminasi atau daya pembeda dengan menggunakan simbol D. Kisaran indeks daya pembeda sama dengan indeks kesukaran soal yaitu 0,00 sampai 1,00. Semakin tinggi indeks pembeda soal, maka soal tersebut mampu membedakan antara siswa yang pintar dengan siswa yang kurang pintar. Tanda negatif yang dijumpai pada perhitungan indeks diskriminasi soal menunjukkan bahwa soal menggambarkan kualitas peserta tes secara terbalik, dimana siswa pandai disebut bodoh dan siswa bodoh disebut pandai. Untuk menghitung indeks daya pembeda soal, peserta harus dikelompok terlebih dahulu ke dalam dua kelompok yaitu kelompok pandai-bodoh atau kelompok atas-bawah atau upper group dan lower group. Berikut ini rumus indeks daya beda butir soal, untuk menentukan indeks diskriminasi adalah :
Dimana : J = jumlah peserta tes JA = Jumlah Peserta Atas JB = Jumlah Peserta Bawah Bb = Jumlah Peserta Kelompok bawah menjawab benar Ba = Jumlah peserta kelompok atas menjawab benar PB - BB/JB = Proporsi peserta kelompok bawah yang menjawab benar PA – BA/JA = Proporsi peserta kelompok atas yang menjawab benar
7
D. Indeks Kesukaran 1. Pengertian Indeks Kesukaran Tingkat kesukaran soal merupakan pengukuran seberapa besar derajat kesukaran soal. Suatu soal dikatakan baik, apabila memiliki tingkat kesukaran soal yang seimbang (proporsional) dalam artian soal tersebut tidak terlalu mudah atau terlalu sukar. Menurut Nana Sudjana Soal dinyatakan baik apabila soal memiliki indeks kesukaran sesuai dengan tujuan dari tes tersebut. Misalnya, untuk keperluan ujian semester digunakan butir soal dengan tingkat kesukaran sedang, untuk seleksi dengan butir soal tingkat kesukaran tinggi, dan untuk keperluan diagnosis digunakan butir soal dengan tingkat kesukaran mudah. Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha untuk memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa. 2. Rumus Indeks Kesukaran Bilangan yang menunjukkan sukar mudahnya soal disebut indeks kesukaran (difficulty index) yang diberi simbol dengan huruf P. Besarnya indeks kesukaran soal antara 0,00 sampai 1,0. Semakin besar indeks kesukaran soal maka semakin mudah soal tersebut dan sebaliknya. Rumus untuk mencari indeks kesukaran soal, yaitu:
Dimana : P = indeks kesukaran soal B = banyaknya siswa yang menjawab soal benar JS = jumlah seluruh peserta tes
8
E. Fungsi Distraktor 1. Pengertian Fungsi Distraktor Pengertian distraktor yaitu, “Distractor are classified as the incorrect answer in a multiple-choice question.”. Dalam setiap tes obyektif selalu digunakan alternatif jawaban yang mengandung 2 unsur sekaligus, yaitu jawaban tepat dan jawaban yang salah sebagai penyesat (distraktor). Tujuan pemakaian distraktor ini adalah mengecohkan mereka yang kurang mampu atau tidak tahu untuk dapat dibedakan dengan yang mampu. Oleh karena itu, distraktor yang baik adalah yang dapat dihindari oleh anak-anak yang pandai dan terpilih oleh anak-anak yang kurang pandai. Perlunya dilakukan analisis pengecoh (distractors) pada setiap butir soal, untuk mengetahui efektif dan tidaknya pengecoh pada tes pilihan ganda. Pada alternatif jawaban benar, kelompok tinggi harus memilih lebih banyak jawaban yang benar. Sebaliknya untuk alternatif jawaban yang merupakan pengecoh, kelompok bawah harus memilih secara lebih banyak. Disamping itu semua alternatif jawaban yang disediakan harus ada siswa yang memilihnya. Jika terjadi penyimpangan terhadap hal-hal tersebut, dalam arti tidak seorang siswa pun yang terkecoh atau kelompok atas justru lebih banyak yang terkecoh, berarti pengecoh yang disediakan tidak efektif. 2. Rumus Fungsi Distraktor Suatu distraktor (pengecoh) berfungsi dengan baik apabila pengecoh paling tidak dipilih oleh 5% peserta tes atau lebih banyak dipilih oleh kelompok bawah. Jadi distraktor dikatakan berfungsi dengan baik apabila pengecoh dipilih paling sedikit 5% dari peserta tes. Menurut Suharsimi Arikunto tidak lanjut setelah dilakukan analisisi keefektifan distraktor, dapat diperlakukan dengan 3 cara berikut ini: a. Diterima karena sudah baik. Artinya semua distraktor pada soal sudah dipilih 5% dari peserta tes. 9
b. Ditolak karena tidak baik. Artinya distraktor sama sekali tidak dipilih peserta tes (0%). c. Ditulis kembali karena kurang baik. Artinya distraktor belum menjalankan fungsinya dengan baik (distraktor dipilih kurang dari 5%). Sebagai ilustrasi, berikut ini disajikan hasil uji coba instrumen hasil belajar yang terdiri dari 7 butir tes objektif yang terdiri dari 4 pilihan diuji cobakan terhadap 100 orang peserta tes. Mengingat banyak peserta tes 100 orang, pengecoh dikatakan baik jika dipilih oleh miimal 5% dari 100 orang, atau minimal dipilih oleh 5 orang peserta tes. Data tentang banyaknya peserta tes yang memilih tiap-tiap pilihan pada masing-masing butir, beserta keterangan baik-tidaknya pengecoh adalah seperti tercantum pada tabel berikut.
10
BAB III PENUTUP A. Kesimpulan Makalah ini menegaskan bahwa evaluasi pembelajaran merupakan elemen kunci dalam proses pendidikan yang efektif. Dengan menguji butir soal dan memperbaiki kualitas soal menggunakan, pendidik dapat memastikan bahwa hasil evaluasi yang diperoleh adalah akurat dan dapat diandalkan. Aspek-aspek penting yang dibahas, seperti validitas dan reliabilitas, memberikan fondasi bagi pengukuran yang tepat. Validitas menjamin bahwa instrumen pengukur memenuhi fungsi yang dimaksud, sementara reliabilitas memastikan konsistensi hasil pengukuran. Daya beda dan indeks kesukaran juga memainkan peran penting dalam membedakan kemampuan siswa, sehingga soal yang diberikan dapat memberikan gambaran yang lebih jelas tentang penguasaan materi. Selain itu, fungsi distraktor dalam soal pilihan ganda membantu mengidentifikasi pemahaman siswa secara lebih mendalam. Dengan demikian, pemahaman yang baik tentang semua aspek ini tidak hanya meningkatkan kualitas evaluasi, tetapi juga berkontribusi pada perbaikan proses pembelajaran secara keseluruhan. B. Saran Untuk
meningkatkan
efektivitas
evaluasi
pembelajaran,
kami
menyarankan agar para pendidik secara aktif mengembangkan keterampilan dalam menganalisis dan merancang alat ukur yang berkualitas. Pelatihan dan workshop yang berfokus pada penggunaan SPSS dan metode analisis lainnya sangat dianjurkan, sehingga pendidik dapat lebih memahami cara mengimplementasikan teknik-teknik evaluasi yang tepat.
11
DAFTAR PUSTAKA Azwar, S. (2019). Reliabilitas dan validitas. Fatimah, L. U., & Alfath, K. (2019). Analisis kesukaran soal, daya pembeda dan
fungsi
distraktor. AL-MANAR:
Jurnal
Komunikasi
dan
Pendidikan Islam, 8(2), 37-64. Nana Sudjana. (2009). Penilaian Hasil Proses Belajar Mengajar. Bandung: PT. Remaja Rosdakarya. Rahmaini, A., & Taufiq, A. N. (2018). Analisis butir soal pendidikan agama islam di SMK N 1 sedayu tahun ajaran 2017/2018. Jurnal MUDARRISUNA: Media Kajian Pendidikan Agama Islam, 8(1), 124. Ramadhan, M. F., Siroj, R. A., & Afgani, M. W. (2024). Validitas and Reliabilitas. Journal on Education, 6(2), 10967-10975.
12