Analisis Instrumen Penilaian [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

ANALISIS INSTRUMEN PENILAIAN MAKALAH UNTUK MEMENUHI TUGAS MATA KULIAH



EVALUASI PEMBELAJARAN EKONOMI Dosen Pembimbing : Nailariza Umami, M.Pd.



Disusun Oleh : 1. Rekawati Suyatno



(18187203010)



2. Diah Sasti P.



(18187203012)



3. Sri Rahayu



(18187203014)



4. Cindy Novia C.



(18187203026)



PROGRAM STUDI PENDIDIKAN EKONOMI STKIP PGRI TULUNGAGUNG Tahun Ajaran 2019/2020



KATA PENGANTAR Syukur Alhamdulillah penulis panjatkan kehadirat Allah SWT yang telah melimpahkan rahmat dan karunia-Nya sehingga penulis mampu menyelesaikan makalah dengan judul β€œANALISIS INSTRUMEN PENILAIAN” sebagai tugas mata kuliah Evaluasi Pembelajaran Ekonomi. Tak lupa kami ucapkan terima kasih kepada keluarga dan teman-teman yang telah memberi semangat dan membantu pembuatan makalah ini. Terima kasih juga kami ucapkan kepada dosen pembimbing yang senantiasa memberi arahan kepada penulis untuk menulis makalah ini dengan sebaik-baiknya. Kritik dan saran yang membangun sangat dibutuhkan penulis untuk memperbaiki dalam pembuatan makalah selanjutnya. Semoga makalah ini dapat menjadi wawasan dalam mencari referensi dan dapat membantu pembaca. Terima kasih atas perhatian dan apresiasinya.



Tulungagung, 15 November 2019



Penulis



ii



DAFTAR ISI



KATA PENGANTAR ........................................................................................... ii DAFTAR ISI .......................................................................................................... ii BAB I PENDAHULUAN ...................................................................................... 1 A. Latar Belakang Masalah ............................................................................... 1 B. Rumusan Masalah ........................................................................................ 2 C. Tujuan .......................................................................................................... 2 BAB II PEMBAHASAN ....................................................................................... 3 A. Analisis Logis dan Rasional ......................................................................... 3 B. Analisis Empiris ........................................................................................... 6 C. Taraf Kesukaran ......................................................................................... 34 D. Daya Pembeda ............................................................................................ 37 BAB III PENUTUP ............................................................................................. 44 A. Kesimpulan ................................................................................................ 44 DAFTAR PUSTAKA .......................................................................................... 45



iii



BAB I PENDAHULUAN A. Latar Belakang Masalah Pembelajaran dapat dikatakan berhasil apabila komponen – komponen penting dalam pembelajaran dapat tercapai dengan baik. Salah satu komponen yang sering dijadikan tolok ukur keberhasilan proses pembelajaran adalah penilaian atau evaluasi. Di dalam penilaian terdapat 3 aspek yang harus dicapai oleh siswa yaitu aspek kognitif, afektif, psikomotorik (Hardiani, 2017). Proses penilaian hasil belajar peserta didik memerlukan teknik serta instrumen yang perlu disiapkan dan diperhatikan agar tujuan pembelajaran dapat tercapai. Teknik penilaian pembelajaran terdiri dari teknik tes dan teknik nontes. Sedangkan instrumen adalah alat yang berfungsi memudahkan pelaksanaan sesuatu tugas atau mencapai tujuan secara lebih efektif dan efisien (Arikunto, S, 2007). Menurut Peraturan Pemerintah No. 23 tahun 2016, instrumen penilaian adalah alat yang digunakan oleh pendidik dapat berupa tes, pengamatan, penugasan perseorangan atau kelompok, dan bentuk lain yang sesuai dengan karakteristik kompetensi dan tingkat perkembangan peserta didik. Pengertian instrumen dalam lingkup evaluasi didefinisikan sebagai perangkat untuk mengukur hasil belajar siswa yang mencakup hasil belajar dalam ranah kognitif, afektif, dan psikomotor. Instrumen penilaian yang digunakan harus memenuhi beberapa persyaratan standar yang sudah ditetapkan oleh pemerintah (Badriyah, Thamrin, & Nurhidayati, 2018). Permendikbud nomor 23 tahun 2016 Pasal 14 menyatakan bahwa instrumen penilaian yang digunakan oleh satuan pendidikan dalam bentuk penilaian akhir dan/atau ujian sekolah/madrasah memenuhi persyaratan substansi, konstruksi, dan bahasa, serta memiliki bukti validitas empirik. Suatu tes evaluasi yang baik memiliki ciri dan sifat yang merupakan persyaratan-persyaratan yang harus dipenuhi, yaitu tes tersebut harus valid atau memiliki tingkat validitas yang absah/baik. Sebuah tes evaluasi dikatakan



1



valid apabila tes tersebut secara tepat dan benar dapat mengukur apa yang hendak diukur. Validitas di sini, dapat berupa validitas isi, prediktif atau ramalan dan validitas konstruksi, kemudian tes tersebut harus realiabel, obyektif, praktis dan ekonomis (Solichin, 2017).



B. Rumusan Masalah 1. Bagaimana analisis logis dan rasional instrumen penilaian dalam evaluasi pembelajaran? 2. Bagaimana analisis empiris instrumen penilaian dalam evaluasi pembelajaran? 3. Bagaimana cara menentukan taraf kesukaran instrumen penilaian dalam evaluasi pembelajaran? 4. Bagaimana cara menentukan daya pembeda instrumen penilaian dalam evaluasi pembelajaran?



C. Tujuan 1. Untuk mengetahui dan memahami analisis logis dan rasional instrumen penilaian dalam evaluasi pembelajaran . 2. Untuk mengetahui dan memahami analisis empiris instrumen penilaian dalam evaluasi pembelajaran. 3. Untuk mengetahui dan memahami cara menentukan taraf kesukaran instrumen penilaian dalam evaluasi pembelajaran. 4. Untuk mengetahui dan memahami cara menentukan daya pembeda instrumen penilaian dalam evaluasi pembelajaran.



2



BAB II PEMBAHASAN A. Analisis Logis dan Rasional Analisis logis/rasional meliputi analisis materi, konstruksi dan bahasa. Analisis materi dimaksudkan sebagai penelaahan yang berkaitan dengan substansi keilmuan yang ditanyakan dalam soal serta tingkat kemampuan yang sesuai dengan soal. Analisis konstruksi dimaksudkan sebagai penelaahan yang umumnya berkaitan dengan teknik penulisan soal. Analisis bahasa dimaksudkan sebagai penelaahan soal yang berkaitan dengan pengunaan bahasa Indonesia yang baik dan benar (Asrul, Ananda, & Rosnita, 2014). Berikut ditampilkan analisis logis yang terhadap bentuk soal uraian dan bentuk soal pilihan yang diadopsi dari Pengembangan Sistem Penilaian yang dirancang oleh Departemen Pendidikan Nasional sebagai berikut: TELAAH BUTIR SOAL URAIAN No.



Kriteria



A.



RANAH MATERI



1.



Butir soal sesuai dengan indicator



2.



Batasan pertanyaan dan jawaban yang



Nomor Soal 1



2



3



4



5



diharapkan, jelas 3.



Isi materi yang ditanyakan sesuai dengan jenjang, jenis sekolah, dan tingkat kelas



B.



RANAH KONSTRUKSI



4.



Rumusan kalimat dalam bentuk kalimat tanya atau perintah yang menuntut jawaban terurai



5.



Ada petunjuk yang jelas cara mengerjakan soal



6.



Ada pedoman penskorannya



7.



Butir soal tidak bergantung pada butir



3



soal sbelumnya C.



RANAH BAHASA



8.



Rumusan kalimat komunikatif



9.



Kalimat menggunakan bahasa yang baik dan benar



10.



Rumusan kalimat tidak menimbulkan penafsiran ganda atau salah pengertian



11.



Menggunakan bahasa yang umum (bukan bahasa lokal)



12.



Rumusan soal tidak mengandung katakata yang dapat menyinggung perasaan siswa



TELAAH BUTIR SOAL PILIHAN GANDA No. A.



Kriteria



Nomor Soal 1



2



3



4



5



6



7



8



9



10



RANAH MATERI Butir soal sesuai



1.



dengan Indicator Hanya ada satu



2.



jawaban yang Benar Isi materi yang ditanyakan



3.



sesuai dengan jenjang, jenis sekolah, dan tingkat kelas



B. 4.



RANAH KONSTRUKSI Pokok soal



4



dirumuskan dengan jelas Rumusan soal dan pilihan 5.



jawaban dirumuskan dengan jelas Pokok soal tidak memberi



6.



petunjuk kepada pilihan jawaban yang benar Pokok soal tidak



7.



mengandung pernyataan negatif



8.



Pilihan jawaban homogen Panjang pilihan



9.



jawaban relatif sama Pilihan jawaban dalam



10.



bentuk angka diurutkan Butir soal tidak



11.



tergantung pada butir soal yang lain



C. 12.



13.



RANAH BAHASA Rumusan kalimat komunikatif Kalimat menggunakan bahasa



5



yang baik dan benar Rumusan kalimat tidak 14.



menimbulkan penafsiran ganda atau salah pengertian Menggunakan bahasa



15.



yang umum (bukan bahasa lokal) Rumusan soal tidak mengandung kata-kata



16.



yang dapat menyinggung perasaan siswa



B. Analisis Empiris Dalam arti ini, hasil empiris adalah suatu konfirmasi gabungan. Dalam konteks ini, istilah semi-empiris digunakan untuk mengkualifikasi metodemetode teoretis yang digunakan sebagai bagian dari dasar aksioma atau hukum postulasi ilmiah dan hasil percobaan. Analisis empiris terhadap instrumen/soal dilakukan dengan melakukan menguji validitas, reliabilitas, taraf kesukaran dan daya pembeda. 1. Validitas Tes a. Pengertian Validitas Tes Tes merupakan suatu metode untuk menentukan kemampuan siswa menyelesaikan sejumlah tugas tertentu atau mendemonstrasikan penguasaan suatu keterampilan atau pengetahuan pada suatu materi pelajaran. Tes sebagai alat seleksi maupun evaluasi diharapkan



6



menghasilkan nilai atau skor yang obyektif dan akurat. Bila tes yang digunakan guru kurang baik, maka nilai yang diperoleh siswa tidak objektif dan berarti siswa diperlakukan tidak adil. Oleh sebab itu perlu diusahakan agar tes yang diberikan kepada siswa sedapat mungkin cukup baik dan bermutu dilihat dari berbagai segi. Tes hendaknya disusun sesuai dengan prosedur dan prinsip penyusunan tes. Setelah digunakan, perlu diketahui apakah tes itu cukup obyektif dan efektif, atau tergolong buruk (Sanova, Bakar, & Afrida, 2017). Tes Valid artinya sah atau tepat. Jadi tes yang valid berarti tes tersebut merupakan alat ukur yang tepat untuk mengukur suatu objek. Berdasarkan pengertian ini, maka validitas tes pada dasarnya berkaitan dengan ketepatan dan kesesuaian antara tes sebagai alat ukur dengan objek yang diukur. Mengukur berat badan tentu tidak valid menggunakan meteran. Di kilang padi, ada timbangan yang valid untuk mengukur berat beras, akan tetapi timbangan ini tidak valid untuk mengukur berat emas dengan bentuk cincin. Mengukur keterampilan siswa, misalnya mengukur unjuk kerja siswa, tentu tidak valid menggunakan tes pilihan ganda. Jadi, tes yang digunakan perlu disesuaikan dengan karakteristik hasil belajar yang diukur. Ada langkah-langkah penyusunan tes yang baik, yaitu : penentuan tujuan tes, penyusunan kisi-kisi tes, penulisan soal, penelaahan soal (validasi soal), perakitan soal menjadi perangkat tes, uji coba soal termasuk analisis- nya, bank soal, penyajian tes kepada siswa, skoring (pemeriksaan jawaban siswa). Salah langkah yang jarang atau tidak pernah dilakukan guru adalah uji coba dan analisis butir tes. Tujuan analisis butir soal juga untuk membantu meningkatkan tes melalui revisi atau membuang soal yang tidak efektif, serta untuk mengetahui informasi diagnostik pada siswa apakah mereka sudah/belum memahami materi yang telah diajarkan (Aiken, 1994: 63).



7



b. Cara-cara Menentukan Validitas Tes Pada garis besarnya, cara-cara menentukan validitas tes dibedakan kepada dua, yaitu validitas rasional/logis dan validitas empiris atau validitas berdasarkan pengalaman. Validitas rasional dapat dicapai dengan menjawab pertanyaan berikut ini: (1) Apakah tes benar-benar mengukur kompetensi atau hasil belajar yang akan diukur ? (2) Apakah bentuk tes sesuai digunakan untuk mengukur hasil belajar siswa ?



Untuk menentukan validitas instrumen secara empiris, peneliti harus melakukan uji coba (try out). Uji coba dilakukan kepada sebahagian sebagian siswa. Kemudian hasil uji coba tersebut diuji validitasnya. Banyak cara yang dapat kita tempuh untuk menguji validitas tes secara empiris. Pada makalah ini akan diperkenalkan tiga cara yang lazim digunakan.



1) Validitas Eksternal Validitas eksternal dilakukan dengan cara mengkorelasikan skor hasil uji coba instrumen yang dibuat guru dengan instrumen yang sudah baku. Misalnya seorang guru Fikih membuat tes ujian semester genap kelas III tingkat Aliyah. Untuk menguji validitas eksternal tes yang dibuat guru, dapat dibandingkan dengan tes yang sudah baku, misalnya Tes Toufel. Test kemampuan berbahasa Inggris yang dibuat guru dapat diuji validitas eksternal dengan cara: (a) Mengujicobakan secara bersamaan tes yang dibuat guru dan tes toufel yang telah baku. (b) Memberi skor-skor tes buatan dan tes toufel.



8



(c) Mencari angka korelasi antara skor-skor tes buatan dengan skorskor tes toufel. Teknik korelasi yang digunakan adalah teknik korelasi Product Moment. (d) Menguji signifikansi angka korelasi yang diperoleh pada langkah ketiga. jika angka korelasi yang diperoleh ternyata signifikan, berarti tes yang dibuat guru dapat dianggap VALID.



2) Validitas Internal Validitas Internal dapat dilakukan dengan dua cara, yaitu analisis faktor dengan analisis butir. a) Analisis Faktor Analisis faktor dilakukan dengan cara mengkorelasikan skor faktor dengan skor total. Teknik korelasi yang digunakan adalah teknik korelasi Product Moment. Jika terdapat korelasi positif dan signifikan, berarti item-item pada faktor tersebut dianggap valid.



b) Analisis Butir Analisis butir dilakukan dengan cara mengkorelasikan skor-skor item dengan skor total. Korelasi dilakukan dengan teknik korelasi product moment. Jika terdapat korelasi positif dan signifikan antara skor item dengan skor total berarti item tersebut dianggap valid.



9



Contoh penggunaannya : Guru memberikan skor kepada anak didiknya dengan ketentuan setiap item tes yang yang dijawab benar diberikan skor 1 dan bila salah diberi skor 0. Datanya tertera pada tabel berikut :



Pertanyaan hitung validitas butir test nomor 1: Langkah-langkah penyelesaian: (1) Buat tabel persiapan menghitung validitas item sebagai berikut; (2) Hitung harga Mp



10



(3) Hitung harga Mt



(4) Hitung harga St (standar deviasi total)



Dengan demikian dapat diketahui harga standar deviasi total dengan menarik akar dari varians total di atas yaitu 1,53 (5) Hitung harga p



(6) Hitung harga q



Sehingga diperoleh:



Selanjutnya untuk menerima apakah butir tes yang dicari tersebut valid atau invalid, maka harga yang diperoleh tersebut dibandingkan dengan harga kritik yang terdapat dalam tabel statistik.



11



2. Reliabilitas Tes Menurut arti kata reliabel berarti dapat dipercaya. Berdasarkan arti kata tersebut, maka instrumen yang reliabel adalah instrumen yang hasil pengukurannya dapat dipecaya. Salah satu keriteria instrumen yang dapat dipercaya jika instrumen tersebut digunakan secara berulangulang, hasil pengukurannya tetap. Mistar dapat dipercaya sebagai alat ukur, karena berdasarkan pengalaman jika mistar digunakan dua kali atau lebih mengukur panjang sebuah benda, maka hasil pengukuran pertama dan selanjutnya terbukti tidak berbeda. Sebuah tes dapat dikatakan reliabel jika tes tersebut digunakan secara berulang terhadap peserta didik yang sama hasil pengukurannya relatif tetap sama. Secara garis besar, ada dua macam cara menentukan reliabilitas instrumen, yaitu reliabilitas eksternal dan reliabilitas internal. a. Reabilitas Eksternal Menguji reliabilitas eksternal suatu tes dilakukan dengan beberap metode diantaranya: 1) Metode Tes Ulang Metode tes ulang atau test-retest method sering pula dinamakan metode stabilitas. Metode tes ulang dilakukan dengan mengujicobakan sebuah tes kepada sekelompok peserta didik sebanyak dua kali pada waktu yang berbeda. Skor hasil uji coba pertama dikorelasikan dengan skor hasil uji coba kedua dengan menggunakan teknik korelasi Product Moment. Besar angka korelasi menunjukkan tingkat reliabilitas instrumen.



2) Metode Bentuk Paralel Metode bentuk paralel atau alternate-forms method atau double test-double trial method atau dikenal dengan juga metode ekuivalen. Metode paralel dilakukan dengan mengujicobakan dua buah instrumen yang dibuat hampir sama. Uji coba dilakukan terhadap sekelompok responden. Setiap responden mengerjakan atau mengisi kedua buah tes. Kemudian skor-skor kedua buah tes tersebut dikorelasikan dengan



12



teknik korelasi Product Moment. Angka korelasi ini menunjukkan tingkat reliabilitas instrumen. Metode paralel ini digunakan untuk mengatasi kelemahan yang terjadi pada metode tes ulang. Ketika dua tes yang digunakan ternyata berbeda, maka faktor carry-over effect tidak menjadi masalah lagi, walaupun bisa saja faktor mengingat pada jawaban tes pertama sedikit berpengaruh pada tes kedua, khususnya apabila ditemukan soal yang benar-benar mirip atau bahkan sama. 3) Metode Belah Dua Metode belah dua digunakan untuk mengatasi kelemahankelemahan yang terjadi pada metode bentuk paralel dan metode tes ulang karena metode ini memungkinkan mengestimasi reliabilitas tanpa harus menyelenggarakan tes dua kali. Terdapat beberapa teknik dalam metode belah dua antara lain: a) Formula Spearman-Brown 11



2π‘Ÿ 22 r11 = 11 1+π‘Ÿ 2 2



Keterangan : r11 = Koefisien reabilitas yang sudah disesuaikan.



π‘Ÿ



1 1 2 2



= Korelasi antara skor-skor setiap belahan tes.



Contoh: Data hasil belajar beberapa peserta didik ditunjukkan pada tabel berikut:



13



Dari data yang terdapat pada tabel di atas maka dapat dihitung koefisien reliabilitas sebagai berikut: 1)) Pembelahan Ganjil-Genap Langkah pertama adalah membuat tabel persiapan penghitungan reliabilitas sebagaimana tertera pada tabel berikut:



Langkah kedua mencari koefisien korelasi dengan menggunakan rumuskan korelasi product moment sebagai berikut:



14



Setelah harga koefisien korelasi diperoleh yaitu 0,22, maka selanjutnya dapat dihitung koefisien reliabilitas dengan formula Spearman-Brown yaitu:



2)) Pembelahan Awal-Akhir Langkah pertama adalah membuat tabel persiapan penghitungan reliabilitas sebagaimana tertera pada tabel berikut:



15



Langkah kedua mencari koefisien korelasi dengan menggunakan rumuskan korelasi product moment sebagai berikut:



16



Setelah harga koefisien korelasi diperoleh yaitu 0,10 maka selanjutnya dapat dihitung koefisien reliabilitas dengan formula Spearman-Brown yaitu:



b) Formula Flanagan



Keterangan : r11 = reliabilitas tes. 𝑆12 = varians belahan pertama (1). 𝑆22 = varians belahan kedua (2). 𝑆𝑑2 = varians total. Rumus variansnya :



Contoh : Data hasil belajar beberapa peserta didik ditunjukkan pada tabel berikut :



17



Dari data yang terdapat pada tabel di atas maka dapat dihitung koefisien reliabilitas sebagai berikut: 1)) Pembelahan Ganjil-Genap Langkah pertama adalah membuat tabel persiapan penghitungan reliabilitas sebagaimana tertera pada tabel berikut:



Langkah kedua mencari harga varians belahan pertama, varians belahan kedua dan varians total sebagai berikut: a)) Varians Belahan Pertama (Ganjil)



18



Dari data di atas dapat dihitung varians belahan pertama atau varians belahn ganjil sebagai berikut:



b)) Varians Belahan Kedua (Genap)



Dari data di atas dapat dihitung varians belahan kedua atau varians belahan genap sebagai berikut:



19



c)) Varians Total



Dari data di atas dapat dihitung varians total sebagai berikut:



Dari perhitungan varians di atas diketahui: 𝑆12 = 0,61



20



𝑆22 = 2,36 𝑆𝑑2 = 3,5 Sehingga dapat dihitung koefisien reliabilitas menggunakan formula Flanagan sebagai berikut:



2)) Pembelahan Awal-Akhir Langkah pertama adalah membuat tabel persiapan penghitungan reliabilitas sebagaimana tertera pada tabel berikut:



Langkah kedua mencari harga varians belahan pertama, varians belahan kedua dan varians total sebagai berikut: a)) Varians Belahan Pertama (Awal)



21



Dari data di atas dapat dihitung varians belahan pertama atau varians awal sebagai berikut:



b)) Varians Belahan Kedua (Akhir)



22



Dari data di atas dapat dihitung varians belahan kedua atau varians belahan akhir sebagai berikut:



c)) Varians Total



23



Dari data di atas dapat dihitung varians total sebagai berikut:



Dari perhitungan varians di atas diketahui: 𝑆12 = 0,86 𝑆22 = 2,36 𝑆𝑑2 = 3,5 Sehingga dapat dihitung koefisien reliabilitas menggunakan formula Flanagan sebagai berikut:



c) Formula Rulon



Keterangan : 𝑆𝑑2 = varians beda 𝑆𝑑2 = varians total Contoh:



24



Data hasil belajar beberapa peserta didik ditunjukkan pada tabel berikut:



Dari data yang terdapat pada tabel di atas maka dapat dihitung koefisien reliabilitas sebagai berikut: 1)) Pembelahan Ganjil-Genap Langkah pertama adalah membuat tabel persiapan penghitungan reliabilitas sebagaimana tertera pada tabel berikut:



Langkah kedua mencari harga varians beda sebagai berikut:



25



Dari tabel di atas dapat dihitung varians beda sebagai berikut:



Selanjutnya langkah ketiga adalah menghitung varians total sebagai berikut:



Dari data di atas dapat dihitung varians total sebagai berikut:



26



Dari perhitungan varians di atas diketahui:



Sehingga dapat dihitung koefisien reliabilitas menggunakan formula Rulon sebagai berikut:



2)) Pembelahan Awal-Akhir Langkah pertama adalah membuat tabel persiapan penghitungan reliabilitas sebagaimana tertera pada tabel berikut:



Langkah kedua mencari harga varians beda sebagai berikut:



27



Dari tabel di atas dapat dihitung varians beda sebagai berikut:



Selanjutnya langkah ketiga adalah menghitung varians total sebagai berikut:



Dari data di atas dapat dihitung varians total sebagai berikut:



28



Dari perhitungan varians di atas diketahui:



Sehingga dapat dihitung koefisien reliabilitas menggunakan formula Rulon sebagai berikut:



b. Reabilitas Internal Pada reliabilitas internal, uji coba dilakukan hanya satu kali dan menggunakan satu instrumen. Kemudian hasil uji coba dianalisis dengan menggunakan rumus reliabilitas instrumen. Banyak rumus-rumus yang dapat digunakan untuk mengetahui tingkat reliabilitas. Akan tetapi pada pembahasan ini diperkenalkan hanya dua buah rumus, yaitu rumus KR 21 dan rumus Alpha. 1) Menentukan Tingkat Reliabilitas Instrumen dengan Rumus KR 21 Rumus KR 21 digunakan apabila alternatif jawaban pada instrumen bersifat dikotomi, misalnya benar-salah dan pemberian skor = 1 dan 0. Contoh penggunaan rumus KR 21. Langkah pertama tes hasil uji coba diberi skor-skor, kemudian didistribusikan ke dalam tabel kerja sebagai berikut:



29



Langkah kedua menghitung varians skor total (𝑆𝑑2 ) dengan rumus:



Langkah ketiga menghitung reliabilitas instrumen dengan rumus KR 21 :



Keterangan : r11 = reliabilitas instrumen n = banyaknya butir soal M = mean/rata-rata skor 𝑆𝑑2 = varians total Jika dimasukkan ke rumus maka perhitungannya:



30



2) Menentukan tingkat reliabilitas tes dengan rumus Alpa. Rumus Alpa digunakan untuk mencari reliabilitas instrumen yang skornya merupakan rentangan 0 - 10, 0 - 100 atau berbentuk skala 1 - 3, 1 - 5 atau 1 - 10. Rumus alpha:



Sebagai contoh perhitungan berikut ini disajikan tabel analisis 5 butir pertanyaan atau butir soal dari 10 orang peserta didik.



31



Sebelum dicari angka reliabilitasnya, perlu terlebih dahulu dicari varians butir dan varians skor total dengan rumus:



Untuk memperoleh jumlah varians butir dicari dulu varians setiap butir, kemudian dijumlahkan.



32



Dengan demikian diperoleh total varian butir adalah:



Sedangkan varians total dihitung sebagai berikut :



33



Selanjutnya harga-harga yang diperoleh dimasukkan ke dalam rumus Alpha sebagai berikut:



Dengan demikian diperoleh koefisien reliabilitas tes sebesar 0,91. Selanjutnya dengan merujuk Sudijono (2002) suatu tes dikatakan reliabel apabila koefisien β‰₯ 0,70. Dengan demikian tes tersebut reliabel.



C. Taraf Kesukaran Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. adanya keseimbangan dari tingkat kesulitan soal tersebut. Keseimbangan yang dimaksudkan adalah adanya soal-soal yang termasuk mudah, sedang, dan sukar secara proporsional. Tingkat kesukaran soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawabnya, bukan dilihat dari sudut guru sebagai pembuat soal. Secara tentatif dapat dikatakan bahwa salah satu ciri butir soal yang baik adalah bahwa ia tidak terlalu sukar dan tidak terlalu mudah untuk kelompok tertentu yang akan dites. Cara yang dapat ditempuh untuk mengetahui apakah item tes hasil belajar itu sudah memiliki tingkat kesukaran yang memadai ataukah belum, maka dapat diketahui dari besar kecilnya indeks



34



kesukaran item (difficulty index). Indeks kesukaran item adalah bilangan atau angka yang menunjukkan sukar dan mudahnya suatu item soal. Suke Silverius menyebutkan bahwa tingkat kesukaran item adalah persentase siswa yang dapat menjawab benar butir soal tersebut. Dari beberapa pengertian di atas, dapat disimpulkan tingkat kesukaran adalah seberapa besar tingkat kesulitan/kesukaran suatu butir soal yang ditunjukkan dengan persentase siswa yang menjawab benar terhadap butir soal tersebut (Khaerudin, 2015). Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi, karena diluar jangkauannya. Misalnya saja guru A memberikan ulangan soalnya, mudahmudah, sebaliknya guru B kalau memberikan ulangan soal-soalnya sukar-sukar. Dengan pengetahuannya dengan kebiasaan ini maka siswa akan belajar giat jika menghadapi ulangan dari guru B dan sebaliknya jika akan mendapat ulangan dari guru A tidak mau belajar giat atau bahkan mungkin tidak mau belajar sama sekali. Bilangan yang menunjukkan sukar dan mudahnya suatu soal disebut Bilangan yang menunjukkan sukar dan mudahnya suatu soal indeks kesuakaran (Diffuculty index). Besarnya indeks kesukaran antara 0,00 disebut indeks kesuakaran (Diffuculty index). Besarnya indeks kesukaran sampai dengan 1,0. Indeks kesukaran ini menunjukkan taraf kesukaran soal antara 0,00 sampai dengan 1,0. Indeks kesukaran ini menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran 0,0 menunjukkan Soal dengan indeks kesukaran 0,0 menunjukkan bahwa soal itu terlalu sukar, bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwasebaliknya indeks 1,0 menunju mau belajar sama sekali (Asrul et al., 2014).



0,0 sukar



1,0 mudah



Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P (P besar), Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P (P singkatan dari besar), singkatan dari kata β€œProporsi”. Dengan demikian maka soal dengan P = 0,20. Sebaliknya soal dengan P = 0,30 lebih sukar dari pada soal dengan P = 0,80. Adapun rumus mencari P adalah



35



P=



𝐡 𝐽𝑆



Dimana: P = indeks kesukaran. B = Banyaknya siswa yang menjawab soal itu dengan betul JS = Jumlah seluruh siswa peserta tes Misalnya : Ada 20 orang dengan nama kode A-T yang mengajarkan tes yang terdiri dari 20 soal. Jawaban tesnya dianalisa dan jawabannya tertera seperti



Nomor Soal 1



2



3



4



5



6



7



8



9



10 11 12 13 14 15 16 17 18 19 20



A 1 1 B 0 1 C 1 1 D 0 1 E 1 1 F 0 0 G 1 0 H 0 0 I 1 1 J 0 1 K 1 1 L 0 0 M 1 0 N 0 1 O 1 1 P 0 1 Q 1 0 R 0 1 S 1 1 T 0 1 J L 10 14 H



0 0 0 0 0 0 0 0 1 1 0 1 0 1 0 0 0 0 0 0



0 0 0 0 0 1 1 1 1 1 1 0 0 0 0 0 0 1 1 1



1 1 1 1 1 1 0 0 1 1 0 0 1 1 1 1 0 1 1 1



0 0 1 1 0 1 0 0 0 0 0 1 0 1 0 1 0 0 0 0



1 1 1 0 1 0 1 1 1 1 1 0 1 1 1 1 0 1 1 1



1 1 0 1 1 0 1 1 1 0 0 0 1 1 0 0 1 1 1 1



0 0 0 1 1 0 0 0 1 1 0 0 1 0 1 0 0 0 1 0



1 0 1 0 1 0 1 0 1 0 1 0 1 1 1 0 1 1 0 0



1 0 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 0



1 0 1 0 1 0 1 0 1 1 1 0 0 0 0 0 0 0 0 0



1 0 0 0 1 1 1 1 0 0 1 1 1 1 1 0 0 0 1 0



4



9



15



6



18 17



7



11 10 18 20 10 9



7



10 14 13 13



1 1 0 0 1 1 0 0 0 1 0 0 1 1 0 0 1 1 0 0



0 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1



0 1 0 1 1 0 1 0 1 1 0 0 0 1 0 1 0 0 1 1



1 1 1 1 1 0 0 0 1 1 0 0 1 1 1 0 1 1 1 1



0 1 1 1 1 0 1 1 1 1 1 0 0 1 1 1 1 0 0 0



1 1 1 0 0 0 1 1 1 0 0 0 1 1 0 1 1 1 1 1



Sekor Siswa



Siswa



dibawah ini. (I= Jawaban betul, 0 = Jawaban salah)



13 11 12 9 14 8 13 9 17 13 10 4 13 16 12 10 9 11 14 10



Dari tabel yang disajikan di atas dapat ditafsirkan bahwa : - Saol nomor 1 mempunyai taraf kesukaraan



10 20



= 0,5



- Soal nomor 13 adalah soal yang paling mudah karena seluruh siswa peserta tes dapat menjawab :



36



Indeks kesukarannya



20 20



= 1,0



Menurut ketentuan yang sering diikuti, indeks kesukaraan sering diklasifikasikan sebagai berikut: Β· Soal dengan P 0,00 sampai 0,30 adalah soal sukar Β· Soal dengan P 0,30 sampai 0,70 adalah soal sedang Β· Soal dengan P 0,70 sampai 1,00 adalah soal mudah Walaupun demikian itu yang berpendapat bahwa: soal-soal yang dianggap baik, yaitu soal-soal sedang, adalah soal-soal yang mempunyai indeks kesukaraan 0,30 sampai dengan 0,70 (Asrul et al., 2014).



D. Daya Pembeda Daryanto (2010:183) menjelaskan bahwa daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa yang pandai (upper group) dengan siswa- siswa yang termasuk kelompok kurang (lower group). Adapun menurut Sudijono (2009:386), mengetahui daya pembeda item itu penting sekali, sebab salah satu dasar yang dipegangi untuk menyusun butir-butir item tes hasil belajar adalah adanya anggapan, bahwa kemampuan antara testee yang satu dengan testee yang lain itu berbeda-beda, dan bahwa butir-butir item tes hasil belajar itu haruslah mampu memberikan hasil tes yang mencerminkan adanya perbedaan-perbedaan kemampuan yang terdapat di kalangan testee tersebut. Dari beberapa pendapat di atas dapat disimpulkan bahwa daya pembeda soal adalah kemampuan suatu soal untuk membedakan siswa yang memiliki kemampuan tinggi dengan siswa yang memiliki kemampuan rendah (Yani, Asri, & Burhan, 2013). Angka yang menunjukkan besarnya beda pembeda disebut indeks Diskriminasi, disingkat D. Seperti halnya indeks kesukaraan, indeks diskriminasi (daya pembeda) ini berkisar antara 0,00 sampai 1,00 hanya bedanya indeks kesukaraan tidak mengenal tanda negative. Tanda negative pada indeks diskriminasi digunakan jika sesuatu soal β€œterbalik” menunjukkan kualitas tester yaitu anak pandai disebut bodoh dan anak bodoh disebut pandai.



37



Dengan demikian, interpretasi indeks daya beda yang digunakan adalah sebagai berikut: D : 0,00 0,20 = jelek D : 0.20 0,40 = cukup D : 0,40 0,70 = baik D : 0,70 1,00 = baik sekali D : negatif (-) = tidak baik. Bagi sesuatu soal dapat dijawab benar oleh siswa pandai maupun siswa bodoh, maka soal itu tidak baik karena tidak mempunyai daya pembeda. Demikian pula jika semua baik yang pandai maupun yang bodoh tidak dapat menjawab dengan benar, soal tersebut tidak baik, juga karena tidak mempunyai daya pembeda. Soal yang baik adalah soal yang dijawab benar oleh siswa-siswa yang pandai saja. Seluruh pengikut tes dikelompokkan menjadi 2 kelompok yaitu kelompok pandai atau kelompok atas (upper group) dan kelompok bodoh atau kelompok bawah (lower group) 1. Cara menentukan daya pembeda (nilai D) Untuk ini perlu dibedakan antara kelompok kecil (kurang dari 100) dan kelompok besar (100 orang ke atas). a. Untuk Kelompok Kecil Seluruh kelompok tester dibagi dua sama besar, 50% kelompok atas dan 50% kelompok bawah. Contoh : Siswa



Sekor



A



9



B



8



C



7



D



7



E



6



F



5



G



5



H



4



I



4



J



3



Kelompok Atas (JA)



Kelompok Bawah (JB)



38



Seluruh pengikut tes, dideretkan mulai dari skor teratas sampai terbawah, lalu dibagi dua.



b. Untuk Kelompok Besar Mengingat biaya dan waktu untuk menganalisa, maka untuk kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor teratas sebagai kelompok atas (JA) dan 27% skor terbawah sebagai kelompok bawah (JB). JA = Jumlah kelompok atas JB = Jumlah kelompok bawah Contoh : 9 9 8 8 8



27 % sebagai JA



. -



. . .



27 % sebagai JB



2 1 1 1 0 Rumus mencari D .Rumus untuk menentukan indeks diskriminasi adalah :



39



Dimana J : Jumlah peserta tes JA : Banyaknya peserta kelompok atas JB : Banyaknya peserta kelompok bawah BA : Banyaknya peserta kelompok atas yang menjawab soal itu dengan benar. BB : Banyaknya peserta kelompok bawah yang menjawab soal itu PA :



𝐡𝐴 𝐽𝐴



= Banyaknya peserta kelompok atas yang menjawab benar (ingat P



sebagai symbol indeks kesukaran). PB :



𝐡𝐡 𝐽𝐡



= Proporsi peserta kelompok bawah yang menjawab benar. Contoh Perhitungan : Dari hasil analisa tes yang terdiri dari 10



butir soal yang dikerjakan oleh 20 orang siswa, terdapat dalam tabel sebagai berikut :



Tabel analisa 10 butir soal, 20 orang siswa. Nilai Sosial



Siswa



Kelom Pok



1



2



3



4



5



6



7



8



9



Skor 10 Siswa



A



B



1



0



1



0



0



0



1



1



1



0



5



B



A



0



1



1



1



1



1



0



0



1



1



7



C



A



1



0



1



0



1



1



1



1



1



1



8



D



B



0



0



1



0



0



1



1



1



1



1



5



E



A



1



1



1



1



1



1



1



1



1



1



10



F



B



0



1



0



0



0



1



1



1



1



1



6



G



B



0



1



0



0



0



1



1



1



1



1



6



H



B



0



1



1



0



0



1



0



1



1



1



6



I



A



1



1



1



0



0



1



1



1



1



1



8



J



A



1



1



1



1



0



0



1



0



1



1



7



K



A



1



1



1



0



0



1



1



1



1



0



7



L



B



0



1



0



1



1



0



0



1



1



0



5



40



M



B



0



1



0



0



0



0



0



1



1



0



3



N



A



0



0



1



0



1



1



1



1



1



1



7



O



A



1



1



0



1



1



1



1



1



1



1



9



P



B



0



1



0



0



0



1



0



0



1



0



3



Q



A



1



1



0



1



0



1



1



1



1



1



8



R



A



1



1



1



1



0



1



1



1



1



0



8



S



B



1



0



1



0



0



1



1



1



1



0



6



T



B



0



1



0



1



0



1



1



1



1



0



6



11 15 12



8



6



16 15 17 20 10



Jumlah



Berdasarkan nama-nama siswa tersebut dapat kita peroleh skorskor sebagai berikut : A=5



F=6



K=7



P=3



B=7



G=6



L=5



Q=8



C=8



H=6



M= 3



R=8



D=5



I=8



N=7



S=6



E = 10



J=7



O=0



T=6



Dari angka-angka yang belum teratur kemudian dibut array (uraian penyebaran), dari skor yang paling tinggi ke skor yang paling rendah. Kelompok Atas



Kelompok Bawah



10



6



9



6



8



6



8



6



8



6



8



5



7



5



7



5



7



3



7



3



10 orang



10 orang



41



Ini menunjukkan adanya kelompok atas (JA) dan kelompok bawah (JB) dengan pemilikannya sebagai berikut : Kelompok (JA)



Kelompok (JB)



B=7



A=5



C=8



D=5



E = 10



F=6



I=8



G=6



J=7



H=6



K=7



L=5



N=7



M =3



O=9



P=3



Q=8



S=6



R=8



T=6



β€”β€”β€” 10 Orang



β€”β€”β€” 10 Orang



Mari kita perhatikan lagi tabel analisa, khusus untuk butir soal nomor 1. - Dari kelompok atas yang menjawab betul 8 orang - Dari kelompok bawah yang menjawab betul 3 orang Kita terapkan dalam rumus indeks diskriminasi : JA = 10 JB = 10 P = 0,8 PB = 0,3 BA = 8 BB = 3 Maka D = PA – PB = 0,8 – 0,3 = 0,5 Butir soal ini jelek karena lebih banyak dijawab benar oleh kelompok bawah dibandingkan dengan jawaban kelompok atas. Ini berarti bahwa untuk menjawab soal dengan benar dapat dilakukan dengan menebak: Butir- butir soal yang baik adalah butir-butir soal yang mempunyai indeks diskriminasi 0,4 sampai 0,7 Klasifikasi Daya Pembeda



D : 0,00 0,20 = jelek D : 0.20 0,40 = cukup D : 0,40 0,70 = baik 42



D : 0,70 1,00 = baik sekali D : negatif (-) = tidak baik, semuanya tidak wajib, jadi semua butir soal yang mempunyai nilai D negative sebaiknya dibuang saja.



43



BAB III PENUTUP A. Kesimpulan Salah satu cara untuk memperbaiki proses pembelajaran yang paling efektif ialah dengan jalan mengevaluasi tes hasil belajar yang di peroleh dari proses pembelajaran itu sendiri. Dengan kata lain, hasil tes itu kita olah sedemikian rupa sehingga dari hasil pengolahan itu dapat di ketahui komponenkomponen manakah dari proses pembelajaran itu yang masih lemah. Tes Hasil belajar dikatakan baik apabila telah memiliki reliabitas atau bersifat reliabel. Apabila istilah tersebut dikaitkan dengan fungsi tes sebagai alat ukur mengenai keberhasilan belajar peserta didik, maka sebuah tes tersebut dapat dinyatakan reliable apabila hasil-hasil pengukuran yang dilakukan dengan menggunakan tes tersebut secara berulang kali terhadap subyek yang sama, senantiasa menunujukkan hasil yang tetap sama atau sifatnya ajeg dan stabil. Hasil belajar adalah prosedur sistematis untuk mendapatkan informasi yang digunakan dalam pengambilan keputusan yang dinyatakan dalam nilai atau angka berdasarkan hasil yang dicapai melalui proses belajar.



44



DAFTAR PUSTAKA Asrul, Ananda, R., & Rosnita. (2014). Evaluasi Pembelajaran. Badriyah, N. L., Thamrin, A. ., & Nurhidayati, A. (2018). Analisis Instrumen Penilaian Hasil Belajar Mata Pelajaran Gambar Teknik Siswa Kelas X Sekolah Menengah. IJCEE, 4(2), 93–102. Hardiani, I. N. (2017). Pengembangan Instrumen Penilaian Pembelajaran IPS Kelas IV SD. E-Jurnalmitrapendidikan, 1(6), 615–628. Khaerudin. (2015). Kualitas Instrumen Tes Hasil Belajar. Jurnal Madaniyah, 2, 212–235. Sanova, A., Bakar, A., & Afrida. (2017). Standarisasi Instrumen Penilaian Hasil Belajar dengan Anates V4 Bagi-Guru SMPN 17 Kota Jambi. Jurnal Pengabdian Pada Masyarakat, 2(1), 1–10. Solichin, M. (2017). Analisis Daya Beda Soal, Taraf Kesukaran, Validitas Butir Tes dan Validitas Ramalan dalam Evaluasi Pendidikan. Jurnal Manajemen Dan Pendidikan Islam, 2(2), 192–213. Yani, A., Asri, A. F., & Burhan, A. (2013). Analisis Tingkat Kesukaran, Daya Pembeda dab Fungsi Distraktor Soal Ujian Semester Ganjil Mata Pelajaran Produktif di SMK NEGERI 1 INDRALAYA UTARA Tahun 2012/2013, 98–115.



45