Validitas Dan Reliabilitas [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

TUGAS MAKALAH EVALUASI PROSES DAN HASIL PEMBELAJARAN KIMIA “Validitas dan Reliabilitas”



DISUSUN OLEH KELOMPOK 10 NAMA : 1. Jon Faizal



(06101981722068)



2. M. Yudharsyah



(06101181722003)



3. Multi Ermaika Islami



(06101281722040 06101281722040)



DOSEN PENGAMPUH PENGAMP



: Dr. Effendi Nawawi, M.Si.



PROGRAM STUDI PENDIDIKAN KIMIA FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS SRIWIJAYA 2020



KATA PENGANTAR Puji syukur penulis panjatkan kehadirat Tuhan YME, berkat rahmat dan karunia-Nyalah Penulis dapat menyelesaikan makalah ini dengan judul Tugas Makalah Evaluasi Proses Dan Hasil Pembelajaran Kimia “Validitas dan Reliabilitas”. Pada kesempatan ini penulis menyampaikan ucapan terima kasih kepada Dosen Pengampu yang telah bersedia memberikan waktunya, perhatiannya, serta bimbingannya dalam penyelesaian makalah ini. Penulis juga mengucapkan terima kasih kepada semua pihak yang telah memberikan bantuan dan dukungannya hingga makalah ini dapat diselesaikan. Penulis



menyadari makalah ini



masih



banyak



kekurangan,



karena



terbatasnya ilmu yang dimiliki, untuk itu penulis mengharapkan kritik dan saran yang bersifat membangun untuk lebih menyempurnakan makalah kami di masa yang akan datang. Akhirnya, Penulis berharap semoga makalah ini dapat memberikan sumbangsih serta manfaat bagi kita semua.



Indralaya, Februari 2020



Penulis



DAFTAR ISI Halaman KATA PENGANTAR .....................................................................................



ii



DAFTAR ISI ....................................................................................................



iii



BAB I PENDAHULUAN A. Latar Belakang .................................................................................



1



B. Rumusan Masalah ...........................................................................



2



C. Tujuan...............................................................................................



2



BAB II PEMBAHASAN A. Pengertian Validitas ….. ...................................................................



3



B. Pengertian Reliabilitas………………………...................................



5



C. Jenis Validitas Dan Reliabilitas…………………….........................



7



D. Fungsi Validitas Dan Reliabilitas………………………. ................



14



E. Faktor Mempengaruhi Validitas dan Reliabilitas…………………. .



14



F. Uji Validitas Dan Reliabilitas………………………. .......................



15



BAB III PENUTUP A. Kesimpulan ......................................................................................



DAFTAR PUSTAKA



22



BAB I PENDAHULUAN A. Latar Belakang Persoalan alat ukur yang digunakan evaluator ketika melakukan kegiatan evaluasi sering dihadapkan pada persoalan akurasi, konsisten dan stabilitas sehingga hasil pengukuran yang diperoleh bisa mengukur dengan akurat sesuatu yang sedang diukur. Instrumen ini memang harus memiliki akurasi ketika digunakan. Konsisten dan stabil dalam arti tidak mengalami perubahan dari waktu pengukuran satu ke pengukuran yang lain. Perkembangan konsep penilaian pendidikan yang ada pada saat ini menunjukkan arah yang lebih luas. Penilaian program pendidikan menyangkut penilaian terhadap tujuan pendidikan, isi program, strategi pelaksanaan program dan sarana pendidikan. Penilaian proses belajar mengajar menyangkut penilaian terhadap kegiatan guru, kegiatan siswa, pola interaksi guru siswa dan keterlaksanaan program belajar mengajar. Sedangkan penilaian hasil belajar menyangkut hasil belajar jangka pendek dan hasil belajar jangka panjang. Dengan demikian, inti penilaian adalah proses memberikan atau menentukan nilai kepada objek tertentu berdasarkan suatu kriteria tertentu. Proses pemberian nilai tersebut berlangsung, baik dalam bentuk validitas maupun reliabilitas. Keberhasilan mengungkapkan hasil dan proses belajar siswa sebagaimana adanya (objektivitas hasil penilaian) sangat tergantung pada kualitas alat penilaiannya di samping pada cara pelaksanaannya. Data yang kurang memiliki validitas, akan menghasilkan kesimpulan yang bisa, kurang sesuai dengan yang seharusnya, dan bahkan bisa saja bertentangan dengan kelaziman. Untuk membuat alat ukur instrumen itu, diperlukan kajian teori, pendapat para ahli serta pengalaman-pengalaman yang kadangkala diperlukan bila definisi operasional variabelnya tidak kita temukan dalam teori. Alat ukur atau instrumen yang akan disusun itu tentu saja harus memiliki validitas, agar data yang diperoleh dari alat ukur itu bisa reliabel, valid dan disebut dengan validitas.



Pada makalah ini akan dibahas mengenai analisis soal berupa validitas dan reliabilitas yang berguna sebagai pedoman bagi pendidikan dalam melakukan analisis soal terutama untuk soal objektif.



B. Rumusan Masalah 1. Apa pengertian dari validitas dan reliabilitas? 2. Apa saja jenis validitas dan reliabilitas ? 3. Apa saja fungsi validitas dan reliabilitas? 4. Apa saja faktor mempengaruhi validitas dan reliabilitas? 5. Bagaimanakah uji validitas dan reliabilitas?



C. Tujuan 1. Mengetahui apa yang dimaksud dengan validitas dan reliabilitas. 2. Mengetahui pembagian validitas dan reliabilitas. 3. Mengetahui fungsi validitas dan reliabilitas. 4. Mengetahui faktor mempengaruhi validitas dan reliabilitas. 5. Mengetahui uji validitas dan reliabilitas.



BAB II PEMBAHASAN A. Pengertian Validitas Menurut Azwar (1986), Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran. Terkandung di sini pengertian bahwa ketepatan validitas pada suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel A’ atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A’ atau B (Azwar 1986). Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut. Cermat berarti bahwa pengukuran itu dapat memberikan gambran mengenai perbedaan yang sekecil-kecilnya mengenai perbedaan yang satu dengan yang lain. Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas agar hasil penimbangannya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak akan terlihat pada alat ukur berat badan. Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan



menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai angka yang sebenarnya atau angka yang mendekati keadaan yang sebenarnya (Azwar 1986). Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran. Oleh karena itu, tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Dengan demikian, anggapan valid seperti dinyatakan dalam “alat ukur ini valid” adalah kurang lengkap. Pernyataan valid tersebut harus diikuti oleh keterangan yang menunjuk kepada tujuan (yaitu valid untuk mengukur apa), serta valid bagi kelompok subjek yang mana. Pengertian validitas menurut Walizer (1987) adalah tingkaat kesesuaian antara suatu batasan konseptual yang diberikan dengan bantuan operasional yang telah dikembangkan. Menurut Aritonang R. (2007) validitas suatu instrumen berkaitan dengan kemampuan instrument itu untuk mengukur atu mengungkap karakteristik dari variabel yang dimaksudkan untuk diukur. Instrumen yang dimaksudkan untuk mengukur sikap konsumen terhadap suatu iklan, misalnya, harus dapat menghasilkan skor sikap yang memang menunjukkan sikap konsumen terhadap iklan tersebut. Jadi, jangan sampai hasil yang diperoleh adalah skor yang menunjukkan minat konsumen terhadap iklan itu. Validitas suatu instrumen banyak dijelaskan dalam konteks penelitian sosial yang variabelnya tidak dapat diamati secara langsung, seperti sikap, minat, persepsi, motivasi, dan lain sebagainya. Untuk mengukur variabel yang demikian sulit, untuk mengembangkan instrumen yang memiliki validitas yang tinggi karena karakteristik yang akan diukur dari variabel yang demikian tidak dapat diobservasi secara langsung, tetapi hanya melalui indikator (petunjuk tak langsung) tertentu. Menurut Masri Singarimbun, validitas menunjukkan sejauh mana suatu alat pengukur itu mengukur apa yang ingin diukur. Bila seseorang ingin mengukur berat suatu benda, maka dia harus menggunakan timbangan. Timbangan adalah alat pengukur yang valid bila dipakai untuk mengukur berat, karena timbangan memang mengukur berat. Bila panjang sesuatu benda yang ingin diukur, maka dia



harus menggunakan meteran. Meteran adalah alat pengukur yang valid bila digunakan untuk mengukur panjang, karena memang meteran mengukur panjang. Tetapi timbangan bukanlah alat pengukur yang valid bilamana digunakan untuk mengukur panjang. Sekiranya penelliti menggunakan kuesioner di dalam pengumpulan data penelitian, maka kuesioner yang disusunnya harus mengukur apa yang ingin diukurnya. Setelah kuesioner tersebut tersusun dan teruji validitasnya, dalam praktek belum tentu data yang dikumpulkan adalah data yang valid. Banyak halhal lain yang akan mengurangi validitas data; misalnya apakah si pewawancara yang mengumpulkan data betul-betul mengikuti petunjuk yang telah ditetapkan dalam kuesioner. Menurut



Suharsimi



Arikunto,



validitas



adalah



keadaan



yang



menggambarkan tingkat instrumen bersangkutan yang mampu mengukur apa yang akan diukur. Menurut Soetarlinah Sukadji, validitas adalah derajat yang menyatakan suatu tes mengukur apa yang seharusnya diukur. Validitas suatu tes tidak begitu saja melekat pada tes itu sendiri, tapi tergantung penggunaan dan subyeknya. Validitas adalah sutu ukuran yang menunjukkan tingkat ke validan atau kesahihan suatu instrmen. Suatu instrumen yang valid itu mempunyai validitas yang tinggi dan sebaliknya bila tingkat validitasnya rendah maka instrumen tersebut kurang valid. Sebuah instrumen dikatakan valid apabla mampu mengukur apa yang hendak diukur/ diinginkan. Sebuah instrumen dikatan valid apabila bisa mengungkap data dari variabel yang diteliti. Validitas instrumen terbagi dalam validitas internal,(validitas konstruk /constract validity dan validitas isi / contect validity) dan validitas eksternal / empiris.



B. Pengertian Reliabilitas Reliabilitas adalah indeks yang menunjukan sejauh mana suatu alat ukur dipercaya atau dapat diandalkan. Reliabilitas mengacu pada keajegan hasil evaluasi, yakni konsistensi skor tes (test score) dari masa ke masa.jika seorang guru memperoleh skor yang sama pada tes yang sama pada kelompok siswa yang sama pada waktu yang berbeda, maka dia dapat menyimpulkan bahwa hasil tes itu



memiliki derajat reliabilitas tes yang tinggi dari suatu masa ke masa. Konsistensi hasil evaluasi itu menjadi sangat berharga. Jika didasarkan pada data yang valid dan ditetapkan secara objektif. Suatu hasil evaluasi pada umumnya tidak pernah mencapai konsistensi secara sempurna. Beberapa jenis pengukuran tentu memiliki berbagai jenis kesalahan ada bebrapa faktor berkaitan dengan karakteristik yang bersifat temporer atau permanen. Sumber lain berkaitan dengan karakteristik tes itu atau cara melaksanakan ujian, penskoran dan penafsiran hasil ujian. Reliabilitas menunjuk pada sesuatu pengertian bahwa suatu instrumen dapat dipercaya untuk digunakan sebagai alat pengumpul data karena instrumen tersebut sudah dianggap baik. Intrumen yang baik tidak mungkin bersifat tendenslus



mengarahkan



responden



untuk



memilih



jawaban-jawaban



tertentu.reliabel artinya dapat dipercaya juga dapat diandalkan. Sehingga beberapa kali diulang pun hasilnya akan tetap sama ( konsisten). Pengujian reabilitas dapat dilakukan secara eksternal (staility/test pretest, equivalent atau gabungan kedunya) dan secara inernal (analisis konsistensi butir-butir yang ada pada instrumen). Reliabilitas mengacu pada sejauh mana hasil pengukuran, perhitungan, atau spesifikasi dapat bergantung pada akurat atau konsistensi hasil tes. Oleh karena itu, kami dapat mengklaim bahwa tes dapat diandalkan jika hasil tes yang dihasilkan konsisten tanpa berubah setiap waktu. Oleh karena itu, singkatnya, reliabilitas adalah parameter yang dapat kita gunakan untuk mengukur stabilitas atau konsistensi tes dari hasil tesnya. Jadi, jika kita mengambil contoh yang sama yang kita ambil sebelumnya, jika hasil tesnya sama bahkan ketika kita melakukan lain waktu, menggunakan subjek tes yang sama, maka kita dapat mengatakan bahwa tes tersebut dapat diandalkan, atau reliabilitas tes tercapai . Demikian pula, jika hasil penelitian penelitian direplikasi secara konsisten, maka hasil atau temuan tes dapat diandalkan. Selain itu, koefisien korelasi dapat digunakan untuk menilai tingkat reliabilitas. Dengan demikian, teorinya adalah bahwa jika suatu tes dapat diandalkan, ia harus menunjukkan korelasi positif yang tinggi.



C. Jenis Validitas dan Reliabilitas Didalam buku Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B. Anderson dan kawan-kawan disebutkan A test is valid if it measures what it purpose to measure. Atau jika diartiakan lebih kurang demikian: sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur.Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu sendiri tetapi pada hasil pengetesan atau skornya. Contoh: Skor yang diperoleh dari hasil mengukur kemampuan mekanik akan menunjukkan kemampuan seseorang dalam memegang dan memperbaiki mobil, bukan pengetahuan orang tersebut dalam hal yang berkaitan dengan mobil. Tes yang mengukur pengetahuan tentang mobil bukanlah tes yang sahih untuk mekanik. Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil pengalaman. Hal yang pertama akan diperoleh validitas logis (logical validity) dan hal yang kedua diperoleh validitas empiris (empirical validity). Dua hal inilah yang dijadikan dasar pengelompokkan validitas tes. 1. Validitas tes a. Validitas logis Istilah “validitas logis” mengandung kat “logis” berasal dari kata “logika”, yang berarti penalaran. Dengan makna demikian maka validitas logis untuk sebuah instrument evaluasi menunjuk pada kondisi bagi sebuah instrument yang memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi valid tersebut dipandang ter[penuhi karena instrument yang bersangkutan sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah karangan, jika penulis sudah mengikuti aturan mengarang, tentu secara logis karangannya sudah baik. Berdasarkan penjelasan tersebut maka instrument yang sudah disusun berdasarkan teori penyusunan instrument, secara logis sudah valid. Dari penjelasan tersebut kita dapat memahami bahwa validitas logis dapat dicapai apabilainstrumen disusun mengikuti ketentuan yang ada. Dengan demikian, dapat disimpulkan bahwa validitas logis tidak perlu diuji



kondisinya tetapi langsung diperoleh sesudah instrument tersebut selesai disusun. Ada 2 macam validitas logis yang dapat dicapai oleh sebuah instrument, yaitu: validitas isi dan validiats konstrak (construct validity). Validitas isi bagi sebauh instrument menunjuk suatu kondisi sebuah instrument yang disusun berdasarkan isi materi pelajaran yang di evaluasi. Selanjtnya validitas konstrak sebuah instrument menunjuk suatu kondiusi sebuah instrument yang disusun berdasarkan kontrak aspek-aspek kejiwaan yang seharusnya dievaluasi. Penjelasan lebih jauh tentang kedua jenis validitas logis ini akan diberikan berturut-turut dalam membahas jenis-jenis validitas instrument mati. b. Validitas empiris Istilah “validitas empiris” memuat kata “empiris” yang artinya “pengalaman”. Sebuah instrument dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Sebagai conyoh sehari-hari, seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa seseorang tersebut memang jujur. Contoh lain, seseorang dapat dikatakan kreatif apabila dari pengalaman dibuktikan bahwa orang tersebut sudah banyak menghasikan ide-ide baru yang diakui berbeda dari hal-hal yang sudah ada. Dari penjelasan dan contoh-contoh tersebut diketahui bahwa validitas empiris tidak dapat diperoleh hanya dengan menyusun instrument berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktikan melalui pengalaman. Ada 2 macam validiatas empiris, yakni ada dua cara yang dapat dilakukan untuk menguji bahwa sebuah instrument memang valid. Pengujian tersebut dilakukan dengan membandingkan kondisi instrument yang bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang digunakan sebagai pembanding kondisi instrument dimaksud ada dua, yaitu: yang sudah tersedia dan yang belum ada tetapi akan terjadi di waktu yang akan datang. Bagi instrument yang kondisinya sesuai dengan kriterium yang sudah tersedia, yang sudah ada, disebut memiliki validitas “ada sekarang”, yang dalam istilah bahasa Inggris disebut memiliki concurrent validity. Selanjutnya instrument



yang kondisinya sesuai dengan kriterium yang diramalkan akan terjadi, disebut memiliki validitas ramalan atau validitas prediksi, yang dalam istilah bahasa Inggris disebut memiliki predictive validity. Dari uraian adanya 2 jenis validiats, yakni validitas logis yang ada dua macam, dan validitas empiris, yang juga ada dua macam, maka secara keseluruhan kita mengenal adanya empat validitas, yaitu: 1) Validitas isi Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum maka validitas isi ini sering juga disebut validitas kurikuler. Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara memerinci materi kurikulum atau materi buku pelajaran. 2) Vailiditas konstrak Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam Tujuan Instruksional Khusus. Dengan kata lain jika butir-butir soal mengukur aspek berpikir tersebut sudah sesuai dengan aspek berpikir yang menjadi tujuan instruksional. Sebagai contoh jika rumusan Tujuan Instruksional Khusus (TIK): “Siswa dapat membandingkan antara efek biologis dan efek psikologis”, maka butir soal pada tes merupakan perintah agar siswa membedakan antara dua efek tersebut. “Konstruksi” dalam pengertian ini bukanlah “susunan” seperti yang sering dijumpai dalam teknik, tetapi merupakan rekaan psikologis yaitu suatu rekaan yang dibuat oleh para ahli Ilmu Jiwa yang dengan sutau cara tertentu “memerinci’ isi jiwa atas beberapa aspek seperti: ingatan (pengetahuan), pemahaman, aplikasiu, dan seterusnya. Dalam hal ini, mereka



menganggap



seolah-olah



jiwa



dapat



dibagi-bagi.



Tetapi



sebenarnya tidak demikian. Pembagian ini hanya merupakan tindakan sementara untuk mempermudah mempelajari.



Seperti halnya validitas isi, validitas konstruksi dapat diketahui dengan cara memerinci dan memasangkan setiap butir soal dengan setiap aspek dalam



TIK.



Pengerjaanya



dilakukan



berdasarkan



logika,



bukan



pengalaman. Dalam pembicaraan mengenai penyusunan tes hal ini akan disinggung lagi. 3) Validitas “ada sekarang”, Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah “sesuai” tentu ada dua hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang, concurrent). Dalam membandingkan hasil sebuah tes maka diperlukan suatu kriterium atau alat banding. Maka hasil tes merupakan sesuatu yang dibandingkan. Misalnya seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk ini diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki. Masalnya nilai ulangan harian atau nilai ulangan sumatif yang lalu. 4) Validitas predictive Memprediksi artinya meramal, dengan meramal selalu mengenai hal yang akan datang, jadi sekarang belum terjadi. Sebuah tes dikatakan memilki validitas prediski atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan dating. Misalnya tes masuk Perguruan Tinggi adalah sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta tes dalam mengikuti kuliah di masa yang akan dating. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi tentu menjamin keberhasilannya kelak. Sebaliknya seorang calon dikatakan tidak lulus tes karena memilki nilai tes yang rendah jadi diperkirakan akan tidak mampu mengikuti perkuliahan yang akan datang.



Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran di Perguruan Tinggi. Jika ternyata siapa yang memilki nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan dengan yang dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud tidak memilki validitas prediksi.



2. Validitas butir Jika seorang peneliti atau seorang guru mengetahui bahwa validitas soal tes misalnya terlalu rendah atau rendah saja, maka selanjutnya ingin mengetahui butir-butir tes mankah yang menyebabkan soal secara keseluruhan tersebut jelek karena memiliki validitas rendah. Untuk keperluan inilah dicari butir soal. Pengertian umum untuk validitas item adalah demikian sebuah item dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total. Skor pada item menyebabkan skor total menjadi tinggi atau rendah. Dengan kata lain dapat dikemukakan di sini bahwa ssebuah item memiliki validitas yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total. Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk mengetahui validitas item digunakan rumus korelasi seperti sudah diterangkan di atas. Untuk soal-soal bentuk objektif skor untuk item biasa diberikan dengan 1 (bagi item yang dijawab benar) dan 0 (item yang dijawab salah), sedangkan skor total selanjutnya merupakan jumlah dari skor untuk semua item yang membangun soal tersebut.



TABEL ANALISIS ITEM UNTUK PERHITUNGAN VALIDITAS ITEM No



Nama



1



Butir soal/item



Skor total



1



2



3



4



5



6



7



8



9



10



Hartati



1



0



1



0



1



1



1



1



1



1



8



2



Yoyok



0



0



1



0



1



0



0



1



1



1



5



3



Oktaf



0



1



0



0



0



1



0



1



0



1



4



4



Wendi



1



1



0



0



1



1



0



0



1



0



5



5



Diana



1



1



1



1



1



1



0



0



0



0



6



6



Paul



1



0



1



0



1



0



1



0



0



0



4



7



Susana



1



1



1



1



1



1



1



0



0



0



7



8



Helen



0



1



0



1



1



1



1



1



1



1



8



Misalnya akan dihitung validitas item nomor 6, maka skor item tersebut disebut variabel X dan skor total disebut variabel Y. selanjutnya perhitungan dilakukan dengan menggunakan rumus korelasi product moment baik dengan rumus simpangan maupun angka kasar. Penggunaan kedua rumus tersebut masing-masing ada keuntungannya. Menggunakan rumus simpangan angkanya kecil-kecil, tetapi kadang-kadang pecahannya rumit. Jika skor rata-rata (mean)-nya pecahan, simpangannya cenderung banyak pecahan. Mengalikan pecahan persepuluhan ditambah dengan tanda-tanda = (plus) dan – (minus) kadang-kadang bias menyesatkan. Penggunaan rumus angka kasar bilangannya besar-besar tapi bulat. Jika ada kalkulator statistic disarankan menggunakan rumus angka kasar saja. Yang dibutuhkan hanyalah : ∑X, ∑Y, ∑X2, ∑Y2, dan ∑XY, tidak perlu membuat table seutuhnya. Salah satu syarat agar hasil suatu tes dapat dipercaya adalah tes tersebut harus mempunyai reliabilitas yang memadai. Oleh karena itu Jaali dan Pudji (2008) membedakan reliabilitas menjadi 2 macam, yaitu : 



Reliabilitas Konsistensi tanggapan, dan







Reliabilitas konsistensi gabungan item



 Reliabilitas Konsistensi Tanggapan Reliabilitas ini selalu mempersoalkan mengenai tanggapa responden atau objek terhadap tes tersebut apakah sudah baik atau konsisten. Dalam artian



apabila tes yang telah di cobakan tersebut dilakukan pengukuran kembali terhadap obyek yang sama, apakah hasilnya masih tetap sama dengan pengukuran sebelumnya. Jika hasil pengukuran kedua menunjukkan ketidakonsistenan, maka hasil



pengukuran



tersebut



tidak



mengambarkan



keadaan



obyek



yang



sesungguhnya. Untuk mengetahui apakah suatu tes atau instrument tersebut sudah mantap atau konsisten, maka tes/instrument tersebut harus diuji kepada obyek ukur yang sama secara berulang-ulang. Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan responden terhadap tes (Jaali ; 2008) yaitu : 



Teknik test-retest ialah pengetesan dua kali dengan menggunakan suatu tes yang sama pada waktu yang berbeda.







Teknik belah dua ialah pengetesan (pengukuran) yang dilakukan dengan dua kelompok item yang setara pada saat yang sama.







Bentuk ekivalen ialah pengetesan (pengukuran) yang dilakukan dengan menggunakan dua tes yang dibuat setara kemudian diberikan kepada responden atau obyek tes dalam waktu yang bersamaan.



 Reliabilitas Konsistensi Gabungan Item Reabilitas ini terkait dengan konsistensi antara item-item suatu tes atau instrument.. Apabila terhadap bagian obyek ukur yang sama, hasil pengukuran melalui item yang satu kontradiksi atau tidak konsisten dengan hasil ukur melalui item yang lain maka pengukuran dengan tes (alat ukur) sebagai suatu kesatuan itu tidak dapat dipercaya. Untuk itu jika terjadi hal demikian maka kita tidak bisa menyalahkan obyek ukur, melainkan alat ukur (tes) yang dipersalahkan, dengan mengatakan bahwa tes tersebut tidak reliable atau memiliki reliabilitas yang rendah. Koefisien reliabilitas konsistensi gabungan item dapat dihitung dengan menggunakan 3 rumus (Jaali 2008), yakni : 



Rumus Kuder-Richardson, yang dikenal dengan nama KR-20 dan KR-21.







Rumus koefisien Alpha atau Alpha Cronbach.







Rumus reliabilitas Hoyt, yang menggunakan analisis varian.



D. Fungsi Validitas dan Reliabilitas Kegunaan Validitas : 1. Untuk menghindari pertanyaan yang kurang jelas. 2. Untuk meniadakan kata-kata yang terlalu asing atau kata-kata yang menimbulkan kecurigaan. 3. Untuk memperbaiki pertanyaan-pertanyaan yang kurang jelas. 4. Untuk menambah item yang diperlukan atau meniadakan item yang dianggap tidak relevan. 5. Untuk mengetahui validitas kuesioner tersebut. Validitas dikatakan tinggi bila alat ukur dapat menjalankan fungsi ukurnya yaitu : 1. Memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukuran tersebut. 2. Dapat memberikan gambaran perbedaan Pernyataan valid harus diikuti dengan keterangan yang menunjuk kepada tujuan pengukuran, yaitu : 1. Valid untuk mengukur apa 2. Valid untuk mengukur pada kelompok yang mana Kegunaan dari reabilitas data adalah untuk mengetahui atau menunjukkan keajekan suatu tes dalam mengukur gejala yang sama pada waktu dan kesempatan yang berbeda.



E. Faktor Mempengaruhi Validitas dan Reliabilitas Faktor Yang Mempengaruhi Validitas 1. Ketidakjelasan petunjuk tes. 2. Kesulitan siswa dalam memahami padanan kata dan struktur kalimat. 3. Tingkat kesulitan butir soal. 4. Pembuatan butir soal. 5. Kedwimukaan (ambiguity). 6. Butir soal kurang baik. 7. Butir soal terlalu pendek. 8. Penyusunan butir soal dalam tes.



9. Pola-pola jawaban.



Unreliability suatu tes dapat disebabkan oleh dua macam faktor yaitu:  Situasi pada waktu testing berlagsung Hal ini mencakup keadaan jasmaniah dan rohaniah dari anak. Misalnya Anak tidak dalam kondisi tubuh yang baik atau kurang sehat, Menghadapi tes dengan perasaan takut, Mengerjakan tes dengan gugup, atau terburu-buru, Tidak mengerjakan tes dengan sepenuh hati, Dan lain sebagainya.  Keadaan tes itu sendiri Hal ini berhubungan dengan kualitas dari soal-soal tes tersebut. Mengenai kualitas dari tes-item ini misalnya Pertanyaan-pertanyaan yang bersifat ambigous, yaitu pertanyaan-pertanyaan yang memungkinkan banyak tafsiran dan banyak jawaban. Pertanyaan-pertanyaan yang mungkin tidak dapat dijawab, sebab kurang memberikan keterangan-keterangan yang lengkap. Untuk mengatasi hal ini, pertama, seseorang yang akan menyusun tes harus benar-benar menguasai bahan yang akan diteskan dengan mendalam, dengan sempurna. Kedua, seseorang yang menyusun tes harus menguasai teknikteknik bagaimana cara membuat soal-soal atau pertanyaan-pertanyaan.



F. Uji Validitas dan Reliabilitas Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh Pearson. Rumus korelasi product moment ada dua macam, yaitu: a. Korelasi product moment dengan simpangan, dan b. Korelasi product moment dengan angka kasar. Rumus korelasi product moment dengan simpangan; rxy =



∑xy



√(∑x2) (∑y2) Dimana: rxy



= koefisien korelasi antara variable X dan variable Y, dua variable yang



dikorelasikan 9x = X-X dan y = Y-Y) ∑xy



= jumlah perkalian x dengan y



X2



= kuadrat dari x



Y2



= kuadrat dari y



Contoh perhitungan: Misalnya akan menghitung validitas tes prestasi belajar matematika. Sebagai kriterium diambil rata-rata ulangan yang akan dicari validitasnya diberi kode X dan rata-rata nilai harian diberi kode Y. kemudian dibuat table persiapan sebagai berikut: TABEL PERSIAPAN UNTUK MENCARI VALIDITAS TES PRESTASI MATEMATIKA No



Nama



X



Y



x



y



x2



y2



xy



6,5



6.3



0



-0,1



0,0



0,01



0,0



7



6,8



+0,5



+0,4



0,25



0,16



+0,2



7,5



7,2



+1,0



+0,8



1,0



0,64



+0,8



1.



Nadia



2.



Susi



3.



Cecep



4.



Erna



7



6,8



+0,5



+0,4



0,25



0,16



+0,2



5.



Dian



6



7



-0,5



+0,6



0,25



0,36



-0,3



6.



Asmara



6



6,2



-0,5



-0,2



0,25



0,04



+0,1



7.



Siswoyo



5,5



5,1



-0,1



-1,3



1,0



1,69



+1,3



8.



Jihad



6,5



6



0



-0,4



0,0



0,16



0,0



9.



Yanna



7



6,5



+0,5



+0,1



0,25



0,01



+0,05



10.



Lina



6



5,9



-0,5



-0,6



0,25



0,36



+0,3



65,0



63,8



3,5



3,59



2,65



Jumlah



X = ∑X = 65,0 = 6,5 N Y = ZY = 63,8 = 6,38 dibulatkan 6,4 N x=X–X y=Y–Y dimasukkan ke rumus: rxy =



∑xy



√(∑x2) (∑y2)



=



2,65



=



√ 3,5 x 3,59 =



2,65



2,65 √ 12,565



= 0,748



3,545 Indeks korelasi anrara X dan Y inilah validitas soal yang dicari. Rumus korelasi product moment dengan angka kasar: rxy =



N∑XY – (∑X) (∑Y)



√{N∑X2 – (∑X)2} {N∑Y2 – (∑Y)2}



Dimana: rXY = koefisien korelasi antara variabel X dan variabel Y, variabel yang dikorelasikan. Dengan menggunakan data hasil tes prestasi matematika diatas kini dihitung dengan rumus korelasi product moment dengan angka kasar yang tabel persiapanya sebagai berikut.



TABEL PERSIAPAN UNTUK MENCARI VALIDITAS TES PRESTASI MATEMATIKA No



Nama



X



Y



X2



Y2



XY



6,5



6,3



42,25



39,69



40,95



7



6,8



49



46,24



47,6



7,5



7,2



56,25



51,84



54,0



1



Nadia



2



Susi



3



Cecep



4



Erna



7



6,8



49



46,24



47,6



5



Dian



6



7



36



49



42



6



Asmara



6



6,2



36



38,44



37,2



7



Siswoyo



5,5



5,1



30,25



26,01



28,05



8



Jihad



6,5



6



42,25



45,5



39



9



Yanna



7



6,5



49



36



45,5



10



Lina



6



5,9



36



34,81



35,4



65,0



63,8



426,0



410,52



417,3



Jumlah



Dimasukkan kedalam rumus:



rxy =



N∑XY – (∑X) (∑Y)



√{N∑X2 – (∑X)2} {N∑Y2 – (∑Y)2}







rxy = (











(



= =



) (











, ) ,







,



)







= =



, – (















) (



, –



,



)



, ,



√ ,



= 0,745



Jika, diperbandingkan dengan validitas soal yang dihitung dengan rumus simpangan, ternyata terdapat perbedaan sebesar 0,33 lebih besar yang dihitung dengan rumus simpangan. Hal ini wajar karena dalam mengerjakan perkalian atau penjumlahan jika diperoleh 3 atau angka di belakang koma dilakukan pembulatan ke atas. Perbedaan ini sangat kecil sehingga dapat diabaikan. Untuk memperjelas pengertian tersebut dapat disampaikan keterangan sebagai berikut. -



Korelasi positif menunjukkan adanya hubungan sejajar antara dua hal. Misalnya hal pertama nilainya naik, hal kedua ikut naik. Sebaiknya jika hal pertama turun. Contih korelasi positif antara nilai IPA dan Matematika. IPA



:



2



3



5



7



4



3



2



Matematika



:



4



5



6



8



5



4



3



Kondisi nilai matematika sejajar dengan IPA karena naik dan turunnya nilai matematika mengikuti naik dan turunnya nilai IPA. Coba perhatikan. -



Korelasi negatif menunjukkan adanya hubungan kebalikan antara dua hal. Misalnya hal pertama nilainya naik, justru yang kedua turun. Sebaliknya jika yang pertama turun, yang kedua naik. Contoh korelasi negatif antara nilai Bahasa Indonesia dengan Matematika. Bahasa Indonesia



:



5



6



8



4



3



2



Matematika



:



8



7



5



1



2



3



Keadaan hubungan antara dua halyang kita jumpai dalam kehidupan sehari-hari tidak selalu positif atau negatif saja, tetapi mungkin 0. Besarnya korelasi pun tidak menentu. Coba cermatilah bagaimana hubungan antara dua nilai mata pelajaran A dan B berikut ini. Contoh korelasi tidak tertentu. NIlai A



:



5



6



4



7



3



8



7



Nilai B



:



4



4



3



7



4



9



4



Keadaan kedua nilai tersebut jika dihitung dengan rumus korelasi mungkin positif mungkin negatif. Coba hitunglah! Koefisien korelasi selalu terdapat antara -1,00 sampai +1,00. Namun karena dalam menghitung sering dilakukan pembulatan angka-angka, sangat mungkin diperoleh koefisien lebih dari 1,00. Koefisien negative menunjukkan hubungan kebalikan sedangkan koefisien positif menunjukkan adanya kesejajaran untuk mengadakan interpretasi mengenai besarnya koefisien korelasi adalah sebagai berikut: » antara 0,800 samapi dengan 1,00



: sangat tinggi



» antara 0,600 sampai dengan 0,800 : tinggi » antara 0,400 sampai dengan 0,600 : cukup » antara 0,200 sampai dengan 0,400 : rendah » antara 0,00 sampai dengan 0,200



: sangat rendah



Penafsiran harga koefisien korelasi ada dua cara yaitu:  Dengan melihat harga r dan diinterpretasikan misalnya korelasi tinggi, cukup, dan sebagainya.  Dengan berkonsultasi ke table harga kritik r product moment sehingga dapat diketahui signifikan tidaknya korelasi tersebut. Jika harga r lebih kecil dari harga kritik dalam table, maka korelasi tersebut tidak signifikan. Begitu juga arti sebaliknya



Tiga tehnik pengujian realibilitas instrument antara lain : a. Teknik Paralel (Paralel Form atau Alternate Form) Teknik paralel disebut juga tenik ”double test double trial”. Sejak awal peneliti harus sudah menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson). b. Teknik Ulang (Test Re-test) Disebut juga teknik ”single test double trial”. Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas. Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson. Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda. Metode pengujian reliabilitas stabilitas yang paling umum dipakai adalah metode pengujian tes-kembali (test-retest). Metode test-retest menggunakan ukuran atau “test” yang sama untuk variable tertentu pada satu saat pengukuran yang diulang lagi pada saat yang lain. Cara lain untuk menunjukkan reliabilitas stabilitas, bila kita menggunakan survai, adalah memasukkan pertanyaan yang sama di dua bagian yang berbeda dari kuesioner atau wawancara. Misalnya the Minnesota Multiphasic Personality Inventory (MPPI) mengecek reliabilitas test-retest dalam satu kuesionernya dengan mengulang pertanyaan tertentu di bagian-bagian yang berbeda dari kuesioner yang panjang. Kesulitan terbesar untuk menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa sifat/ variable yang akan diukur memang benar-benar bersifat stabil sepanjang waktu. Karena kemungkinan besar tidak ada ukuran



yang andal dan sahih yang tersedia. Satu-satunya faktor yang dapat membuat asumsi-asumsi ini adalah pengalaman, teori dan/atau putusdan terbaik. Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya mempertahankan asumsi tersebut atas dasar pijakan yang obyektif. c. Teknik Belah Dua (Split Halve Method) Disebut juga tenik “single test single trial”. Peneliti boleh hanya memiliki seperangkat instrument saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrument menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomor ganjil-genap, atas dasar nomor awal-akhir, dan dengan cara undian. Menurut Saifuddin Azwar, realibilitas ini diukur dengan menentukan hubungan antara skor dua paruh yang ekuivalen suatu tes, yang disajikan kepada seluruh kelompok pada suatu saat. Karena reliabilitas belah dua mewakili reliabilitas hanya separuh tes yang sebenarnya, rumus Spearman-Brown dapat digunakan untuk mengoreksi koefisien yang didapat.



BAB III PENUTUP A. Kesimpulan Validitas adalah sutu ukuran yang menunjukkan tingkat ke validan atau kesahihan suatu instrmen. Suatu instrumen yang valid itu mempunyai validitas yang tinggi dan sebaliknya bila tingkat validitasnya rendah maka instrumen tersebut kurang valid. Sebuah instrumen dikatakan valid apabla mampu mengukur apa yang hendak diukur/ diinginkan. Sebuah instrumen dikatan valid apabila bisa mengungkap data dari variabel yang diteliti. Reliabilitas adalah indeks yang menunjukan sejauh mana suatu alat ukur dipercaya atau dapat diandalkan. Reliabilitas mengacu pada keajegan hasil evaluasi, yakni konsistensi skor tes (test score) dari masa ke masa.jika seorang guru memperoleh skor yang sama pada tes yang sama pada kelompok siswa yang sama pada waktu yang berbeda, maka dia dapat menyimpulkan bahwa hasil tes itu memiliki derajat reliabilitas tes yang tinggi dari suatu masa ke masa. Validitas dan reliabilitas adalah parameter penelitian dan tes. Oleh karena itu, agar penelitian dapat digunakan, kedua aspek ini harus ada di sana. Perbedaan antara validitas dan reliabilitas adalah bahwa validitas mengacu pada sejauh mana suatu langkah tes, dan apa yang diklaim untuk mengukur sedangkan reliabilitas mengacu pada konsistensi hasil tes. Namun, ketika penelitian atau tes valid, maka data tersebut dapat diandalkan. Namun, jika tes itu bisa diandalkan, itu tidak bisa berarti bahwa tes itu valid.



DAFTAR PUSTAKA



Anonym.



2013.



VALIDITAS



https://merlitafutriana0.blog



DAN



RELIABILITAS.



(Online).



spot.com/p/validitas-dan-reliabilitas.html.



(Diakses pada 15 Februari 2020). Arikunto, Suharini. 2005. Dasar-dasar Evaluasi Pendidikan. Jakarta : Bumi Aksara. Hadi Sutrisno. 1998. Metodologi Research. Yogyakarta: BPFE. Machomanid. 2015. VALIDITAS DAN RELIABILITAS TES. (Online). https:// pak-boedi.blogspot.com/2015/09/makalah-evaluasi-pembelajaran-validitas. html. (Diakses pada 15 Februari 2020). Oktaviandy, Navel. 2012. Reliabilitas, Kepraktisan, Dan Efek Potensial Suatu Instrumen. (Online). https://navelmangelep.wordpress.com/2012/04/ 03/reliabilitas-kepraktisan-dan-efek-potensial-suatu-instrumen/#more-709. (Diakses pada 15 Februari 2020). Sudijono, Anas. 1996. Pengantar Evaluasi Pendidikan. Jakarta: PT Raja Grafindo Persada. Thoha, M. Chabib. 2003. Teknik Evaluasi Pendidikan. Jakarta: PT Raja Grafindo Persada. Santoso, Singgih. 2003. Mengatasi Berbagai Masalah Statistik, Jakarta : Gramedia. Sugiyono. 2003. Statistik Untuk Penelitian, Bandung: Alfabeta. Wahyuni, N. 2014. Uji Validitas dan Reliabilitas. (Online). https://qmc.binus. ac.id/2014/11/01/u-j-i-v-a-l-i-d-i-t-a-s-d-a-n-u-j-i-r-e-l-i-a-b-i-l-i-t-a-s/. (Diakses pada 15 Februari 2020). Winarsunu, Tulus. 2004. Statistik Dalam Penelitian Psikologi dan Pendidikan, Malang: UMM Press. Voelker, David H, dkk. 2004. Seri Matematika Keterampilan Statistika, Bandung: Pakar Raya.