Makalah Asesmen Validitas [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

MAKALAH ASSESMEN DAN EVALUASI PEMBELAJARAN “ANALISI VALIDITAS ISI, VALIDITAS EMPIRIS DAN RELIAIBILITAS”



DISUSUN OLEH: IDA AYU SATYAHARI INDRAYONI



(1713071036)



GUSTI AYU KETUT KARUNIA DEWI



(1713071043)



S1 PENDIDIKAN IPA JURUSAN FISIKA DAN PENGAJARAN IPA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2019



KATA PENGANTAR Puji syukur kami panjatkan ke hadirat Tuhan Yang Maha Esa, karena berkat rahmat Nya kami dapat menyelesaikan makalah yang berjudul “Analisis Validitas Isi, Validitas Empiris dan Realibilitas”. Makalah ini disusun guna memenuhi tugas matakuliah Asesmen dan Evaluasi Pembelajaran Jurusan Fisika dan Pengajaran IPA di Fakultas Matematika dan Ilmu Pengetahuan Alam. Kami menyadari bahwa dalam proses penyelesaian makalah ini tidak terlepas dari peran serta dari berbagai pihak, khususnya penulis dan berbagai sumber referensi yang telah mendukung dalam penyusunan makalah ini. Maka itu dalam kesempatan ini, kami ingin menyampaikan terimakasih kepada semua pihak yang telah membantu dan berkontribusi dalam menyelesaikan penulisan makalah ini. Dalam penulisan makalah ini, kami menyadari bahwa masih terdapat banyak kekurangan dan jauh dari kesempurnaan sehingga kritik dan saran yang membangun sangat kami harapkan. Kami berharap Semoga tulisan ini dapat bermanfaat bagi para pembaca.



Singaraja , 25 Oktober 2019



Penulis



DAFTAR ISI KATA PENGANTAR ....................................................................................................... ii DAFTAR ISI...................................................................................................................... iii BAB I PENDAHULUAN .................................................................................................. 1 1.1 LATAR BELAKANG .................................................................................................. 1 1.2 RUMUSAN MASALAH .............................................................................................. 1 1.3 TUJUAN ....................................................................................................................... 2 1.4 MANFAAT ................................................................................................................... 2 BAB II PEMBAHASAN ................................................................................................... 3 2.1 PENGERTIAN VALIDITAS DAN REABILITAS ..................................................... 3 2.2 CARA MENGHITUNG VALIDITAS ......................................................................... 7 2.3 CARA MENCARI BESARNYA VALIDITAS ........................................................... 9 BAB II PENUTUP ............................................................................................................ 18 3.1 KESIMPULAN ............................................................................................................. 18 3.2 SARAN ......................................................................................................................... 19 DAFTAR PUSTAKA



BAB I PENDAHULUAN 1.1 LATAR BELAKANG Persoalan alat ukur yang digunakan evaluator ketika melakukan kegiatan evaluasi sering dihadapkan pada persoalan akurasi, konsisten dan stabilitas sehingga hasil pengukuran yang diperoleh bisa mengukur dengan akurat sesuatu yang sedang diukur. Instrumen ini memang harus memiliki akurasi ketika digunakan. Konsisten dan stabil dalam arti tidak mengalami perubahan dari waktu pengukuran satu ke pengukuran yang lain. Data yang kurang memiliki validitas , akan menghasilkan kesimpulan yang bisa, kurang sesuai dengan yang seharusnya, dan bahkan bisa saja bertentangan dengan kelaziman. Untuk membuat alat ukur instrumen itu, diperlukan kajian teori, pendapat para ahli serta pengalaman-pengalaman yang kadangkala diperlukan bila definisi operasional variabelnya tidak kita temukan dalam teori. Alat ukur atau instrumen yang akan disusun itu tentu saja harus memiliki validitas , agar data yang diperoleh dari alat ukur itu bisa reliabel, valid dan disebut dengan validitas. Validitas adalah kualitas yang menunjukkan hubungan antara suatu pengukuran (diagnosis) dengan arti atau tujuan kriteria belajar atau tingkah laku. Keandalan adalah kualitas yang menunjukkan kemantapan (consistency) ekuivalensi atau stabilitas suatu pengukuran yang dilakukan. Objektivitas adalah kualitas yang menunjukkan identitas atau kesamaan dari skor-skor atau diagnosis-diagnosis yang diperoleh dari data yang sama dari penskor-penskor kompeten yang sama. Kepraktisan adalah suatu kualitas yang menunjukkan kemungkinan dapat dijalankannya suatu kegunaan umum dari suatu teknik penilaian. Dalam pembicaraan ini akan dibahas lebih lanjut dan lebih rinci mengenai validitas itu sendiri 1.2 RUMUSAN MASALAH Berdasarkan latar belakang di atas, dapat dirumuskan beberapa rumusan masalah, yaitu: 1. Bagaimana pengertian validitas? 2. Bagaimana pengertian reabilitas? 3. Bagaimanakah analisis validitas isi? 4. Bagaimanakah analisis validitas empiris? 5. Bagaimakaha analisis reabilitas?



1.3 TUJUAN Berdasarkan rumusan masalah yang telah dirumuskan tersebut, tujuan dari pembuatan makalah ini, yaitu: 1. Agar mahasiswa mampu membedakan antara validitas dengan reabilitas 2. Agar mahasiswa mampu mengetahui analisis validitas isi 3. Agar mahasiswa mampu mengetahui validitas empiris 4. Agar mahasiswa mempu mengetahui analisis reabilitas



1.4 MANFAAT Manfaat yang bisa diperoleh dari penulisan makalah ini, yaitu sebagai berikut: 1. Bagi Penulis Penulisan makalah ini memberikan manfaat bagi penulis untuk dapat memahami lebih banyak tentang validitas dan reabilitas serta analisis validitas isi, validitas empirsis dan analisis reabilitas yang penulis miliki tersebut, sehingga penulis dapat menyampaikan informasi yang lebih jelas mengenai materi tersebut kepada pembaca dan masyarakat umum yang terkadang masih memiliki pengetahuan yang minim. 2. Bagi Pembaca Penulisan makalah ini memberikan manfaat bagi pembaca yang membaca makalah ini untuk dapat menambah wawasan mengenai tentang validitas dan reabilitas dalam pembelajaran, serta analisis validitas isi, validitas empirsis dan analisis reabilitas. Selain itu, makalah ini juga dapat digunakan sebagai referensi oleh pembaca dalam pembuatan makalah yang sejenis.



BAB II PEMBAHASAN



2.1 PENGERTIAN VALIDITAS DAN REABILITAS 2.1.1 Pengertian Validitas Validitas berasal dari kata ’’validity’’ yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukuran tersebut. Tes yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes yang memiliki validitas rendah (Azwar, 1997). Validitas adalah ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi, jadi jika data yang dihasilkan dari sebuah instrument valid, maka dapat dikatakan bahwa istrumen tersebut valid, karena dapat memberikan gambaran tetang data secara benar sesuai dengan kenyataan atau keadaan sesungguhnya jadi jika data yang dihasilkan oleh instrument benar atau valid, sesuai kenyataan, maka instrument yang digunakan tersebut juga valid. Prinsip validitas adalah pengukuran atau pengamatan yang berarti prinsip keandalan instrumen dalam mengumpulkan data. Instrumen harus dapat mengukur apa yang seharusnya diukur. Jadi validitas lebih menekankan pada alat pengukuran atau pengamatan. Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran. Terkandung di sini pengertian bahwa ketepatan pada validitas suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel A’ atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A’ atau B (Azwar: 1997).



2.1.2 Macam-macam Validitas Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris. a. Validitas Logis istilah ’’validitas logis’’ mengandung kata ’’logis’’ berasal dari kata ’’logika’’ yang berarti penalaran. Dengan makna demikian maka validitas logis untuk sebuah instrumen evaluasi menunjuk pada kondisi bagi sebuah instrument yang memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrument yang bersangkutan sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah karangan, jika penulis sudah mengikuti aturan mengarang, tentu secara logis karangannya sudah baik. Dari penjelasan tersebut kita dapat memahami bahwa validitas logis dapat dicapai apabila instrument disusun mengikuti ketentuan yang ada. Dengan demikian dapat disimpulkan bahwa validitas logis tidak perlu diuji kondisinya tetapi langsung diperoleh sesudah instrument tersebut selesai disusun. Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrument, yaitu: validitas isi dan validitas konstrak. b. Validitas Empiris istilah validitas empiris memuat kata empiris yang artinya pengalaman. Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Sebagai contoh seharihari, seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut memang jujur. Contoh lain, seseorang dikatakan kreatif apabila dari pengalaman dibuktikan bahwa orang tersebut sudah banyak menghasilkan ide-ide baru yang diakui bebeda dari hal-hal yang sudah ada. Dari penjelasan contoh-contoh tersebut diketahui bahwa validitas empiris dapat diperoleh hanya dengan menyusun instrumen berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktikan melalui pengalaman. Ada dua macam validitas empiris, yakni validitas ada sekarang dan validitas prediksi. Dari uraiaan diatas ada dua jenis validitas, yakni validitas logis yang ada dua macam, dan validitas empiris yang juga ada dua macam, maka secara keseluruhan kita mengenal adanya empat validitas, yaitu: 1) Validitas Isi (Content Validity) Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum maka validitas isi ini sering juga disebut validitas kurikuler. Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara memerinci materi kurikulum atau materi buku pelajaran. Misalnya: tes bidang studi IPS, harus mampu mengungkap isi bidang studi tersebut, pengukuran motivasi harus mampu mengukur seluruh aspek yang berkaitan dengan konsep motivasi, dan demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan validitas isi terutama berkaitan dengan proses analisis logis, dengan dasar ini dia berpendapat bahwa validitas isi berbeda dengan validitas rupa yang kurang menggunakan analisis logis yang sistematis, lebih lanjut dia menyatakan bahwa sebuah instrumen yang punya validitas isi biasanya juga mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.



2) Validitas konstruksi (Construct Validity) Konstruk adalah kerangka dari suatu konsep, validitas konstruk adalah validitas yang berkaitan dengan kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang diukurnya. Sebuah tes dikatakan memeiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam tujuan instruksional khusus. Dengan kata lain jika butir-butir soal mengukur aspek berpikir tersebut sudah sesuai dengan aspek berpikir yang menjadi tujuan instrusional. Contoh: siswa dapat membandingkan antara efek biologis dan efek psikologis, maka butir soal pada tes merupakan perintah agar siswa membedakan antara dua efek tersebut. Konstruksi dalam pengertian ini bukanlah susunan seperti yang sering dijumpai dalam teknik, tetapi merupakan rekaan psikologis yaitu suatu rekaan yang dibuat oleh para ahli ilmu jiwa. Seperti halnya validitas isi, validitas konstruksi dapat diketahui dengan cara memerinci dan memasangkan setiap butir soal dengan setiap aspek dan tujuan instrusional khusus. Pengajarannya berdasarkan logika, bukan pengalamannya. 3) Validitas bandingan/ ’’ada sekarang’’ (Concurrent Validity) Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah ’’sesuai’’ tentu ada dua hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang). Contoh: seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk ini diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki. Misal nilai ulangan harian atau nilai sumatif yang lalu. 4) Validitas ramalan/ prediksi (Predictive validity) Memprediksi artinya meramal, dengan meramal selalu menganai hal yang akan datang yang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang. Misalanya tes masuk keperguruan tinggi adalah sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan datang. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi rendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin keberhsilannya kelak. Sebaliknya seorang calon dikatakan tidak lulus tes karena memiliki nilai tes yang rendah jadi diperkirakan akan tidak mampu mengikuti perkuliahan yang akan datang.



2.1.3 Pengertian Reabilitas Menurut arti kata reliabel berarti dapat dipercaya. Berdasarkan arti kata tersebut, maka instrumen yang reliabel adalah instrumen yang hasil pengukurannya dapat dipecaya. Salah satu keriteria instrumen yang dapat dipercaya jika instrumen tersebut digunakan secara berulang-ulang, hasil pengukurannya tetap. Reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat



dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti. Konsep tentang reliabilitas ini tidak akan sulit dimengerti apabilaa sudah memahami konsep validitas. Tuntutan bahwa instrumen evaluasi harus valid menyangkut harapan diperolehnya data yang valid, sesuai dengan kenyataan. Dalam hal reliabilitas ini tuntutannya tidak jauh berbeda. Jika validitas terkait dengan ketepatan objek yang tidak lain adalah tidak menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar, maka konsep reliabilitas terkait dengan pemotretan berkali-kali. Instrumen yang baik adalah yang dapat dengan ajeg memberikan data data yang sesuai dengan kenyataan. Yang sering dikatakan kurang tepat adalah adanya pendapat bahwa “ajeg” atau “tetap” diartikan sebagai “sama”. Dalam evaluasi ini tidak demikian. Ajeg atau tetap tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg. Jika keadaan A mula-mula berada lebih rendah dibandingkan dengan B, maka jika diadakan pengukuran ulang, A juga berada lebih rendah dari B. itulah yang dikatan ajeg atau tetap, yaitu sama dalam kedudukan siswa di antara anggota kelompok yang lain. Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan itulah menunjukkan tingginya reliabilitas instrumen. Sehubungan dengan reliabilitas ini, Scarvia B. Anderson dan kawan-kawan menyatakan bahwa persyaratan bagi tes, yaitu vasiliditas dan reliabilitas ini penting. Dalam hal ini vasiliditas lebih penting, dan reabilitas ini perlu, karena menyongkong terbentuknya vasiliditas. Sebuah tes mungkin reliabel tetapi tidak valid. Sebaliknya, sebuah tes yang valid biasanya reliabel. Beberapa hal yang mempengaruhi hasil tes banyak sekali. Namun secara garis besar dapat dikelompokkan menjadi 3 hal, yaitu: a. Hal yang berhubungan dengan tes itu sediri, yaitu panjang tes dan kualitas butir-butir soalnya. Tes yang terdiri dari banyaknya butir, tentu saja lebih vali dibantingkan dengan tes yang hanya terdiri dari beberapa butir soal. Tinggi rendahnya validitas menunjukkan tinggi rendahnya reliabilitas tes. Dengan demikian maka semakin panjang tes. Maka reliabilitas berhubung dengan penambahan banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh Spearman dan Brown sehingga terkenal dengan rumus Spearman-Brown. Rumusnya adalah: rnn =



nr 1 + (n − 1)r



Dimana: rnn = besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir soal baru n = berapa kali butir-butir soal itu ditambah r = besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambah.



b. Hal yang berhubungan dengan tercoba (testee) Suatu tes yang dicobakan dengan kepada kelompok yang terdiri dari banyak siswa akan mencerminkan keragaman hasil yang menggambarkan besar-kecilnya reliabilitas tes. Tes yang dicobakan bukan kelompok terpilih, akan menunjukkan reliabilitas yang lebih besar daripada yang dicobakan pada kelompok tertentu yang diambil secara dipilih. c. Hal yang berhubungan dengan penyelenggaraan tes Faktor penyelenggaraan tes yang bersifat administratif, sangat menentukan hasil tes. Contohnya yaitu: 1) Petunjuk yang diberikan sebelum tes mulai, akan memberikan ketenangan kepada para testes dalam mengerjakan tes, dan dalam penyelenggaraan tidak akan banyak terdapat pertanyaan. Ketenangan ini tentu saja akan berpengaruh terhadap hasil tes. 2) Pengawas yang tertib akan mempengaruhi hasil diberikan oleh siswa terhadap tes. Bagi siswa tertentu adanya pengawas yang terlalu ketat menyebabkan rasa jengkel dan tidak dapat dengan leluasa mengerjakan tes. 3) Suasana lingkungan dan tempat tes ( duduk tidak teratur, suasana sekelilingnya ramai, dan sebagainya) akan mempengaruhi hasil tes. Adanya hal-hal yang mempengaruhi tes ini, secara tidak langsung akan mempengaruhi reliabilitas soal tes.



2.2 CARA MENGHITUNG VALIDITAS 



Validitas Isi (Content Validity)



Menurut Suharsini Arikunto (2013 : 82 ) sebuah tes dikatakan memiliki validitas isi apabila mengkur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena itu materi yang diajarkan tertera dalam kurikulum maka validitas isi sering disebut juga validitas kurikuler. Validitas isi dilakukan untuk memastikan apakah isi kuesioner sudah sesuai dan relevan dengan tujuan study. Validitas isi menunjukkan isi yang mencerminkan rangkaian lengkap terkait dengan atribut yang diteliti dan biasanya dilakukan oleh tujuh orang ahli atau lebih (DeVon et al 2007).Perkiraan validitas isi dari tes diperoleh dengan menyeluruh dan sistematis dalam memeriksa item tes untuk menentukan sejauh mana mereka mencerminkan dan tidak mencerminkan domain konten (Kowsalya, Venkat Lakshmi, dan Suresh, 2012) Validitas isi terdiri dari dua bagian, yaitu validitas tampang dan validitas logis. 



Validitas tampang/muka (face validity) merupakan validitas isi yang paling dasar dan sangat minimum. Validitas isi menunjukkan bahwa aitem-aitem yang dimaksudkan untuk mengukur







sebuah konsep, memberikan kesan mampu mengungkap konsep yang hendak di ukur (Sekaran, 2006). Tidak berbeda dengan penjelasan sebelumnya, Groth-Marnat, (2009) menjelaskan bahwa validitas isi (content validity) dengan validitas muka (face validity) memiliki perbedaan dan tidak sinonim. Validitas isi menyangkut judgement yang dibuat oleh para ahli, sedangkan validitas muka/tampang menyangkut judgement dari pengguna test. Sejalan dengan itu, Gregory (1992) menjelaskan bahwa validitas tampang hanya sekedar tahap penerimaan orang pada umumnya terhadap fungsi pengukuran tes, serta tidak berhubungan dengan statistic validitas seperti koefisien atau indeks, Analisis lanjutan setelah validitas tampang adalah melalui validitas logis yaitu prosedur penilaian kelayakan isi item melalui penilaian yang bersifat kualitatif oleh panel ahli. Prosedur ini selanjutnya menghasilkan validitas logis atau merupakan tinggi rendahnya kesepakatan di antara para ahli yang menilai kelayakan suatu skala pengukuran (Azwar, 2012).



Gambar Jenis Uji Validitas Sekali lagi diulangi bahwa sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik kolerasi product moment yang dikemukakan oleh Pearson. Rumus kolerasi product moment ada dua macam, yaitu : a. Korelasi product moment dengan simpangan, dan b. Korelasi product moment dengan angka dasar. Rumus korelasi product moment dengan simpangan :



Contoh perhitungan:Misalnya akan menghitung validitas tes prestasi belajar matematika. Sebagai kriterium diambil rata-rata ulangan yang akan dicari validitasnya diberi kode X dan rata-rata nilai harian diberi kode Y. Kemudian dibuat tabel persiapan seperti berikut.



Jika diperbandingkan dengan validitas soal yang dihitung dengan rumus simpangan, ternyata terdapat perbedaan sebesar 0,003, lebih besar yang dihitung dengan rumus simpangan. Hal ini wajar karena dalam mengerjakan perkalian dan penjumlahan jika diperoleh 3 atau angka di belakang koma dilakukan pembulatan ke atas. Perbedaan ini sangat kecil sehingga dapat diabaikan.



2.3 CARA-CARA MENCARI BESARNYA REABILITAS Reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus kolerasi produk moment untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.



Kriteria yang digunakan untuk mengetahui ketetapan ada yang beradda di luar tes (consistency external) dan pada tes itu sendiri (consistency internal). a. Metode bentuk paralel (equivalent) Tes paralel atau akuicalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa inggris disebut alternate-forms method (parallel forms). Dengan metode bentuk paralel ini, dua buah tes yang paralel, misalnya tes Matematika Seri A yang akan dicari reliabilitas dan Seri B diteskan kepada sekolompok siswa yang sama, hasilnya dikorelasi. Koefisien korelasi dari kedua hasil tes inilah menunjukkan koefisien reliabilitas tes Seri A. Jika koefisiennya tinggi maka tes tersebut sudah reliabel dan dapat digunakan sebagai alat pengetes yang terandalkan. Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan dua buah tes, dan masing-masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada orang yang menyebutkan sebagai double test-double-trial method. Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor “masih ingat soalnya” yang dalam evaluasi disebut dengan adanya practise-effect dan carry-over effect, artinya ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut. Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes. Selain itu harus tersedia waktu yang harus untuk mencobakan dua kali tes. b. Metode tes ulang (tes-retest method) Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut denan single-test-double-trial method. Kemudian hari dari kedua kali tes tersebut dihitung korelasinya. Untuk tes yang banyak mengungkapkan pengetahuan (ingatan) dan pemahaman, cara ini kurang, karena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena itu, tenggang waktu antara pemberian tes pertama dengan kedua menjadi permasalahan tersendiri. Sebaliknya kalau tenggang waktu terlalu sempit, siswa banyak mengingat materi. Sebaliknya kalau tenggang waktu terlalu lama, maka faktor-faktor sudah mempelajari sesuatu. Tentu saja faktor-faktor ini akan ini berpengaruh pula terhadap reliabilitas. Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes pertama. Hal ini tidak mengapa karena pengetes harus sadar akan adanya practice effect dan carry over effect. Yang penting ditunjukkan oleh koefisien korelasi yang tinggi. Contoh: Siswa



Tes Pertama



Tes Kedua



Skor



Ranking



Skor



Ranking



A



15



3



20



3



B



20



1



25



1



C



9



5



15



5



D



18



2



23



2



E



12



4



18



4



Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh semua siswa. Metode ini juga disebut korelasi diri sendiri karena mengkorelasikan hasil dari tes yang sama. c. Metode belah dua atau split-half method Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu-tes dua kali percobaan diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali. Oleh karena itu, disebut juga single-testsingle-trial method. Berbeda dengan metode pertama dan kedua yang setelah di kemukakan koefisien korelasi langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga ini tidak dapat demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui reliabilitas separo tes. Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus Spearman-Brown sebagai berikut: 2 r11 rII =



22



1 + r11 22



Dimana: r11 = korelasi antara skor-skor setiap belahan tes. 22



rII



= koefisien reliabilitas yang sudah disesuaikan.



Contoh: Korelasi antara belahan tes = 0,60 Maka reliabilitas tes =



2 x 0,60 1+0,60



=



1,20 1,60



= 0,75



Banyak pemakaian metode ini salah membelah hasil tes pada waktu, menganalisis. Yang mereka lakukan adalah mengelompokkan hasil separo subjek peserta tes dan separo yang lain kemudian hasil kedua kelompok ini dikorelasikan. Yang benar adalah membelah item atau butir soal. Tidak akan keliru kiranya bagi pemakaian metode ini harus ingat bahwa banyaknya butir soal harus genap supaya dapat dibelah. Ada dua cara membelah butir soal ini yaitu: 1) Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut belahan ganjilgenap. 2) Membelah atas item-item awal item-item akhir yaitu jumlah pada nomor-nomor awal dan separo pada nomor-nomor akhir yang selanjutnya disebut belahan awal-akhir. Contoh perhitungan reliabilitas dengan metode belah dua Langkah pertama yang harus dilakukan adalah mengadakan analisis butir soal yang lebih terkenal dengan nama analisis item. Item yang dapat dijawab dengan benar diberi skor dan bagi yang salah diberi skor 0. Skor-skor untuk seluruh subjek dan seluruh item ini diterakan dalam tabel analisis sebagai berikut: Nomor item No .



1, 3, 2, 4, 1,2,3 5, 7, 6. 8, , 4,5 9 10,



Siswa 1 2 3 4 5 6 7 8 9 10



6, 7, 8, 9, 10



Skor total



Ganj il



Gen ap



Awal Akhi r



1



Hartati 1 0 1 0 1 1 1 1 1 1



8



5



3



3



5



2



Yoyok 0 0 1 0 1 0 0 1 1 1



5



3



2



2



3



3



Oktaf



0 1 0 0 0 1 0 1 0 1



4



0



4



1



3



4



Wendi



1 1 0 0 1 1 0 0 1 0



5



3



2



3



2



5



Diana



1 1 1 1 1 1 0 0 0 0



6



3



3



5



1



6



Paul



1 0 1 0 1 0 1 0 0 0



4



4



0



3



1



7



Susan a



1 1 1 1 1 1 1 0 0 0



7



4



3



5



2



8



Helen



0 1 0 1 1 1 1 1 1 1



8



3



5



3



5



1. Pembelahan ganjil-genap Tabel persiapan perhitungan reliabilitas dengan belah dua ganjil-genap adalah sebagai berikut: No. Nama



Item ganjil



Item genap



(1, 3, 5, 7, 9)



(2, 4, 6, 8, 10)



(X)



(Y)



1



Hartati



5



3



2



Yoyok



3



2



3



Oktaf



0



4



4



Wendi



3



2



5



Diana



3



3



6



Paul



4



0



7



Susana



4



3



8



Helen



3



5



Kelanjutnya dari tabel ini adalah menhitung dengan rumus kolerasi product moment. Dengan menggunakan kalkulator dikethui bahwa: ∑ 𝑋 = 25 ∑ 𝑋2 = 93 ∑ 𝑋𝑌 = 63 2 ∑ 𝑋 = 22 ∑ 𝑌 = 76 Setelah dihitung dengan rumus kolerasi product moment dengan angka kasar diketahui bahwa rxy = -0,3786. Harga tersebut baru menunjukkan reliabilitas separo tes. Oleh karena itu, rxy untuk belahan ini disebut dengan istilah r1/2 ½ atau rgg singkatan dari rganjil-genap. Untuk mencari reliabilitas seluruh tes digunakan rumus Spearman-Brown yang rumusnya telah dikemukakan di depan. Jika koefisien reliabilitas separo tes ini dimasukkan ke dalam rumus hitungannya yaitu: 2 r11 22



RI I =



1+r11 22



= =



2 𝑋−0,3786



1+(−0,3786) −0,7572 1,3786



= -0,5493



2. Pembelahan awal-akhir Dengan data yang tertera pada Tabel analisis item tes Matematika diketahui jumlah skor belahan awal-akhir sebagai berikut. No. Nama



Item ganjil



Item genap



(1, 3, 5, 7, 9)



(2, 4, 6, 8, 10)



(X)



(Y)



1



Hartati



5



3



2



Yoyok



3



2



3



Oktaf



0



4



4



Wendi



3



2



5



Diana



3



3



6



Paul



4



0



7



Susana



4



3



8



Helen



3



5



Seperti hanya pada waktu menghitung dengan belahan ganjil-genap maka kelanjutannya adalah menghitung dengan rumus korelasi product moment. Dengan menggunakan kalkulator diketahui: ∑ 𝑋 = 25 ∑ 𝑋 = 22



∑ 𝑋2 = 91 ∑ 𝑌2 = 78



∑ 𝑋𝑌 = 63



Setelah dimasukkan ke dalam rumus korelasi product moment dengan kasar diperoleh r1/2 ½ = 0,3831. Dengan rumus Spearman-Brown diperoleh rI I = -0,5538. Selain menggunakan rumus korelasi product moment, dua orang ahli mengajukan rumus lain. Seorang bernama Flanagan menemukan rumus yang perhitungannya menggunakan belah dua ganjil-genap, dan seorang lagi bernama Rulon yang rumusnya diterapkan pada data belahan awalakhir.



3. Penggunaan rumus Flanagan Rumus : RI I = 2(1-



𝑆12 + 𝑆22 𝑆𝑡2



)



Dimana: RI I = reliabilitas 𝑆12 = varians belahan pertama (1) yang dalam hal ini varians skor item ganjil 𝑆22 = varians belahan kedua (2) yaitu varians skor item genap 𝑆𝑡2 = varians total yaitu varians skor total. Secara sederhana dapat dipahami bahwa varians adalah standar deviasi kuadrat. Dengan demikian bagi peminat yang menghitung dengan kalkulator statistik varians ini diperoleh dengan mengkuadratkan standar deviasi. Untuk mereka yang tidak menggunakan kalkulator statistik maka varians dapat dicari dengn rumus sebagai berikut : 2



S =



∑ 𝑋2 –



(∑ 𝑋)2 𝑁



𝑁



Standar Deviasi (SD) dapat disebut dengan istilah Indonesia Simpangan Baku (SB). Namun huruf S (B besar) juga dapat dikatakan sudah menyebut standar deviasi. Bagi yang berminat mencari S dulu untuk mencari varians, dapat menggunakan rumus S, yaitu: S=



√∑ 𝑋 2 𝑁



S = standar deviasi X = Simpangan X dari 𝑥̅ , yang dicari dari x-𝑥̅ , 𝑆 2 = varians, selalu dituliskan dalam bentuk kuadrat, karena standar deviasi kuadrat N = Banyak subjek pengikut tes Berdasarkan data tabel belahan ganjil-genap perhitungannya adalah sebagai berikut:



Dimasukkan ke dalam rumus diperoleh demikian: RI I = 2(1-



1,859+1,937 2,359



)



= -2(1-1,609) = - 1,218 4. Penggunaan Rumus Rulon Rumus : 𝑆2



RI I = 1- 𝑆𝑑2 𝑡



Dimana : 𝑆𝑑2 = varians beda d = difference yaitu perbedaan antara skor belahan pertama (awal) dengan skor belahan kedua (akhir) untuk memperjelas keterangan maka tabel belahan awal-akhir, yaitu: No. Nama Awal Akhir d



1



Hartati



3



5



-2



2



Yoyok



2



3



-1



3



Oktaf



1



3



-2



4



Wendi



3



2



1



5



Diana



5



1



4



6



Paul



3



1



2



7



Susana



5



2



3



8



Helen



3



5



-2



∑𝑑 = 3 ∑ 𝑑 2 = 43 Dari hitungan terdahulu diketahui: Varians total = 2,75



=



𝟒𝟏,𝟖𝟕𝟓 𝟖



= 5, 234



Dimasukkan ke dalam rumus Rulon RI I = 1-



5,234 2,36



= 1-2,218 = - 1,218 Dari perhitungan dengan rumus Flahan maupun Rulon ternyata hasil sama, keduanya lebih besar dari 1,00. Secara teoretik koefisien ini salah tetapi karena pembulatan-pembulatan dalam perhitungan.



Salah satu syarat untuk danat menggunakan metode belah dua adalah bahwa banyaknya item harus genap agar dapat dibelah. Syarat yang kedua item-item yang membentuk soal tes harus homogen atau paling tidak setelah dibelah terdapat keseimbangan antara belahan pertama dengan belahan kedua. Untuk mengatasi kesulitan memenuhi persyaratan ini maka reliabilitas dapat divari dengan rumus yang diketemukan oleh Kuder dan Richardson. Kedua orang ahli ini menemukan banyak rumus yang diberi nomor. Rumus yang digunakan untuk mencari reliabilitas dan banyak digunakan orang ada dua rumus yaitu rumus K-R.20 dan rumus K-R.21.



5. Penggunaan rumus K-R.20 Rumus :



Dimana : rI I = reliabilitas tes secara keseluruhan p = proporsi subjek yang menjawab item dengan benar q = proporsi subjek yang menjawab item dengan salah (q=1-p) ∑ 𝑝𝑞 = jumlah hasil perkalian antara p dan q n = banyaknya item S = standar deviasi dari tes (standar deviasi adalah akar varians). Dalam buku-buku lain n (n kecil) ini sering diganti dengan huruf k (k kecil), yang juga melambangkan banyaknya item. Demikian juga haru S sebagai lambang standar deviasi, dituliskan SB sebagai singkatan dari kata Simpangan Baku. Maka rumus K-R.20 menjadi:



Penggunaan huruf k ini juga berlaku bagi rumus-rumus lain yang melibatkan banyaknya item tes, misalnya K-R.21 dan rumus Al-pha. Untuk memberikan contoh perhitungan mencari reliabilitas yang menggunakan rumus K-R.20 ini akan dibuatkan tabel analisis item yang lain.



TABEL PERHITUNGAN MENCARI REALIBILITAS TES DENGAN RUMUS K-R.20 Nomor Item No.



1



2



3



4



5



6



7



Skor Total



Nama



1



Wardoyo



1



0



1



1



1



1



0



5



2



Benny



0



1



1



0



1



1



1



5



3



Hanafi



0



0



0



0



1



0



1



2



4



Rahmad



0



1



1



1



1



1



1



6



5



Tanti



1



0



0



0



1



0



0



2



6



Nadia



0



1



1



1



1



0



0



4



7



Tini



0



0



0



1



1



1



0



3



8



Budi



0



1



0



1



1



0



0



3



9



Daron



0



1



0



1



1



0



0



3



10



Yakob



0



0



0



1



1



0



0



2



Np



2



5



4



7



10



4



3



35



P



0,2



0,5



0,4



0,7



1



0,4



0,3



Q



0,8



0,5



0,6



0,3



0



0,6



0,7



pq



0,16



0,25



0,24



0,21



0



0,24



0,21



1,31 (𝑝𝑞)



Dimasukkan ke dalam rumus K-R.20 𝑛



RI I = (𝑛−1)( 7



=6 x



𝑆 2 − ∑ 𝑝𝑞



𝑆2 2 1,36 – 1,31 1,362



)



S = 1,56 = 1,17 x



1,85−1,31



1,85 0,54



= 1,17 x 1,85



= 1,17 x 0,29 = 0,3415, dibulatkan 0,342 6. Penggunaan rumus K-R.21



Jika dibandingkan reliabilitas yang dihitung dengan K-R.20 dan K-R.21 lebih besar yang ertama. Memang menggunakan rumus K-R.20 cenderung memberikan hasil yang lebih tinggi, tetapi pekerjaannya lebih rumit. 7. Penggunaan rumus Hoyt



rI I = 1-



𝑉𝑠 𝑉𝑟



atau



rI I =



𝑉𝑟−𝑉𝑠 𝑉𝑟



dimana : rI I = reliabilitas seluruh soal Vr = Varians responden Vs = Varians sisa Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-langkah sebagai berikut:



Langkah 1. Mencari jumlah kuadrat responden dengan rumus : Jk(r) =



∑ 𝑋𝑡 2 𝑘



-



(∑ 𝑋𝑡)



2



𝑘𝑥𝑁



Dimana : Jk(r) = jumlah kuadrat responden



𝑥𝑡) = skor total tiap responden k = banyaknya item N = banyaknya responden atau subjek



Langkah 2. Mencari jumlah kuadrat item dengan rumus: Jk(i) =



∑ 𝐵2 𝑁



-



(∑ 𝑋𝑡)



2



𝑘𝑥𝑁



Dimana : Jk(i) = jumlah kuadrat item ∑ 𝐵 2 = jumlah kuadrat jawab benar seluruhnya (∑ 𝑋𝑡 )2 = kuadrat dari jumalh skor total Langkah 3. Mencari jumlah kuadrat total dengan rumus: (∑ 𝐵)(∑ 𝑆)



Jk(t) = (∑ 𝐵)+ (∑ 𝑆) Dimana : Jk(t) = jumlah kuadrat total (∑ 𝐵) = jumlah jawab benar seluruh item (∑ 𝑆) = jumlah jawab salah seluruh item Langkah 4. Mencari jumlah kuadrat sisa, dengan rumus: Jk(s) = Jk(t) - Jk(r) - J(i) Langkah 5. Mencari varians responden dan varians sisa dengan tabel F Dalam mencari varians ini diperlukan d.b (derajat kebebasan) dari masing-masing sumber varians kemudian d.b ini digunakan sebagai penyebut terhadap setiap jumlah kuadrat untuk memperoleh variansi. d.b = banyaknya N setiap sumber variansi dikurangi 1



jadi Variansi =



jumlah kuadrat d.b



Langkah 6. Memasukkan ke dalam rumus rI I = Contoh perhitungan: Dengan menggunakan tabel analisis item yang digunakan untuk mencari reliabilitas tes dengan rumus K-R.20 dapat dicarikan reliabilitas dengan rumus Hoyt.



TABEL ANALISIS ITEM UNTUK MENCARI RELIABILITAS DENGAN RUMUS HOYT. No.



Nama



1



2



3



4



5



6



7



Skor total (x)



Kuadrat skor total (x2)



1



Wardoyo



1



0



1



1



1



1



0



5



25



2



Benny



0



1



1



0



1



1



1



5



25



3



Hanafi



0



0



0



0



1



0



1



2



4



4



Rahmad



0



1



1



1



1



1



1



6



36



5



Tanti



1



0



0



0



1



0



0



2



4



6



Nadia



0



1



1



1



1



0



0



4



16



7



Tini



0



0



0



1



1



1



0



3



9



8



Budi



0



1



0



1



1



0



0



3



9



9



Daron



0



1



0



1



1



0



0



3



9



10



Yakob



0



0



0



1



1



0



0



2



4



Jumlah jawab 2 benar



5



4



7



10



4



3



35



141



Kuadrat jumlah benar



4



25



16



49



100 16



9



∑ 𝑋𝑡



Jumlah kuadrat jumlah jawab benar



∑ 𝑋𝑡 2 219



Jumlah jawab 8 salah



5



6



3



0



6



7



35



Berdasarkan tabel ini dapat dicari reliabilitas soal dengan rumus Hoyt melalui langkah-langkah sebagai berikut: Jk(r) =



=



∑ 𝑋𝑡 2 𝑘 141 7







-



(∑ 𝑋𝑡)



2



𝑘𝑥𝑁 352



7 𝑥 10



= 20,143 – 17,5 = 2,643



Langkah 5. Mencari varians responden dan varians sisa dengan tabel F



Untuk mencari d.b sisa, harus dicari d.b total terlebih dahulu baru dikurangi d.b responden dan d.b item. d.b total = k xN -1 +7 x 10 – 1 = 70 -1 = 69 d.b responden = N – 1 = 10 – 1 = 9 d.b item =k–1=7–1=6 d.b sisa = d.b total – d.b responden – d.b item = 69-9-6 = 54 Langkah 6. Memasukkan ke dalam rumus



𝑉𝑠



RI I = 1- 𝑉𝑟 = 1-



0,1936 0,294



= 1-0,658 + 0,342



1.3 Mencari Reliabilitas Tes Bentuk Uraian Menilai soal bentuk uraian tidak dapat dilakukan dengan dinilai hanya benar dan saah. Sesuatu butir soal uraian menghendaki gradualisasi penilaian. Bisa saja butir soal nomor 1 penilaian terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai tertinggi hanya 5, dan butir soal nomor 3 sampai 10, dan sebagainya. Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan analisis butir soal seperti halnya soal bentuk objektif. Skor untuk masing- masing butir soal dicantumkan pada kolom item menurut apa adanya. Rumusan yang digunakan adalah rumus Alpha sebagai berikut:



Dimana : rI I = reliabilitas yang dicari 2 ∑ 𝜎1 = jumlah varians skor tiap-tiap item 𝜎1 2 = varians total



BAB III PENUTUP 1.1 KESIMPULAN Validitas berasal dari kata ’’validity’’ yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukuran tersebut. Tes yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes yang memiliki validitas rendah (Azwar, 1997). Validitas adalah ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi, jadi jika data yang dihasilkan dari sebuah instrument valid, maka dapat dikatakan bahwa istrumen tersebut valid, karena dapat memberikan gambaran tetang data secara benar sesuai dengan kenyataan atau keadaan sesungguhnya jadi jika data yang dihasilkan oleh instrument benar atau valid, sesuai kenyataan, maka instrument yang digunakan tersebut juga valid. Menurut arti kata reliabel berarti dapat dipercaya. Berdasarkan arti kata tersebut, maka instrumen yang reliabel adalah instrumen yang hasil pengukurannya dapat dipecaya. Reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus kolerasi produk moment untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes. Kriteria yang digunakan untuk mengetahui ketetapan ada yang beradda di luar tes (consistency external) dan pada tes itu sendiri (consistency internal).



1.2 SARAN Dalam penilaian validitas dan reabilitas hal utama yang harus diperhatikan yaitu kejujuran dalam menilai pembelajaran. Karena dalam penilaian validitas dan reabilitas akan mementukan kualitas sekolah dan memperlihatkan keberhasilan sekolah dalam memenuhi standar siswa.



DAFTAR PUSTAKA Arikunto, Suharsimi. 2005. Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi). Jakarta: Bumi Aksara. Drs. Asrul, M.Si, dkk. 2015. Evaluasi Pembelajaran. Medan: Perdana Mulya Sarana. https://www.statistikian.com/2012/08/uji-validitas.html/amp