Salinan Terjemahan Martin Garry, Joseph Pear-Behavior Modification - What It Is and How To Do It-Pearson (2015) (PDF - Io) [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

214



BAB ​22 Melakukan Penelitian Modifikasi Perilaku TUJUAN BELAJAR Setelah mempelajari bab ini, Anda akan dapat: • Menjabarkan desain penelitian yang biasa digunakan ketika melakukan riset dalam modifikasi perilaku. • Menjelaskan kriteria ilmiah yang biasanya



digunakan analis perilaku untuk mengevaluasi apakah suatu perawatan telah menghasilkan perubahan perilaku. • Diskusikan cara-cara untuk mengevaluasi penerimaan suatu perlakuan perilaku kepada para penerima.



Seperti dijelaskan dalam Bab 20, program modifikasi perilaku minimal memiliki empat fase: ​fase penyaringan untuk mengklarifikasi masalah dan menentukan siapa yang harus mengobatinya, sebuah ​penilaian atau fase dasar ​untuk menentukan penyebab perilaku masalah dan tingkat awalnya sebelum program, ​fase perawatan ​di mana strategi intervensi dimulai, dan ​fase tindak lanjut ​untuk mengevaluasi persistensi perubahan perilaku yang diinginkan setelah penghentian program. Banyak proyek modifikasi perilaku melampaui fase-fase ini dan menunjukkan dengan meyakinkan bahwa memang perawatan itulah yang menyebabkan perubahan perilaku tertentu. Nilai demonstrasi semacam itu mungkin digambarkan paling baik dengan contoh hipotetis berikut. Kelly, siswa kelas dua, berprestasi pada level yang jauh lebih rendah dalam menyelesaikan masalah penjumlahan dan sub-traksi daripada siswa lain di kelas matematika hariannya. Selain itu, dia mengganggu selama kelas. Guru beralasan bahwa meningkatkan kinerja Kelly dalam menyelesaikan soal matematika yang ditugaskan mungkin membuatnya lebih menyenangkan bagi Kelly untuk bekerja pada masalah tersebut dan mungkin juga mengurangi interaksi yang mengganggu dengan siswa terdekat. Selama baseline 1 minggu, guru menugaskan sejumlah masalah ke kelas dan mencatat jumlah yang berhasil diselesaikan Kelly selama setiap periode setengah jam. Kelly rata-rata tujuh berhasil menyelesaikan soal matematika per setengah jam, kurang dari setengah rata-rata kelas dari 16 masalah dalam jumlah waktu yang sama. Guru berikutnya memperkenalkan program penguatan, memberi tahu Kelly bahwa setiap masalah matematika yang berhasil diselesaikan akan



menambah satu menit istirahat tambahan untuk seluruh kelas pada hari Jumat sore. Kinerja Kelly meningkat selama minggu pertama program. Selama minggu kedua, Kelly melebihi rata-rata kelas dari 16 masalah matematika yang benar per setengah jam kelas. Bisakah guru menghubungkan peningkatan kinerja Kelly dengan perawatan? Kecenderungan awal kami mungkin untuk mengatakan ya karena kinerjanya sekarang jauh lebih baik daripada sebelumnya. Pertimbangkan, bagaimanapun, bahwa peningkatan itu mungkin merupakan hasil dari faktor-faktor lain. Sebagai contoh, flu yang buruk dapat menekan kinerja awal Kelly, dan pemulihan dari flu mungkin meningkatkan kinerja matematika setelah program dimulai. Masalah yang ditugaskan selama fase pengobatan mungkin lebih mudah daripada yang ditugaskan selama awal. Atau mungkin sesuatu yang guru tidak mungkin sadari bertanggung jawab atas peningkatan kinerja. Penelitian modifikasi perilaku berusaha untuk menunjukkan secara meyakinkan bahwa itu adalah pengobatan, bukan variabel yang tidak terkontrol, yang bertanggung jawab atas perubahan dalam perilaku target. Bab 22 ​► ​Melakukan Penelitian Modifikasi Perilaku ​215



desain pembalikan-replikasi (ABAB) ​Misalkan guru ingin menunjukkan dengan



meyakinkan bahwa program perawatan memang bertanggung jawab untuk peningkatan Kelly. Selain memuaskan keingintahuan guru, ada beberapa alasan praktis mengapa demonstrasi seperti itu mungkin diinginkan. Demonstrasi semacam itu dapat menunjukkan apakah akan mencoba prosedur yang sama dengan masalah lain yang mungkin Kelly miliki, apakah akan mencoba prosedur yang sama dengan siswa lain di kelas, atau bahkan apakah guru harus merekomendasikan prosedur yang serupa dengan guru lain. Oleh karena itu, pada akhir minggu kedua program penguatan, guru memutuskan untuk menghilangkan penguatan dan kembali ke kondisi awal. Misalkan hasil hipotesis manipulasi oleh guru ini adalah yang ditunjukkan pada Gambar 22.1. Pada akhir minggu kedua kembali ke kondisi baseline, Kelly berkinerja di sekitar level baseline-nya. Guru kemudian memperkenalkan kembali fase perawatan dan kinerja Kelly meningkat (lihat Gambar 22.1). Guru telah mereplikasi baik baseline asli dan efek perawatan asli. Jika beberapa variabel yang tidak terkontrol beroperasi, kita harus berhipotesis bahwa itu terjadi secara misterius pada waktu yang sama ketika program perawatan beroperasi dan tidak terjadi ketika program perawatan dihapus. Ini menjadi jauh lebih masuk akal dengan setiap replikasi efek yang berhasil. Kami sekarang yakin bahwa memang prosedur gurulah yang menghasilkan perubahan perilaku yang diinginkan. Dengan demikian, guru menunjukkan hubungan sebab-akibat antara perilaku tertentu dan program perawatan. Dalam terminologi penelitian, ukuran perilaku disebut sebagai ​variabel dependen; ​pengobatan atau intervensi disebut sebagai ​variabel independen. ​Dalam contoh sebelumnya, menyelesaikan soal matematika dengan benar adalah variabel dependen dan program guru untuk Kelly adalah variabel independen. Dua pertimbangan dalam mengevaluasi hubungan sebab-akibat yang mungkin adalah validitas internal dan validitas eksternal. Suatu penelitian atau eksperimen dikatakan memiliki ​validitas internal ​jika secara meyakinkan menunjukkan bahwa variabel independen menyebabkan perubahan yang diamati pada variabel dependen. Sebuah studi atau eksperimen dikatakan memiliki ​validitas eksternal ​sejauh temuan dapat digeneralisasi ke perilaku, individu, pengaturan, atau perawatan lainnya. Jenis strategi penelitian yang digunakan guru Kelly disebut desain ​pembalikan-replikasi, ​yang merupakan desain eksperimental yang terdiri dari fase dasar diikuti oleh fase pengobatan, diikuti oleh pembalikan kembali ke kondisi awal, dan diikuti oleh replikasi pengobatan tahap. Baseline sering direpresentasikan sebagai A dan perawatan dicatat sebagai B. Oleh karena itu, desain penelitian ini juga disebut ​desain ABAB. ​Ini juga disebut ​penarikan d​ esainkarena pengobatan ditarik selama fase awal kedua (Poling, Methot, & LeSage, 1995). Untuk contoh penggunaan desain ini dalam studi penelitian yang sebenarnya, lihat Kadey dan Roane (2012).



Gambar 22.1 ​Data hipotetis menunjukkan desain reversal-replikasi (ABAB) untuk Kelly



216 ​pArt iVpemula yang ​► Berurusan dengan Data



Meskipun desain replikasi-replikasi tampak sederhana pada pandangan pertama, siswamelakukan penelitian modifikasi perilaku dengan cepat memiliki beberapa pertanyaan yang tidak mudah dijawab . Dengan asumsi bahwa masalah definisi respon, akurasi pengamat, dan pencatatan data (dibahas pada Bab 21) telah dipecahkan, pertanyaan pertama adalah: Berapa lama fase baseline bertahan? Kesulitan menjawab pertanyaan ini mungkin paling dihargai dengan melihat Gambar 22.2. Manakah dari garis dasar dalam gambar ini yang Anda anggap paling memadai? Jika Anda memilih baseline 4 dan 5, kami setuju. Baseline 4 dapat diterima karena pola perilaku tampak stabil dan dapat diprediksi. Baseline 5 dapat diterima karena tren yang diamati berada dalam arah yang berlawanan dengan efek yang diprediksi untuk variabel independen yang bekerja pada variabel dependen. Idealnya, kemudian, fase dasar harus berlanjut sampai pola kinerja stabil atau sampai menunjukkan tren dalam arah yang berlawanan dengan yang diprediksi ketika variabel independen diperkenalkan.



Gambar 22.2 ​Data hipotetis untuk lima anak



Pertimbangan lain mungkin mengarah pada memperpendek atau memperpanjang garis dasar dalam proyek penelitian terapan. Pertama, pertimbangan ilmiah terkait dengan kebaruan variabel independen dan dependen harus ditinjau. Kita mungkin lebih nyaman melakukan baseline yang lebih pendek dalam studi perilaku baru yang telah diteliti dengan baik daripada dalam studi di area yang kurang dieksplorasi. Kedua, pertimbangan praktis mungkin membatasi panjang pengamatan dasar. Waktu yang tersedia peneliti, ketersediaan pengamat, pembatasan siswa untuk menyelesaikan proyek tepat waktu, dan sejumlah faktor lain dapat mengarahkan kita untuk membatasi atau memperpanjang baseline karena alasan yang tidak ilmiah. Akhirnya, pertimbangan etis sering mempengaruhi panjang garis dasar. Sebagai contoh, fase dasar yang diperpanjang secara etis tidak dapat diterima ketika mencoba untuk mengelola perilaku melecehkan diri seorang anak dengan cacat perkembangan. Bab 22pemula ​► ​Melakukan Penelitian Modifikasi Perilaku ​217



Pertanyaan lain yang diajukan siswadalam penelitian modifikasi perilaku berkaitan dengan berapa banyak pembalikan dan replikasi yang diperlukan. Sekali lagi, pertanyaan ini tidak memiliki jawaban yang



mudah. Jika kita mengamati efek yang sangat besar ketika variabel independen diperkenalkan dan jika area tersebut adalah yang telah dieksplorasi sebelumnya, satu replikasi mungkin cukup. Kombinasi faktor-faktor lain mungkin mengarahkan kita untuk melakukan beberapa replikasi untuk secara meyakinkan menunjukkan hubungan sebab-akibat. Meskipun desain pembalikan-replikasi adalah strategi penelitian modifikasi perilaku umum, ia memiliki keterbatasan yang membuatnya tidak sesuai dalam situasi tertentu. Pertama, mungkin tidak diinginkan untuk kembali ke kondisi awal setelah fase perawatan. Ketika memperlakukan perilaku melecehkan diri seorang anak, misalnya, kembali ke awal setelah pengobatan yang berhasil untuk membuktikan bahwa perawatan itu bertanggung jawab atas perubahan perilaku akan secara etis tidak dapat diterima. Kedua, mungkin tidak mungkin untuk mendapatkan pembalikan karena perangkap perilaku. Dalam Bab 16, kami menjelaskan bagaimana perilaku yang lebih baik menjadi "terperangkap." Begitu seorang anak yang pemalu diajari berinteraksi dengan teman sebaya, perilaku interaktif ini dapat dipertahankan dengan perhatian dari teman sebayanya. Setelah seorang pro golf mengajarkan seorang pemula untuk memukul bola golf lebih dari 200 yard, tidak mungkin pegolf pemula akan kembali ke ayunan yang menghasilkan drive 150 yard.



Pertanyaan untuk Pembelajaran 1. ​Sebutkan secara singkat dan jelaskan empat komponen minimal dari program modifikasi perilaku. ​2. ​Dalam dua atau tiga kalimat, jelaskan mengapa kita tidak dapat selalu mengklaim bahwa perubahan perilaku selamaminimal program modifikasi perilakuadalah karena perawatan. ​3. ​Dalam dua atau tiga kalimat, bedakan antara program modifikasi perilaku minimal danmodifikasi perilaku riset. ​4. ​Tentukan ​variabel dependen, ​dan berikan contoh. ​5. ​Tetapkan ​variabel independen, d​ an berikan contoh. 6. ​Tetapkan ​validitas internal.​ ​7. ​Tetapkan ​validitas eksternal.​ ​8. ​Dengan mengacu pada contoh, jelaskan secara singkat keempat komponen dari desain pembalikan-replikasi. Apa nama lain untuk desain ini? ​9. ​Idealnya, berapa lama fase dasar dari desain replikasi-pembalikan akan berlanjut? ​10. ​Dalam satu atau dua kalimat, jelaskan mengapa Baselines 1, 2, dan 3 dari Gambar 22.2 tidak memadai. 11. ​Pertimbangan ilmiah, praktis, dan etis apa yang mungkin membuat seseorang memperpanjang atau memperpendek garis dasar? ​12. ​Berapa banyak pembalikan dan replikasi yang diperlukan dalam desain pembalikan-replikasi? ​13. Identifikasi dua keterbatasan dari desain pembalikan-replikasi, dan berikan contoh masing-masing.



Desain Multi-Baseline ​Mengembalikan perilaku ke baseline kadang-kadang mungkin tidak mungkin dan membalikkan peningkatan perilaku bahkan untuk waktu yang singkat sering tidak diinginkan. Desain multi-baseline digunakan untuk menunjukkan efektivitas perawatan tertentu tanpa membalikkan ke kondisi awal.



Desain Multi-Baseline-Across-Behaviors ​Misalkan guru Kelly ingin menunjukkan efek



dari prosedur penguatan pada kinerja akademik anak tetapi tidak ingin melakukan pembalikan dan risiko kehilangan perbaikan yang ditunjukkan Kelly. Guru mungkin menunjukkan efek perlakuan dengan menggunakan desain ​multi-baseline-lintas-perilaku ​yang melibatkan menetapkan garis dasar untuk dua atau lebih perilaku individu diikuti dengan memperkenalkan pengobatan secara berurutan di seluruh perilaku tersebut. Langkah pertama bagi guru Kelly untuk menerapkan desain ini mungkin untuk merekam kinerja Kelly dalam memecahkan masalah matematika selama kelas matematika serta dalam penulisan ejaan dan



kalimat selama seni bahasa. Baseline yang dihasilkan mungkin yang ditunjukkan pada Gambar 22.3. Perlakuan reses ekstra satu menit per masalah yang benar mungkin telah diperkenalkan di kelas matematika sementara kondisi dasar lainnya mungkin telah berlanjut selama seni bahasa. Jika hasilnya adalah yang ditunjukkan pada Gambar 22.3, guru selanjutnya mungkin telah memperkenalkan pengobatan untuk perilaku kedua dengan memberikan waktu istirahat tambahan untuk setiap kata yang dieja dengan benar oleh Kelly. Akhirnya, guru mungkin telah memperkenalkan pengobatan untuk perilaku ketiga — penulisan kalimat. Jika kinerja seperti yang ditunjukkan pada Gambar 22.3, perilaku berubah hanya ketika pengobatan diperkenalkan. Contoh hipotetis ini mengilustrasikan kontrol perawatan terhadap beberapa perilaku. Untuk contoh desain ini dalam studi penelitian, lihat Gena, Krantz, McClannahan, dan Poulson (1996), dan Ax dan Sainato (2010).



218 ​pArt iV ​► ​Berurusan dengan Data



Masalah potensial dengan desain ini adalah bahwa perilaku mungkin tidak independen (misalnya, Nordquist, 1971). Jika guru Kelly telah menerapkan program pengobatan pada satu perilaku sementara dua perilaku lainnya dipertahankan pada kondisi awal dan jika perbaikan telah diamati pada ketiga perilaku secara bersamaan, guru tidak dapat dengan percaya diri menghubungkan peningkatan dengan pengobatan karena dua dari tiga perilaku yang membaik tidak menerima perawatan. Keterbatasan lain adalah bahwa tidak mungkin untuk menemukan dua atau lebih perilaku yang sesuai atau pengamat yang memadai untuk mengumpulkan data yang diperlukan pada beberapa perilaku. Selain itu, jika prosedur ini digunakan hanya dengan satu orang, kita



dapat menyimpulkan bahwa perawatan tersebut secara internal valid dengan individu tersebut. Kita harus berhati-hati dalam memperkirakan hasil untuk individu lain.



Desain Multi-Baseline-Across-Situationsdesain ​Sebuah



multiple-baseline-lintas-situasi ​melibatkan penetapan baseline untuk perilaku individu di dua situasi atau lebih secara bersamaan diikuti oleh pengenalan perawatan pada perilaku secara berurutan di seluruh situasi tersebut. Sebagai contoh, Allen (1973) prihatin dengan menurunnya verbalisasi aneh bocah berusia 8 tahun dengan kerusakan otak minimal. Saat menghadiri kemah musim panas, bocah itu berkhayal selama berjam-jam tentang penguin hewan peliharaan imajinasinya yang ia sebut Tug Tug dan Junior Polka Dot. Verbalisasi ini mengganggu interaksi bocah itu dengan teman-temannya dan para penasihat kamp. Selama fase awal awal, data pada verbalisasi dikumpulkan dalam empat situasi: selama jalan setapak di malam hari, di ruang makan, di kabin anak laki-laki, dan selama kelas. Perawatan, program kepunahan yang mengabaikan verbalisasi, kemudian diperkenalkan pada situasi pertama (jejak jalan kaki) sementara tiga situasi lainnya berlanjut pada awal. Setelah berhasil mengurangi verbalisasi selama jalan setapak, pengobatan diperkenalkan pada situasi kedua, ruang makan, dan dua situasi lainnya berlanjut pada awal. Akhirnya, pengobatan diperkenalkan secara berurutan di dua situasi yang tersisa. Jumlah harian dari verbalisasi aneh. Gambar 22.3 ​Data hipotetis menggambarkan desain multi-baseline-lintas-perilaku untuk Kelly



ChApter 22 ​► ​Melakukan Penelitian Modifikasi Perilaku Perilaku



219



menurun mendekati nol di setiap situasi setelah pengenalan pengobatan untuk situasi itu. Untuk contoh lain dari penggunaan desain ini dalam penelitian, lihat Graff dan Karsten (2012). Mirip dengan potensi masalah dengan desain multiple-baseline-lintas-perilaku, dalam desain multiple-baseline-lintas-situasi, ketika perawatan diterapkan pada perilaku dalam situasi pertama, mungkin menyebabkan peningkatan selanjutnya dalam semua situasi (yaitu , generalisasi stimulus di seluruh situasi). Ketika ini terjadi, peneliti tidak dapat menyimpulkan bahwa perbaikan itu tentu merupakan hasil dari perawatan. Keterbatasan potensial lainnya adalah bahwa perilaku mungkin terjadi hanya dalam satu situasi, atau mungkin tidak ada pengamat yang memadai untuk mengumpulkan data yang diperlukan. Selain itu, jika prosedur ini digunakan hanya dengan satu orang, kita dapat menyimpulkan bahwa pengobatannya hanya efektif untuk orang tersebut. Kita harus berhati-hati dalam meramalkan hasilnya kepada orang lain.



Sebuah Multiple-Dasar-Di-orang Desain ​A ​multiple-dasar-di-orang desain ​melibatkan



membangun baseline untuk perilaku tertentu di dua atau lebih orang secara bersamaan diikuti dengan pengenalan pengobatan secara berurutan untuk setiap orang. Sebagai contoh, Wanlin, Hrycaiko, Martin, dan Mahon (1997) menggunakan desain multi-baseline-lintas-orang untuk menunjukkan efektivitas kombinasi prosedur (disebut ​paket perawatan)​ yang dirancang untuk meningkatkan kinerja praktik empat perempuan. skaters kecepatan. Jumlah rata-rata putaran skating yang diselesaikan per latihan dari empat skater dicatat selama latihan awal. Skater pertama kemudian diberi paket perawatan sementara yang lain melanjutkan pada awal. Paparan terhadap paket perawatan meningkatkan kinerja latihan skater pertama. Di seluruh praktik, paket perawatan diperkenalkan secara berurutan untuk skater kedua, kemudian ke skater ketiga, dan kemudian ke skater keempat, dan setiap kali itu mengarah pada peningkatan jumlah lap skating per latihan. Demonstrasi peningkatan pada individu yang menerima pengobatan secara berurutan melintasi waktu adalah demonstrasi yang meyakinkan tentang efektivitas program perawatan. Untuk aplikasi terbaru dari desain ini, lihat Kraus, Hanley, Cesana, Eisenberg, dan Jarvie (2012). Masalah potensial dengan desain multi-baseline-lintas-orang adalah bahwa individu pertama



mungkin menjelaskan pengobatan atau memodelkan perilaku yang diinginkan kepada individu lain, menyebabkan mereka membaik tanpa adanya pengobatan (lihat, misalnya, Kazdin, 1973) . Selain itu, tidak selalu mungkin untuk menemukan dua atau lebih individu dengan masalah yang sama atau pengamat tambahan yang diperlukan untuk mengumpulkan data. Perhatikan bahwa berhasil mereplikasi efek di seluruh individu menunjukkan validitas internal dan tingkat validitas eksternal, di mana kita dapat memperkirakan efek dengan percaya diri kepada individu lain.



Pertanyaan untuk Pembelajaran ​14. ​Sebutkan keunggulan desain



multi-baseline dibandingkan desain replikasi-replikasi. ​15. ​Dengan merujuk pada contoh, jelaskan secara singkat desain multi-baseline-lintas-perilaku. ​16. ​Apa tiga batasan potensial dari desain multi-baseline-lintas-perilaku? ​17. ​Dengan merujuk pada contoh, jelaskan secara singkat desain multi-baseline-lintas-situasi. ​18. ​Apa tiga batasan potensial dari desain multi-baseline-lintas-situasi? 19. ​Dengan merujuk pada contoh, jelaskan secara singkat desain multi-baseline-lintas-orang. ​20. ​Apa tiga batasan potensial dari desain multi-baseline-lintas-orang?



Desain Kriteria Mengubah ​Dengan ​desain kriteria perubahan, ​kontrol yang diberikan



suatu perlakuan pada perilaku individu dievaluasi dengan memperkenalkan perubahan berturut-turut dalam kriteria perilaku untuk penerapan pengobatan. Jika perilaku secara konsisten berubah ke arah yang sama setiap kali perubahan dilakukan dalam kriteria untuk penerapan pengobatan, kita dapat menyimpulkan bahwa perawatan bertanggung jawab atas perubahan perilaku. DeLuca dan Holborn (1992) menggunakan desain kriteria perubahan untuk menunjukkan efek dari sistem penguatan token pada latihan oleh anak laki-laki berusia 11 tahun, beberapa di antaranya mengalami obesitas dan yang lainnya tidak. Pertama, selama Fase 1 (garis dasar), yang terdiri dari beberapa sesi latihan 30 menit, mereka menilai kecepatan mengayuh setiap anak laki-laki dengan sepeda statis. Berdasarkan data ini, mereka menetapkan kriteria untuk penguatan untuk setiap anak laki-laki yang kira-kira 15% di atas rata-rata tingkat dasar mengayuh. Dalam Fase 2, ketika seorang anak laki-laki memenuhi kriteria, ia mendapatkan poin (ditandai oleh bel berbunyi dan lampu menyala



220 ​pArt iV ​► ​Berurusan dengan Data 150 Baseline (B) VR 85 VR 115 VR 125 B VR 125



e tuniMr eps noituloveRn ae​



140 130 120 ​110 100Shawn ​9080706050400 ​ ​



M /​/



Sessions



Gambar 22.4 ​Rata-rata jumlah putaran per menit yang diayunkan pada sepeda stasioner oleh seorang anak laki-laki.



Setelah fase baseline, penguatan token diberikan pada level yang lebih besar dari penguatan variable ratio (VR) (yaitu , persyaratan respons rata-rata menjadi semakin besar) Sumber: G ​ ambar 1 dalam “Pengaruh Jadwal Penguatan Rasio Variabel dengan Mengubah Kriteria Latihan pada Anak Laki-laki yang Gendut dan Tidak Gendut” oleh RV DeLuca dan SW Holborn, ​Journal of Applied Behavior Analysis, 25,​ 1992. Hak Cipta © 1992. Dicetak ulang atas izin Dr. Rayleen DeLuca, University of Manitoba.



On) yang dapat ditukar nanti untuk penguat cadangan. Setelah kinerja anak laki-laki stabil pada tingkat baru yang lebih tinggi dari mengayuh, Fase 3 dimulai; kriteria untuk penguatan diubah menjadi sekitar 15% di atas tingkat kinerja rata-rata di Fase 2. Demikian pula, setiap fase berikutnya meningkatkan kriteria untuk penguatan menjadi 15% lebih tinggi dari rata-rata tingkat pengayuh fase sebelumnya. Seperti pada Gambar 22.4, yang menunjukkan data untuk salah satu anak laki-laki, kinerja meningkat dengan setiap perubahan berikutnya dalam kriteria penguatan. Pola ini ditunjukkan untuk ketiga anak laki-laki yang mengalami obesitas dan tiga anak laki-laki yang tidak. Untuk lebih mendemonstrasikan kontrol eksperimental dari program penguatan, seperti ditunjukkan pada Gambar 22.4, pembalikan ke fase awal dimasukkan dalam penelitian ini. Meskipun pembalikan memberikan



informasi konfirmasi, pembalikan tersebut bukan fitur penentu desain perubahan-kriteria.



Desain Alternating-treatment (Atau Multielement) Desain ​eksperimental



sebelumnya cocok untuk menunjukkan bahwa perawatan tertentu memang bertanggung jawab untuk perubahan perilaku tertentu. Namun, bagaimana jika kita ingin membandingkan efek dari perawatan yang berbeda untuk perilaku tunggal seorang individu? Desain multi-baseline tidak cocok untuk tujuan ini. Desain alternatif untuk masalah seperti itu, pertama kali diusulkan oleh Barlow dan Hayes (1979), dikenal sebagai ​desain perawatan bergantian, ​juga disebut ​desain multielemen, ​yang melibatkan dua atau lebih kondisi perawatan, satu kondisi per sesi, untuk menilai kemampuan mereka. efek pada perilaku tunggal dari satu individu. Misalnya, Wolko, Hrycaiko, dan Martin (1993) prihatin dengan membandingkan tiga perawatan untuk meningkatkan frekuensi keterampilan selesai pesenam muda selama latihan pada balok keseimbangan. Salah satu perawatan adalah pembinaan standar yang biasanya diterapkan oleh pelatih senam. Kondisi kedua adalah pembinaan standar ditambah penetapan tujuan publik, pemantauan, dan umpan balik pelatih. Dalam kondisi ini, pelatih memposting tujuan tertulis untuk pesenam yang mencatat kinerja latihannya, menempatkannya pada grafik di gimnasium, dan menerima umpan balik dari pelatih di akhir setiap latihan. Kondisi ketiga adalah pembinaan standar dan manajemen diri pribadi yang melibatkan pesenam menetapkan tujuan sendiri dan melacak kinerjanya dalam buku catatan pribadi. Tiga kondisi itu secara acak bergantian di seluruh praktik. Hasil dengan salah satu pesenam diplot sebagai tiga grafik kumulatif (lihat Gambar 22.5). Seperti yang ditunjukkan oleh hasil untuk pesenam ini, pembinaan standar plus manajemen diri pribadi secara konsisten lebih efektif daripada pembinaan standar ditambah manajemen diri publik dan pembinaan standar saja (kondisi dasar). Untuk contoh lain dari desain perawatan bergantian, lihat Shayne, Fogel, Miltenberger, dan Koehler (2012). Seperti yang dikatakan Sidman (1960, p. 326), dimungkinkan untuk menggunakan desain perawatan bergantian untuk mempelajari efek dari variabel independen tertentu pada topografi perilaku yang berbeda. Misalnya Ming dan Martin (1996) menggunakan desain perawatan bergantian untuk mempelajari efek dari self-talk pada dua topografi skating tokoh yang berbeda. Bab 22 ​► ​Melakukan Penelitian Modifikasi Perilaku ​221 s llikSd etelpmoCf atau ebmuNe vitalumu​



C400 350



300 250 200 150 100​50 50​Masalah



potensial dengan desain perawatan bergantian adalah bahwa perawatan mungkin berinteraksi;



yaitu, salah satu perawatan mungkin menghasilkan efek karena kontrasnya dengan perlakuan lain dalam sesi bergantian atau generalisasi stimulus di seluruh perawatan. Dan dalam banyak penelitian menggunakan desain perawatan bergantian, interaksi telah terjadi (misalnya, Hains & Baer, ​1989).



Analisis dan interpretasi data Para ​peneliti yang menggunakan desain eksperimental



modifikasi perilaku yang dijelaskan dalam bab ini biasanya menganalisis data mereka tanpa menggunakan kelompok kontrol dan teknik statistik yang lebih umum di bidang psikologi lainnya. Ini bukan untuk mengatakan bahwa analis perilaku tidak pernah menggunakan rata-rata kelompok dan menguji signifikansi statistik dari perbedaan antara kelompok. Secara umum, bagaimanapun, analis perilaku lebih tertarik untuk memahami dan meningkatkan perilaku individu daripada rata-rata kelompok (lihat Blampied, 2013; Sidman, 1960, untuk pembenaran klasik dan elaborasi dari pendekatan ini). Evaluasi efek dari perawatan tertentu biasanya dibuat atas dasar dua set kriteria utama: ilmiah dan praktis. Kriteria ilmiah adalah pedoman yang digunakan peneliti untuk mengevaluasi apakah telah ada demonstrasi yang meyakinkan bahwa pengobatan bertanggung jawab untuk menghasilkan efek yang dapat diandalkan pada variabel dependen. Penilaian ini biasanya dibuat dengan memeriksa grafik hasil secara visual. Masalah dalam memutuskan apakah suatu pengobatan menghasilkan efek yang dapat diandalkan pada variabel dependen mungkin lebih baik dihargai dengan memeriksa Gambar 22.6. Sebagian besar



pengamat dari lima grafik mungkin setuju bahwa ada efek yang jelas dan besar pada Grafik 1, efek yang dapat diandalkan meskipun kecil dalam Grafik 2, dan efek yang dapat dipertanggungjawabkan dalam grafik yang tersisa. Tujuh kriteria biasanya digunakan untuk meningkatkan kepercayaan diri kita bahwa pengobatan berdampak pada variabel dependen. Keyakinan akan efek meningkat: (1) ​semakin sering diulang atau diulang, ​(2) ​semakin sedikit titik yang tumpang tindih antara fase awal dan fase perawatan, ​(3) ​semakin cepat efeknya diamati setelah pengenalan pengobatan, ​( 4) ​semakin besar pengaruhnya, ​(5) semakin tepat prosedur perawatan ditentukan, ​(6) ​semakin dapat diandalkan tindakan responnya, dan ​(7) ​semakin konsisten temuan dengan data yang ada dan teori perilaku yang diterima. Dasar Perawatan1 Perawatan 2 0 1–3 4–6 7–9 10–12 13–15 16–18 Sesi



Gambar 22.5 ​Frekuensi keterampilan balok lengkap untuk seorang pesenam dalam kondisi pelatihan standar (baseline),



pelatihan standar plus swasembada publik manajemen (Pengobatan 1) versus pelatihan standar ditambah manajemen diri pribadi (Pengobatan 2). Setiap kondisi berlaku untuk enam sesi dengan kondisi secara acak bergantian di total 18 sesi Sumber: D ​ iadaptasi dari data dari KL Wolko, DW Hrycaiko, dan GL Martin, “Perbandingan Dua Paket Manajemen Diri dengan Pelatihan Standar untuk Pelatihan Meningkatkan Praktek Kinerja Pesenam, ” ​Modifikasi Perilaku, 17 ​(1993), hlm. 209–223. NOte 1



222 ​pArt iV ​► ​Berurusan dengan Data



Untuk diskusi lebih rinci tentang prosedur inspeksi visual, lihat Bourret dan Pietras (2013). Untuk diskusi tentang masalah inspeksi visual data, lihat Fisch (1998). Untuk deskripsi bantuan visual dan program pelatihan staf untuk meningkatkan keandalan dan validitas inspeksi visual desain kasing tunggal, lihat Fisher, Kelley, dan Lomas (2003). Menilai apakah suatu efek telah ditunjukkan dari sudut pandang ilmiah adalah satu hal; mengevaluasi kepentingan praktis dari perubahan perilaku kepada klien, individu penting lainnya dalam kehidupan klien, dan masyarakat pada umumnya adalah sesuatu yang lain. Dalam mengevaluasi dampak praktis dari perawatan, kita harus mempertimbangkan lebih dari kriteria ilmiah untuk menilai efek perawatan terhadap perilaku. Jika Grafik 2 pada Gambar 22.6 adalah grafik perilaku melecehkan diri sendiri, hubungan sebab-akibat yang dapat diandalkan telah ditunjukkan tetapi mungkin memiliki signifikansi klinis yang kecil. Jika individu tersebut masih melecehkan diri sendiri selama fase perawatan, mereka yang bertanggung jawab untuk merawat orang



itu tidak akan puas. Penilaian tentang pentingnya praktis perubahan perilaku disebut sebagai ​penilaian efektivitas klinis atau kepentingan sosial. Konsep yang berkaitan dengan kepentingan praktis adalah konsep ​validitas sosial​. Wolf (1978) mengemukakan bahwa pengubah perilaku perlu memvalidasi pekerjaan mereka secara sosial pada setidaknya tiga tingkatan: (1) sejauh mana perilaku target benar-benar yang paling penting bagi klien dan masyarakat, (2) penerimaan terhadap klien dari prosedur khusus yang digunakan, terutama ketika prosedur alternatif dapat mencapai Gambar 22.6 Beberapa hipotesis Data



Bab 22 ​► ​Melakukan Modifikasi Perilaku Penelitian ​223



kira-kira hasil yang sama, dan (3) kepuasan konsumen (klien atau ers caregiv- mereka) dengan hasil. Satu prosedur validasi sosial melibatkan evaluasi subyektif di mana klien atau individu signifikan lainnya ditanya tentang kepuasan mereka dengan tujuan, prosedur, dan hasil. Prosedur validasi sosial lainnya adalah dengan melakukan tes untuk menentukan mana dari dua atau lebih alternatif yang disukai klien. Dalam prosedur ketiga, tujuan serta hasil perawatan divalidasi secara sosial dengan membandingkan hasil dengan klien dengan kinerja rata-rata dari beberapa kelompok pembanding, seperti rekan normal. Kennedy (2002a) mengusulkan bahwa metode validasi sosial, seperti yang tercantum di atas, dilengkapi dengan informasi mengenai pemeliharaan perubahan yang dihasilkan oleh perawatan. Dia beralasan bahwa (1) metode pengukuran validitas sosial ini lebih objektif daripada banyak metode lain yang telah diusulkan, dan (2) perubahan perilaku yang tidak dipertahankan hampir tidak dapat dikatakan valid secara sosial, terlepas dari seberapa tinggi orang dalam lingkungan klien menilai secara subyektif, sedangkan pemeliharaan perubahan perilaku di lingkungan fisik dan sosial klien merupakan indikator yang baik bahwa perubahan perilaku berfungsi untuk klien dan masyarakat. Kennedy (2002b) juga mengusulkan sejumlah indikator sosial lainnya secara sah berkaitan dengan penurunan perilaku masalah. Validasi sosial membantu pengubah perilaku melakukan pekerjaan terbaik yang mereka dapat dalam membantu individu berfungsi penuh dalam masyarakat. Other strategies to ensure accountability of treatment specialists are discussed in Chapter 30.



Questions for Learning ​21. ​With reference to an example, briefly describe the changing-criterion



design. ​22. ​With reference to an example, briefly describe an alternating-treatments design. What is another name for this design? Explain when and why that name might be preferred. ​23. ​Briefly describe a potential problem with the alternating-treatments design. ​24. ​In a sentence or two each, explain the scientific and practical criteria for evaluating the effects of a particular treatment. Be sure to distinguish between the two in your answer. ​25. ​Describe why it is difficult to draw conclusions about the effects of the treatments in Graphs 3, 4, and 5 in Figure 22.6. ​26. ​What seven criteria would give you maximum confidence that the treatment in an ABAB design had produced an effect on the dependent variable? ​27. ​What are the three levels of social validation, and why are they important?



Application exercises A. exercise involving Others



Suppose you are teaching some students about doing research that utilizes reversal-replication and multiple-base- line designs. Your students must do a research project in which they select a dependent variable and evaluate the effects of some treatment on that dependent variable. Your task as the teacher is to analyze the material in this chapter to prepare a guide that will help the students select the appropriate experimental design. Your guide should take the form of a series of if–then statements that would lead to a particular design. For example, if (a) and (b), then choose a reversal design; but if (c), (d), and (e), then choose a multiple-baseline design, and so forth. B. Self-Modification exercise As described in Chapter 20, self-recording without any additional behavioral procedures sometimes causes reactivity— that is, the self-recording alone leads to behavioral change. Suppose you have decided to describe a self-recording procedure and then to investigate that as a treatment in a self-modification program. Describe a plausible multiplebaseline design that would enable you to assess self-recording as an effective self-control treatment.



Note for Further Learning 1. ​The experimental designs described in this chapter are referred to as ​single-case, single-subject, o​ r ​within- subject experimental designs.​ In most of these designs, an individual serves as his or her own control in the sense that performance of that individual in the absence of treatment is compared to that individual's performance during treatment. More common designs in many areas of psychology are control-group or between-subjects designs. A control-group design typically involves at least two groups, one that receives the treatment and one that does not. The average performance of the two groups is then compared accord- ing to appropriate statistical procedures. Single-case designs are more popular than control-group designs among behavior modifiers for a number of reasons (Hrycaiko & Martin, 1996). First, they focus on repeated



224 ​pArt iV ​► ​Dealing with Data measurement of an individual's performance across a number of sessions and therefore provide potentially valuable information on individual variation in performance. Group designs, with their emphasis on the average performance of groups, typically gather data at a single point in time rather than continuously monitoring individuals over time. Second, researchers using single-case designs typically need to locate only a few individuals with the same performance problem in order to evaluate an intervention. Researchers using group designs often find locating enough individuals with the same performance problem to form the different groups to be difficult. Third, because all individuals in a single-case design receive the interven- tion at one time or another, these designs are less vulnerable to the ethical problem of withholding treat- ment, and the researcher does not face resistance from clients (or their significant others) to participate in a no-treatment control group. Fourth, because single-case designs rely on replication logic rather than the sam- pling logic of the group designs (Smith, 1988), they are not hampered by the statistical assumptions required of group designs. Often in research using group designs these assumptions are either not assessed or not met (Hoekstra, Kiers, & Johnson, 2012). For these and other reasons, behavior modifiers favor single-case designs. A number of excellent books on single-case designs are available, including Bailey and Burch (2002), Barlow, Nock, and Hersen (2009), Johnston and Pennypacker (2009), Kazdin (2011), Morgan and Morgan (2009), and Richards, Taylor, and Ramasamy (2014). See Martin, Thompson, and Regehr (2004) and Barker, Mellalieu, McCarthy, Jones, and Moran (2013) for reviews of research and Virues-Ortega and Martin (2010) for guidelines for using single-case designs in sport psychology. For a discussion of some common misunderstandings about single-case designs, see Hrycaiko and Martin (1996). For a discussion of reasons for using between-subjects designs, see Poling, Methot, and LeSage (1995). See Brossart, Parker, Olson, and Mahadevan (2006), Ma (2006), Parker (2006), and Parker and Hagan-Burke (2007) for a discussion on sta- tistical techniques that can be used to interpret single-case research. For a discussion of the pros and cons of using statistical inference procedures in behavior analysis research, see ​The Behavior Analyst, ​2000, Vol. 22, No. 2. For a discussion of meta-analysis of



single-case design research, see the special issue of the ​Journal of Behavioral Education, ​2012, Vol. 21, No. 3.



Question for Further Learning 1. ​List four reasons why many behavior modifiers prefer single-case designs to group designs.