Tinjauan Literatur Beban Kerja Mental [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

TINJAUAN LITERATUR BEBAN KERJA MENTAL Terlepas dari minat pada topik selama 40 tahun terakhir, tidak ada definisi yang jelas tentang definisi beban kerja yang diterima secara universal. Huey and Wickens (1993, p. 54) mencatat bahwa istilah "beban kerja" tidak umum sebelum tahun 1970-an dan bahwa definisi operasional beban kerja dari berbagai bidang terus tidak setuju tentang sumber, mekanisme, konsekuensi, dan pengukurannya. "Aspek dari beban kerja tampaknya termasuk dalam tiga kategori besar: jumlah pekerjaan dan jumlah hal yang harus dilakukan; waktu dan aspek waktu tertentu yang diperhatikan; dan, pengalaman psikologis subyektif dari operator manusia (Lysaght, Hill et al. 1989). Beban kerja dianggap sebagai konstruksi mental, variabel laten, atau mungkin "variabel intervening" (Gopher dan Donchin 1986, hlm. 41-4), yang mencerminkan interaksi tuntutan mental yang dibebankan pada operator dengan tugas-tugas yang mereka hadiri. Kemampuan dan upaya operator dalam konteks situasi tertentu semuanya memoderasi beban kerja yang dialami operator. Beban kerja dianggap multidimensi dan beragam. Beban kerja merupakan hasil agregasi dari banyak tuntutan yang berbeda sehingga sulit untuk didefinisikan secara unik. Casali dan Wierwille (1984) mencatat bahwa karena beban kerja tidak dapat diamati secara langsung, ia harus disimpulkan dari pengamatan perilaku terbuka atau pengukuran proses psikologis dan fisiologis. Gopher dan Donchin (1986, hlm. 41-2) merasa bahwa tidak ada ukuran tunggal, representatif dari beban kerja yang ada atau kemungkinan akan digunakan secara umum, meskipun mereka tidak memberikan panduan tentang berapa banyak ukuran beban kerja yang mereka anggap perlu atau cukup. 1)



“Beban kerja mental mengacu pada porsi kapasitas pemrosesan informasi sumber daya atau yang sebenarnya diperlukan untuk memenuhi tuntutan sistem.” (Eggemeier, Wilson et al. 1991, hal. 207)



2)



"... beban kerja mental dapat dipandang sebagai perbedaan antara kapasitas sistem pemrosesan informasi yang diperlukan untuk kinerja tugas untuk memenuhi harapan kinerja dan kapasitas yang tersedia pada waktu tertentu." (Gopher dan Donchin 1986, hal. 41-3)



3)



"... upaya mental yang dikhususkan operator manusia untuk mengontrol atau pengawasan relatif terhadap kapasitasnya untuk mengeluarkan upaya mental ... beban kerja tidak pernah lebih besar dari persatuan." (Curry, Jex et al. 1979)



4)



"... biaya melakukan tugas dalam hal pengurangan kapasitas untuk melakukan tugas tambahan yang menggunakan sumber daya pemrosesan yang sama." (Kramer, Sirevaag et al. 1987)



5)



"... kapasitas relatif untuk merespons, penekanannya adalah pada memprediksi apa yang akan dapat dicapai oleh operator di masa depan." (Lysaght, Hill et al. 1989, hal. 27)



Gopher dan Braune (1984) mengemukakan bahwa konstruk beban kerja dikandung untuk menjelaskan ketidakmampuan operator manusia untuk mengatasi persyaratan tugas, dan bahwa langkah-langkah beban kerja adalah upaya untuk mengkarakterisasi kinerja suatu tugas relatif terhadap kemampuan operator. Mereka mencatat bahwa hanya ada sedikit pengetahuan untuk mengaitkan pengukuran beban kerja dengan salah satu paradigma dengan paradigma lainnya dan kurangnya teori formal tentang beban kerja telah menyebabkan berkembangnya metode yang berbeda dengan sedikit peluang rekonsiliasi. Temuan awal Gopher dan Braune tampaknya berpendapat bahwa beban kerja mencerminkan tuntutan pada kumpulan sumber daya tunggal yang tidak berbeda (Gopher dan Braune 1984, hal. 530), di mana semua tugas berinteraksi secara serupa dan tuntutan tugas bersamaan pada prinsipnya aditif dengan “overhead” konstan. Perspektif yang ketat ini tidak lagi dipegang. Sekarang diperkirakan bahwa pengolah informasi manusia secara tepat direpresentasikan sebagai terdiri dari banyak sumber daya yang terlibat secara berbeda sesuai dengan karakteristik tuntutan tugas (Jex 1988; Wickens dan Hollands 1999). Meskipun tuntutan tugas dan kemampuan operator mungkin multidimensi, tidak jelas apakah persepsi sadar akan beban kerja harus diwakili dengan cara ini atau sebagai kuantitas skalar tunggal. Beban kerja mental dapat dipengaruhi oleh banyak faktor yang membuat pengukuran definitif menjadi sulit. Jex (1988) menyiratkan bahwa beban kerja mental berasal dari kegiatan meta-controller operator: "perangkat" kognitif yang mengarahkan perhatian, mengatasi tujuan yang berinteraksi, memilih strategi, menyesuaikan kompleksitas tugas, menetapkan toleransi kinerja, dll. Ini mendukung gagasan intuitif bahwa beban kerja dapat direpresentasikan sebagai suatu fungsi, dan kegunaan tindakan beban univariat sebagai perkiraan beban kerja yang peka secara global, sementara mengakui bahwa tugas-tugas dengan karakteristik yang berbeda mengganggu secara berbeda. Sebagai alternatif, Wierwille (1988, p. 318) mengemukakan bahwa seorang operator yang dihadapkan dengan suatu tugas sepenuhnya terlibat sampai tugas tersebut selesai, kemudian menganggur atau terlibat dalam tugas lain. Tidak jelas bagaimana hal ini dapat direkonsiliasi dengan kinerja multitask yang menunjukkan efek interferensi tanpa menggunakan cara berbagi waktu di antara tugas-tugas bersamaan. Posisi Wierwille tampaknya menghalangi interleaving idle dan interval aktif selama pelaksanaan tugas. Beban kerja sering digambarkan dengan istilah-istilah seperti ketegangan mental ("... konsep upaya mental ...") dan ketegangan emosional ("... upaya mental berlebih yang muncul dari kecemasan yang membangkitkan aspek-aspek kognitif dari tugas ... "). Boucsein dan Backs (1999, hal. 8) menguraikan apa yang mungkin merupakan formulasi alternatif untuk merepresentasikan beban kerja atau tekanan, sebagai Model Tiga Gairah, yang lebih erat menyatukan emosi dan stres dengan beban kerja. Gaillard (1993) menyatakan bahwa beban kerja dan stres, sementara terkait, tidak memiliki definisi yang tepat dan berbeda. Baik stres dan beban kerja melibatkan tuntutan lingkungan dan kemampuan operator untuk mengatasi tuntutan itu, tetapi kedua konsep ini berasal dari latar belakang teoretis yang



berbeda. Gaillard memisahkan beban kerja dari emosi, dengan keduanya di bawah kendali mekanisme mental yang lebih tinggi, mirip dengan metakontroller. Jika beban kerja ini merupakan manifestasi dari investasi usaha oleh metakontroller, maka faktor afektif memainkan peran pelengkap untuk pemrosesan informasi dalam persepsi beban kerja, paling baik direpresentasikan sebagai model dua dimensi mobilisasi energi kognitif. Model pemrosesan informasi akan tidak lengkap sesuai dengan perspektif ini. Colle and Reid (1999) menyatakan bahwa "... konsep beban kerja mental adalah konsep yang diterapkan dan ... tidak memiliki hubungan satu-ke-satu dengan kapasitas perhatian atau sumber daya dalam teori pemrosesan informasi." Colle dan Reid fokus pada jumlah kerja mental yang dapat dicapai dalam periode waktu; "... beban mental dianggap sebagai tingkat rata-rata pekerjaan mental ...". Mereka menggambarkan prosedur untuk mendefinisikan beban kerja atau menuntut kesetaraan tugas menggunakan evaluasi trade-off ganda, tetapi mereka tidak menyajikan filosofi untuk mengidentifikasi interval waktu yang tepat untuk tugas dalam penilaian tersebut. Mereka mempresentasikan hasil tiga percobaan sebagai dukungan untuk proposal mereka untuk mengembangkan baterai ukuran tugas sekunder yang sensitif secara global. Huey and Wickens (1993, hlm. 57-68) memberikan gambaran yang baik tentang banyak faktor tugas eksternal yang berkontribusi pada beban kerja. Singkatnya, definisi formal tentang beban kerja yang diterima secara umum tidak ada. Beban kerja dapat dicirikan sebagai konstruksi mental yang mencerminkan ketegangan mental yang dihasilkan dari melakukan tugas di bawah kondisi lingkungan dan operasional tertentu, ditambah dengan kemampuan operator untuk menanggapi tuntutan tersebut. Definisi operasional kemungkinan akan terus diusulkan dan diuji, tetapi kecuali jika kebutuhan mendesak muncul untuk definisi universal, setiap bidang dan mungkin masing-masing penyelidik akan melanjutkan dengan definisi beban kerja yang “disukai secara budaya”. ALASAN UNTUK MENGUKUR BEBAN KERJA Alasan utama untuk mengukur beban kerja adalah untuk menghitung biaya mental dalam melakukan tugas untuk memprediksi kinerja operator dan sistem. Karena itu, ini adalah langkah sementara dan harus memberikan wawasan ke mana peningkatan tuntutan tugas dapat menyebabkan kinerja yang tidak dapat diterima. Wickens (1992, hlm. 390) menegaskan “... kinerja bukanlah yang terpenting dalam desain sistem yang baik. Sama pentingnya untuk mempertimbangkan tuntutan apa yang dibebankan oleh tugas pada sumber daya yang terbatas dari operator. Permintaan mungkin terkait atau tidak dengan kinerja. ”Mulder, Mulder et al. (1999, hal. 140) mencatat "alasan utama untuk mengukur aktivitas fisiologis selama dan setelah kerja mental adalah untuk menilai biaya yang terlibat dalam melakukan tugas-tugas mental dan untuk mengukur durasi efek yang dikenakan pada pelaksana tugas." Mungkin, tujuan ini hanya tujuan sementara dalam pengaturan terapan atau laboratorium; tujuan akhir diasumsikan peningkatan kondisi kerja, desain workstation yang intuitif, atau prosedur yang lebih efektif.



Mungkin juga ada alasan hukum untuk mengukur beban kerja. Pengukuran beban kerja selama penilaian antarmuka pengguna baru mungkin merupakan persyaratan untuk mendapatkan sertifikasi untuk digunakan; misalnya, sertifikasi desain kokpit pesawat baru3. Proses sertifikasi dapat menentukan metode pengukuran beban kerja yang dipilih dan, mudah-mudahan, ada beberapa kriteria rasional dan tervalidasi yang membenarkan penggunaannya sebagai pengganti untuk kinerja dalam-layanan. Dalam perbandingan desain sistem, prosedur, atau persyaratan kerja, pengukuran beban kerja dapat digunakan untuk menilai keinginan sistem jika ukuran kinerja gagal untuk membedakan di antara pilihan. Tersirat dalam pendekatan ini adalah keyakinan bahwa ketika kesulitan tugas (beban kerja) meningkat: kinerja biasanya menurun; waktu respons dan kesalahan meningkat; kontrol variabilitas meningkat; lebih sedikit tugas yang diselesaikan per unit waktu; perubahan strategi kinerja tugas (Huey dan Wickens 1993); dan, ada kapasitas residual yang lebih sedikit untuk menangani masalah lain. Namun, ada bukti kuat untuk menunjukkan bahwa ini tidak selalu berlaku untuk aplikasi pemantauan atau kewaspadaan. Dalam aplikasi pemantauan, beban kerja dapat dianggap rendah meskipun kesulitan mempertahankan perhatian. Disosiasi antara beban kerja dan kinerja umumnya diakui meskipun tidak dipahami dengan baik. Namun demikian, bagian dari tujuan perancang sistem adalah untuk mengoptimalkan kinerja sistem dan beban kerja dianggap sebagai salah satu faktor yang harus dipertimbangkan dalam proses optimisasi (Mitchell 2000). KRITERIA UNTUK METODE PENGUKURAN BEBAN KERJA Jika beban kerja diukur dalam pengaturan eksperimental, opsi pengukuran umumnya lebih luas daripada yang untuk pengaturan operasional. Banyak teknik pengukuran beban kerja dapat digunakan dengan sukses untuk membedakan antara kondisi empiris, dan mungkin bahkan menghasilkan ukuran interval atau rasio. Beberapa kekhawatiran tentang penerapan praktis langkah-langkah beban kerja berdasarkan studi laboratorium adalah: kurangnya validitas ekologis atau kompleksitas konteks; kurangnya penerimaan subjek, komitmen atau keahlian; kurangnya penilaian tentang pengaruh pergeseran strategi baik pada kinerja, penjadwalan, dan pada pengukuran beban kerja itu sendiri. Untuk mengatasi masalah ini dan masalah lainnya, O'Donnell dan Eggemeier (1986) mengusulkan beberapa kriteria untuk memandu pemilihan atau pengembangan teknik pengukuran beban kerja mental: 1)



Metode ini harus peka terhadap perubahan dalam kesulitan tugas atau permintaan sumber daya dan membedakan antara variasi yang signifikan dalam beban kerja.



2)



Metode ini harus bersifat diagnostik, menunjukkan sumber variasi beban kerja dan menghitung kontribusi berdasarkan jenis atau permintaan sumber daya.



3)



Metode ini tidak boleh mengganggu atau mengganggu kinerja tugas operator, menjadi sumber beban kerja yang signifikan.



4)



Metode ini harus dapat diterima oleh subjek, memiliki validitas wajah tanpa menjadi berat.



5)



Metode ini harus memerlukan peralatan minimal yang dapat mengganggu kinerja subjek.



Kriteria lain sejak itu telah ditambahkan ke daftar ini: 6)



Metode ini harus tepat waktu dan cukup cepat untuk diterapkan untuk menangkap perubahan beban kerja sementara.



7)



Metode ini harus dapat diandalkan, menunjukkan pengulangan dengan varians kecil dibandingkan dengan efek utama.



8)



Metode ini harus selektif sensitif terhadap perbedaan dalam permintaan kapasitas dan tidak untuk perubahan yang tidak terkait dengan beban kerja mental (seperti stres emosional; yang lain seperti Gaillard (1993) atau Gaillard dan Kramer (1999) mungkin memperdebatkan pembatasan ini).



9)



Metode ini harus tidak sensitif terhadap tuntutan tugas lain, seperti aktivitas fisik di luar pelaksanaan tugas. (Casali dan Wierwille 1984, hlm. 1034)



Teknik pengukuran yang dipilih juga harus memenuhi kendala formal, aksiomatik. Colle dan Reid (1997) mencatat bahwa hanya setelah teknik pengukuran beban kerja mengadopsi pendekatan ini, sehingga ukuran subyektif dan kinerja (dan fisiologis) dapat langsung dibandingkan, kita dapat sepenuhnya memahami konsep beban kerja. Lainnya memiliki kekhawatiran terkait yang akan dimasukkan ke dalam metode pengukuran formal, tidak hanya mengkarakterisasi tugas, tetapi juga kemampuan operator dan biaya yang dikeluarkan untuk melakukan tugas (Derrick 1988). Teknik pengukuran objektif, sambil memperhatikan persyaratan teknis pengukuran kuantitas fisik yang terlibat, tidak membahas bagaimana pengukuran ini dapat diubah menjadi ukuran beban kerja. Pekerjaan Colle dan kolega pada pengembangan skala subyektif memiliki potensi dalam kinerja objektif dan ukuran fisiologis serta skala subyektif. Beberapa teknik pengukuran berusaha untuk mengatasi perbedaan individu, baik melalui pengembangan bobot hingga peringkat skala proporsi hingga perhitungan beban kerja keseluruhan yang spesifik untuk operator (seperti pada SWAT dan NASA TLX) atau melalui garis dasar, seperti dalam tindakan fisiologis. Banyak peneliti merasa bahwa konsep perbedaan individu adalah pusat pengukuran beban kerja. Dengan demikian, teknik pengukuran



harus



dirancang



untuk



menangkap



perbedaan-perbedaan



itu



dan



mencerminkannya dalam nilai-nilai yang diperoleh dari kerangka teori yang kuat. Seperti disebutkan, pilihan teknik pengukuran beban kerja untuk aplikasi operasional lebih terbatas daripada pengaturan laboratorium, atau pengaturan empiris. Pengukuran beban kerja oleh beberapa, teknik tidak mencolok telah diusulkan untuk mengambil beberapa tindakan pre-emptive, mitigasi untuk mempertahankan kinerja, seperti bantuan otomatis,



sehingga diperlukan tanggapan waktu nyata. Teknik pengukuran harus memiliki gangguan minimal dengan aktivitas operator, baik mental maupun fisik. TINJAUAN MENGENAI TEKNIK PENGUKURAN KERJA Diskusi yang paling terorganisir mengenai penilaian beban kerja dan pengukurannya ditemukan dalam Bab 41 dan 42 dari "Buku Pegangan Persepsi dan Kinerja Manusia" (Boff, Kaufman et al. 1986). Dalam Bab 41, Gopher dan Donchin (1986) menyajikan baik tinjauan historis dan keadaan seni dari beban kerja, definisi dan model awal hingga pertengahan 1980-an. Gopher dan Donchin memberikan pengantar berbagai kelas pengukuran beban kerja, mencatat kelebihan, kekurangan, dan kontroversi tentang penggunaannya. Dalam Bab 42, O'Donnell dan Eggemeier (1986) memperluas tinjauan Gopher dan Donchin, membahas berbagai teknik pengukuran khusus untuk setiap kelas pengukuran beban kerja. Ini adalah referensi yang berguna untuk mempelajari dasar-dasar pengukuran beban kerja serta mengidentifikasi teknik pengukuran potensial. Moray (1979), Roscoe, Ellis et al. (1978) memberikan koleksi makalah dalam monograf terpisah yang juga meninjau keadaan pengetahuan hingga 1980-an. Makalah ini mencakup berbagai topik mulai dari pengembangan teknik pengukuran spesifik hingga tinjauan filosofi dan masalah yang terkait dengan pengukuran beban kerja. Moray (1979) proses lokakarya NATO adalah di antara upaya awal untuk menyusun dan mengatur "... sejumlah besar pengetahuan tentang beban kerja dan banyak model untuk itu ..." menjadi model yang koheren yang secara teori akan terdengar dan dapat dipraktekkan. Ini melibatkan psikolog, insinyur, pemodel, dan ergonomis, menghasilkan hampir 30 makalah. Meskipun tidak membuat model beban kerja fungsional, itu berfungsi untuk fokus dan menginformasikan berbagai komunitas tentang berbagai aspek pengukuran beban kerja. Beberapa karya di Moray (1979) masih relevan dan bermanfaat, meskipun sains telah agak maju dalam 25 tahun terakhir; namun demikian, monograf ini juga menjadi titik awal yang baik untuk berbagai aspek pengukuran beban kerja. Roscoe, Ellis et al. (1978) memberikan tinjauan awal atas karya seni terkini, referensi dari tahun 1950-an yang mendahului teori beban kerja saat ini, mengaitkan beban kerja baik dengan upaya mental (tanpa mendefinisikan upaya secara formal) dan sejauh mana operator dilibatkan. dengan tugasnya. Mereka mengakui tuntutan tugas, kapabilitas operator, dan tuntutan temporal kontekstual sebagai komponen beban kerja. Sebuah proposal yang menarik dari kelompok psikologi eksperimental simposium NATO Moray adalah bahwa tidak hanya beban kerja multidimensi, itu harus dianggap sebagai vektor daripada kuantitas skalar yang lebih khas. Lebih jauh lagi, representasi vektor ini akan menjadi tugas khusus (atau mungkin kelas tugas tertentu), meskipun mereka dengan mudah mengakui bahwa mereka tidak mengetahui dimensi dari vektor tersebut. Masalah yang analog adalah masalah kecepatan dan kecepatan. Kecepatan adalah besarnya vektor kecepatan, tetapi dalam beberapa situasi, arah diperhitungkan seperti dalam persyaratan bahan bakar untuk pesawat terbang dalam angin dengan judul yang berbeda, mencakup



jarak yang sama dalam jangka waktu yang sama: bagi maskapai hasilnya hasilnya penting bagi profitabilitas mereka, tetapi kepada penumpang, hasilnya tidak terlihat. Beberapa teknik pengukuran mungkin peka terhadap komponen spesifik dari vektor beban kerja saja dan tidak peka terhadap yang lain. Sebagai alternatif, beberapa tindakan mungkin peka terhadap beberapa dimensi, tetapi mereka mungkin tidak dapat membedakan kontribusi, menghasilkan pemisahan sebab dan akibat yang jelas. Wierwille dan rekannya melaporkan serangkaian percobaan terfokus menekankan berbagai aspek permintaan mental pada metodologi beban kerja dalam simulator pesawat. Setiap studi mengkonfirmasi bahwa teknik pengukuran berbeda-beda peka terhadap manipulasi beban. Dalam studi pemuatan psikomotorik (Wierwille dan Connor 1983), hanya 5 dari 20 teknik pengukuran beban kerja yang dinilai sesuai untuk tugas uji coba dan 5, hanya 3 yang memiliki hubungan monotonik dengan manipulasi beban. Dalam komunikasi (Casali dan Wierwille 1983) dan studi kognitif (mediasi) (Wierwille, Rahimi et al. 1985), 7 dari 16 ukuran menunjukkan sensitivitas yang signifikan. Dalam studi persepsi, (Casali dan Wierwille 1984) 7 dari 14 tindakan sensitif terhadap peningkatan beban persepsi. Teknik spesifik yang ditemukan sensitif dicatat kemudian dalam dokumen ini di bawah "5.0 Merekomendasikan ukuran beban kerja". Wickens (1992) memberikan gambaran singkat tentang kelas umum teknik, mencatat beberapa kelebihan dan kekurangan masing-masing kelas. de Waard and Farmer memberikan ulasan yang lebih baru tentang metode pengukuran beban kerja. de Waard (1996) memberikan penilaian yang luas dan kritis dari kategori umum dan teknik pengukuran spesifik yang memberikan perspektif yang lebih terkini tentang pandangan O'Donnell dan Eggemeier. Tesis de Waard tersedia secara online4 dan merupakan referensi yang berharga baik bagi mereka yang memulai di bidang beban kerja maupun bagi para peneliti yang mencari metode pengukuran potensi beban kerja. Farmer dan Brownson (2003) memberikan tinjauan ringkas dan terkini tentang metode pengukuran beban kerja dan menawarkan rekomendasi profesional tentang teknik yang cocok untuk digunakan dalam simulasi manusia-in-the-loop. Farmer dan Brownson fokus pada metode yang umum digunakan, mengomentari kesesuaian untuk program Eurocontrol Integra yang melibatkan keselamatan udara dan manajemen lalu lintas udara. Castor (2003) dan Wilson (2004) memberikan beberapa ulasan terbaru tentang teknik pengukuran beban kerja, meskipun distribusi laporan ini mungkin terbatas dan sulit diperoleh. Masing-masing laporan menilai berbagai teknik pada sejumlah tingkatan, memberikan panduan tentang kematangan, sensitivitas, keandalan, dan kegunaan masingmasing metode. Castor (2003) juga menyediakan proses penilaian untuk membantu memilih mana dari berbagai tindakan yang paling baik diterapkan berdasarkan fenomena yang diteliti.



Ulasan penting ini menunjukkan bahwa beban kerja ada di benak banyak praktisi, namun, para peneliti yang dikutip agak sedikit jumlahnya. Karya-karya para peneliti ini muncul kembali di seluruh literatur, dan ulasan saat ini tidak terkecuali. Pengamatan dalam ulasan saat ini didasarkan pada literatur daripada kesimpulan yang timbul dari percobaan yang dilakukan. Pada halaman-halaman berikut, berbagai metode dari masing-masing tiga kategori ditinjau dan dilaporkan dengan referensi bagi pembaca yang tertarik untuk membentuk hipotesis mereka sendiri yang dapat diuji. Ulasan Gopher dan Donchin (1986) dan O'Donnell and Eggemeier (1986) direkomendasikan sebagai tinjauan historis dan teknis singkat dari lapangan, serta ulasan de Waard (1996) untuk penilaiannya terhadap metode tertentu. KATEGORI TEKNIK PENGUKURAN BEBAN KERJA Teknik pengukuran beban kerja biasanya disusun dalam tiga kategori besar: Penilaian diri atau skala penilaian subjektif; Ukuran kinerja (termasuk subdivisi ukuran tugas primer dan sekunder); dan, Langkah-langkah psikofisiologis (Eggemeier, Wilson et al. 1991, hal. 207). Telah dicatat bahwa ukuran yang berbeda sensitif terhadap aspek beban kerja yang berbeda dan tidak semua ukuran beban kerja menilai hal yang sama. Bagian dari kebingungan ini muncul dari kurangnya definisi yang diterima dari beban kerja dan kecenderungan untuk menggunakan istilah beban kerja yang berarti baik tuntutan yang dikenakan pada pengguna, upaya yang diberikan pengguna untuk memenuhi permintaan tersebut, dan konsekuensi dari upaya untuk memenuhi tuntutan mereka. (Huey and Wickens 1993, hlm. 55). Kuesioner dan teknik wawancara, meski informatif, tidak dianggap di sini sebagai metode pengukuran beban kerja karena lebih berupa deskripsi verbal tentang apa yang dialami operator. Kuesioner rumit untuk dirancang dengan baik untuk menghindari bias yang tidak diinginkan, canggung untuk memvalidasi, dan sulit untuk digeneralisasi (meskipun yang terakhir juga berlaku untuk ukuran tugas utama). Karena itu, keputusan dibuat untuk mengecualikan mereka dari tinjauan saat ini dan fokus pada langkah-langkah beban kerja kuantitatif yang dapat divalidasi secara empiris. SKALA RATING Tampaknya tepat bahwa beban kerja mental diukur dengan cara subjektif, karena merupakan konstruksi psikologis. Jex (1988) menyatakan "Dengan tidak adanya ukuran obyektif tunggal dari aktivitas metacontroller difus, ukuran fundamental, yang dengannya semua ukuran obyektif harus dikalibrasi, adalah evaluasi beban kerja subyektif individu dalam setiap tugas." Casali dan Wierwille (1984, hal. 1046) mencatat bahwa temuan mereka dan lainnya menunjukkan "... bahwa skala penilaian yang dirancang dengan baik dengan instruksi terkait ... terutama instrumen pengukuran yang sensitif, terutama dengan populasi yang sangat terlatih ...". Gopher dan Donchin (1986, hal. 41-2), bagaimanapun, menyatakan "... seorang operator sering merupakan alat ukur yang tidak dapat diandalkan dan tidak valid." Namun demikian, ukuran subjektif seperti skala penilaian memiliki sejarah panjang



untuk mengukur perasaan beban kerja, usaha, suasana hati, kelelahan, dll. Metode subyektif mencoba untuk mengukur interpretasi pribadi dan penilaian dari permintaan mereka yang berpengalaman. Sebagian besar ukuran beban kerja subyektif menyiratkan (jika mereka tidak secara eksplisit menyatakan) bahwa itu adalah beban kerja mental yang sedang diukur dan efek dari pekerjaan fisik yang terkait dengan otot motorik kasar tidak dipertimbangkan. Teknik TLX NASA yang dibahas di bawah ini memang memiliki kategori untuk Permintaan Fisik yang dapat menangkap tuntutan yang terkait dengan kerja fisik meskipun kata-kata yang menggambarkan dimensi ini tampaknya lebih diarahkan pada keterampilan motorik halus. Skala subyektif dan fisiologis lainnya ada untuk mengukur kerja fisik seperti skala subjektif usaha relatif Borg atau konsumsi oksigen (VO2) sebagai ukuran laju metabolisme. Sangat masuk akal bahwa eksperimen dapat dirancang untuk menguji independensi berbagai ukuran beban kerja mental subyektif dari aktivitas fisik. Pengulangan dan validitas teknik subjektif subjektif semacam itu terkadang tidak pasti dan manipulasi data sering dipertanyakan sebagai tidak tepat. Sementara sifat ordinal dari peringkat jarang dipertanyakan, penggunaan interval atau rasio operasi aritmatika pada data telah menjadi topik banyak perdebatan, tanpa hasil yang pasti terlihat (Annett 2002). Masalahnya adalah salah satu dari filsafat dan pragmatisme. Dalam banyak kasus, tidak ada bukti bahwa data sama sekali tidak ordinal dan dengan demikian, tidak setuju dengan manipulasi aritmatika atau statistik parametrik, namun ini adalah alat sehari-hari yang diajarkan untuk digunakan dalam sains dan teknik untuk mendukung kesimpulan dan keputusan dibuat. Di sisi lain, data peringkat beban kerja subyektif mungkin sangat interval - ada bukti yang tidak cukup untuk mendukung atau bertentangan dengan posisi ini. Ada alat lain yang dapat digunakan untuk mengeksplorasi masalah ini, seperti statistik nonparametrik, namun mereka belum menemukan bantuan dalam praktiknya. Pendekatan tipikal tampaknya mengabaikan kemungkinan pelanggaran aksioma matematika demi kenyamanan, menerima risiko bahwa kesimpulan mungkin tidak dapat dibenarkan mengingat data yang digunakan. Untuk



mengatasi



masalah



ini,



pendekatan



analisis



statistik



non-parametrik



direkomendasikan daripada statistik parametrik dalam kasus seperti itu di mana data harus dianggap ordinal. Jika ini tidak diinginkan, maka analisis parametrik harus divalidasi melalui analisis non-parametrik tambahan. Pendekatan ini memerlukan pemikiran tambahan pada desain tes untuk memastikan rencana yang sesuai untuk pertanyaan yang akan dijawab karena prosedur analisis biasanya tidak kuat. Penilaian matematis tentang bahaya menggunakan analisis parametrik dengan metode subyektif yang menggunakan peringkat seperti skala Likert 5 atau 7 poin akan menjadi panduan yang berguna atau bahkan penilaian kasus per kasus dari kesimpulan berdasarkan analisis parametrik dibandingkan dengan analisis non-parametrik yang sesuai . Metode alternatif seperti logika fuzzy dapat mengatasi



masalah ini, memberikan kalkulus untuk menggabungkan data subjektif untuk membentuk kesimpulan, meskipun validasi masih merupakan masalah yang sulit untuk diselesaikan. Meshkati dan Lowewinthal (1988, p. 257) mencatat banyak peneliti merasa bahwa “… kecuali jika teknik pengukuran subyektif terstruktur dengan benar, mereka dapat berfungsi hanya sebagai indikator tingkat stres kotor dan memiliki sedikit nilai diagnostik, yaitu, mereka mungkin tidak menunjukkan sumbernya. atau jenis beban kerja yang terlibat. ”Meshkati, Hancock et al. (1995, p. 756) melangkah lebih jauh dan mencatat bahwa beberapa peneliti percaya bahwa perasaan subyektif dari kesulitan pada dasarnya tergantung pada stres waktu yang terlibat dalam melakukan tugas hanya untuk tugas-tugas yang menekankan waktu. Ini tampaknya tidak membahas sumber beban kerja dalam situasi serba mandiri di mana stres waktu rendah, tetapi jumlah tugas atau kompleksitas tugas tinggi, yang mengakibatkan rasa kewalahan oleh proses penalaran atau perencanaan yang diperlukan untuk menyelesaikan tugas . Sementara tindakan subyektif memiliki validitas wajah yang tinggi, interpretasi dan kemampuan mereka untuk memprediksi kinerja tidak pasti. Vidulich (1988), Yeh dan Wickens (1988) menggambarkan banyak contoh di mana disosiasi antara ukuran subyektif dan kinerja telah ditemukan. Vidulich menyimpulkan bahwa tindakan subyektif cenderung lebih sensitif terhadap pemrosesan beban dalam memori yang bekerja sementara memiliki sensitivitas yang rendah terhadap tuntutan pelaksanaan respons. Hipotesisnya adalah bahwa beban kerja subyektif hanya peka terhadap manipulasi yang diwakili dengan baik secara sadar, sehingga berbagai tuntutan dalam tugas-tugas berbasis keterampilan (atau sebagai alternatif ketidakpedulian dan ketidakpedulian subjek) tidak akan berubah dalam penilaian subjektif secara substansial. Ini menunjukkan bahwa tindakan subyektif sangat cocok untuk penilaian teknologi modern yang membantu penilaian dan pengambilan keputusan, tetapi kurang cocok untuk menilai alat bantu fisik atau mekanik untuk tugas yang berulang atau sangat dipelajari. Lainnya (Brookhuis dan de Waard 2002) menganut disosiasi sebagai kendala alami pada semua tindakan dan fokus pada gambar yang disajikan oleh bermacammacam tindakan yang berbeda-beda peka terhadap berbagai faktor yang berkontribusi terhadap beban kerja. Wierwille (1988, p. 320) menyarankan teknik analitik bahwa beban kerja rata-rata dari waktu ke waktu tidak tepat, meskipun ada indikasi bahwa ini adalah apa yang tampaknya diambil oleh tindakan subjektif. Sebaliknya, Wierwille berpendapat nilai beban kerja sesaat mewakili ukuran yang tepat, terutama untuk analisis desain. Ini menunjukkan bahwa tindakan subyektif yang biasa pada mereka sendiri tidak cukup untuk mengkarakterisasi beban kerja secara memadai dan beberapa cara tambahan untuk menangkap kelebihan beban kerja sesaat atau sesaat diperlukan. Ini tampaknya mendukung pendekatan estimasi analitik, beban kerja yang lebih besar untuk penilaian yang diterapkan.



Penilaian diri melibatkan tuntutan peringkat pada skala numerik atau grafik, biasanya berlabuh pada satu atau dua ekstrem per skala. Beberapa teknik subjektif menggunakan skala yang kategorikal, dengan definisi di setiap tingkat, seperti skala Cooper-Harper yang Dimodifikasi. Teknik lain menggunakan peringkat terbuka dengan tugas referensi "standar" sebagai jangkar dan mata pelajaran menilai tugas-tugas lain relatif terhadap tugas referensi. Hart dan Wickens (1990) membagi metode skala penilaian ke dalam peringkat satu dimensi seperti Keseluruhan Beban Kerja (Vidulich dan Tsang 1987), peringkat hierarkis seperti skala Modified Cooper-Harper atau Bedford (Wierwille dan Casali 1983), dan peringkat multidimensi seperti SWAT (Reid dan Nygren 1988) dan NASA TLX (Hart dan Staveland 1988). Ukuran unidimensional dan hierarkis yang disebutkan di atas memiliki validitas wajah yang baik, mudah dipahami dan digunakan, dan umumnya memiliki penerimaan pengguna yang baik. Meskipun berguna dalam hak mereka sendiri, mereka juga dapat berfungsi sebagai standar untuk menilai tindakan multidimensi yang lebih kompleks yang dibahas di bawah ini. Yang tidak mereka miliki adalah kalkulus untuk menggabungkan peringkat untuk memprediksi beban kerja dalam situasi berbeda yang melibatkan tugas serupa. Meskipun tidak semua skala beban kerja multi dimensi memiliki mode prediktif, beberapa di antaranya. Sisa dari tinjauan tindakan subjektif ini akan berkonsentrasi pada tindakan yang memiliki, atau bisa memiliki, kemampuan prediksi melalui pemodelan konstruktif. Metode VACP (Visual, Auditori, Kognitif, Psikomotor: Aldrich dan McCracken 1984; McCracken dan Aldrich 1984; Aldrich, Szabo et al. 1989) adalah upaya awal pada alat pengukuran beban kerja diagnostik sederhana yang, bila digabungkan dengan pemodelan jaringan tugas, , dapat digunakan untuk penilaian beban kerja prediktif. Subjek menilai tuntutan tugas sesuai dengan daftar standar dan kategoris di masing-masing dari empat dimensi. Setiap level dimensi dinilai untuk membuat peringkat interval yang dapat digunakan dalam simulasi prediksi dan konstruktif. Proses penjumlahan yang sederhana diusulkan dengan batas yang agak sewenang-wenang yang ditempatkan pada nilai maksimum yang dapat dicapai dimensi apa pun sebelum kelebihan beban operator akan terjadi. Terlepas dari keberatan terhadap kurangnya validasi dan agregasi data ordinal yang tidak tepat, telah terbukti berguna dalam desain sistem untuk mengidentifikasi di mana sistem mungkin membebani pengguna. Metode VACP tetap menjadi metrik yang sering digunakan dan dapat digunakan sebagai taksiran permintaan dalam model prediksi beban kerja yang lebih kompleks. Indeks W / (Indeks Beban Kerja: Utara dan Riley 1989) dikembangkan untuk memformalkan konsep pertikaian Wickens di antara banyak sumber daya dalam perhitungan beban kerja. Peringkat VACP dari permintaan tugas individu telah disarankan sebagai input data ke Indeks W /. Sementara kemungkinan peningkatan pada metode VACP untuk memprediksi beban kerja, Indeks W / tidak memiliki kriteria kelebihan beban. Lebih lanjut, baik VACP, W / Index maupun alat analisis yang menggunakannya tidak memiliki mekanisme untuk merealokasi atau menunda tugas untuk membentuk strategi koping seperti yang dilakukan oleh operator manusia, menghasilkan prediksi yang tidak realistis dari beban kerja.



Boles and Adair (2001) berupaya menilai penyebab beban kerja melalui Multiple Resource Questionnaire (MRQ) dan menyarankan bahwa metode ini berkorelasi baik dengan metode subyektif lainnya. Apakah MRQ adalah metode yang lebih baik, atau teknik pengukuran beban kerja yang praktis, masih harus dilihat, tetapi menghubungkan MRQ dengan langkahlangkah hierarkis seperti skala Modified Cooper Harper (MCH) dapat memberikan analis kekuatan yang mereka butuhkan: mudah digunakan, divalidasi pengukuran beban kerja yang memiliki dukungan diagnostik. Dari semua teknik subjektif, SWAT tampaknya menjadi teknik yang paling umum dilaporkan dalam literatur (lihat Lampiran 1). Teknik penilaian multidimensi atau multi-skala sering memiliki prosedur agregasi untuk menghasilkan peringkat beban kerja secara keseluruhan. SWAT tampaknya sendirian dalam mengusulkan prosedur agregasi yang memiliki dasar metrologi yang baik, scaling bersama, meskipun NASA TLX juga membuat beberapa klaim untuk legitimasi agregasi dengan skema pembobotan perbandingan perbandingan berpasangan. Teknik estimasi beban kerja lainnya, seperti VACP (Aldrich, Szabo et al. 1989) dan W / Index (North dan Riley 1989) membuat asumsi yang lebih kasar tentang agregasi, meskipun mungkin, perkiraan yang sesuai untuk tingkat presisi yang terjadi dengan teknik penilaian subyektif. Reid dan Nygren (1988) menggambarkan teknik SWAT dan asumsi teoritis yang mendasarinya. Mereka mencatat bahwa "... ukuran kinerja tidak dapat, dengan sendirinya, menggambarkan beban kerja ..." karena operator dapat memvariasikan upaya untuk mempertahankan tingkat kinerja yang konstan, tetapi anggapan beban kerja yang terlibat akan bervariasi sepadan dengan upaya. SWAT memberi peringkat pengalaman pada tiga dimensi (Beban Waktu, Upaya Mental, dan Stres Psikologis), masing-masing dengan tiga tingkat bilangan bulat atau kategori. SWAT menangani keluhan utama tentang tindakan subjektif: jaminan bahwa peringkat adalah interval atau rasio diskalakan dan bukan hanya peringkat ordinal. Ini dicapai melalui pengukuran konjoin dan skala penilaian subyektif yang disediakan oleh subyek (yang mungkin hanya bersifat ordinal sebelum penskalaan) melalui perbandingan kepentingan relatif semua level pada ketiga dimensi (27 perbandingan berbeda dari setiap level dan dimensi dengan setiap kombinasi lainnya). Hart dan Staveland (1988) menjelaskan teknik pengukuran beban kerja Indeks Tugas NASA (TLX) dan menyajikan validasi empiris yang mendukungnya. Mereka menyatakan bahwa "... penilaian subyektif mungkin paling dekat dengan menyentuh esensi dari beban kerja mental dan memberikan indikator yang paling umum valid dan sensitif." Mereka juga mencatat bahwa teknik subjektif tunduk pada bias dan prasangka operator, dan hanya dapat didasarkan pada apa yang diingat atau disarikan dari pengalaman. Mereka menyarankan, bagaimanapun, bahwa subyek tidak mungkin mengingat pengalaman dengan cukup baik, membuat penilaian absolut dari beban kerja atau bahkan ukuran relatif untuk tugas yang berbeda tidak ada artinya. Ini agak bertentangan dengan beberapa literatur yang menunjukkan penilaian cukup stabil ketika ditimbulkan oleh ulasan setelah tindakan, tetapi terkait dengan konsep Colle and Reid (1998) bahwa konteks memainkan peran penting dalam pengukuran beban kerja. Ada dua masalah dengan metode formal NASA TLX. Salah satunya adalah proses mencetak "Kinerja Sendiri"; yang lainnya adalah prosedur penskalaan berdasarkan perbandingan berpasangan. Yang pertama adalah masalah bagaimana skala disajikan. Setiap dimensi



disajikan sebagai garis horizontal bergradasi, berlabuh di setiap ujung. Hart dan Staveland (1988) memvalidasi dimensi melalui serangkaian percobaan dan analisis, mengembangkan jangkar sehingga peringkat pada setiap skala sesuai secara linear dengan kontribusi mereka terhadap beban kerja keseluruhan. Dalam 5 dari 6 skala, peringkatnya berkisar dari Rendah di kiri ke Tinggi di kanan; ini dibalik untuk Kinerja Sendiri, yang beralih dari Sangat Baik ke Buruk. Meskipun ini masuk akal jika seseorang menganggap setiap dimensi sebagai penyumbang beban kerja, skala Kinerja Sendiri dapat menyebabkan kebingungan di antara subjek. Subjek mungkin cenderung tidak menganggap timbangan sebagai kontributor terhadap beban kerja sebanyak tindakan independen untuk persidangan. Membalikkan arah skala timbangan secara berkala dianjurkan oleh para pakar dalam pengembangan skala untuk mengurangi kecenderungan subjek yang mengisinya dengan sedikit pertimbangan akan maknanya. Ini bukan tujuan dari pembalikan skala di NASA TLX, di mana skala penilaian diatur sedemikian rupa sehingga masing-masing dimensi berkontribusi positif terhadap skor beban kerja keseluruhan. Ini adalah proses yang sepele untuk membalikkan presentasi skala Performance Sendiri, tetapi implikasi dari perubahan ini pada validasi metode belum dinilai. Castor (2003, hal. 36) mencatat bahwa dimensi Kinerja Sendiri tidak perlu menjadi bagian dari porsi penilaian beban kerja dari algoritma TLX NASA karena penskalaan multidimensi menunjukkan Kinerja Sendiri sangat terpisah dari lima dimensi lain yang tampaknya berkelompok pada suatu faktor tunggal. Kekhawatiran kedua adalah bagaimana NASA TLX mengumpulkan peringkat dengan menjumlahkan peringkat tertimbang dari setiap skala. Bobot ditentukan oleh perbandingan berpasangan tentang kepentingan relatif setiap skala terhadap beban kerja. Dalam proses ini, skala peringkat terendah dapat menerima bobot 0; dengan kata lain, itu mungkin tidak berkontribusi pada ukuran beban kerja komposit yang dihitung. Hart dan Staveland (1988) menyiratkan bahwa bobot kontribusi beban kerja yang terkait untuk masing-masing skala tergantung pada konteks dan dengan demikian, kejadian seperti itu sesuai. Jika memang benar bahwa hanya estimasi beban kerja relatif dalam tugas yang sama yang layak, ini bukan masalah. Namun, jika seseorang ingin membandingkan tugas atau pengalaman yang berbeda, maka memungkinkan bobot untuk bervariasi antara pengalaman secara signifikan mempersulit perbandingan. Tampaknya masuk akal bahwa tugas yang berbeda akan menghasilkan peringkat skala yang berbeda, dan bahwa subyek yang berbeda dapat merasakan pentingnya setiap skala secara berbeda, secara subyektif menggabungkan setiap skala untuk menghasilkan penilaian pribadi terhadap beban kerja. Itu tidak berarti bahwa subjek akan mengubah persepsi mereka tentang kontribusi setiap skala untuk beban kerja dan tampaknya lebih masuk akal bahwa bobot akan sangat bervariasi dengan jenis tugas untuk seorang individu. Tidak ada penelitian yang menemukan bahwa penilaian subjek terhadap perubahan skala subjek dengan konteks, meskipun Hart dan Staveland (1988) menunjukkan bahwa bobot dalam subjek sebagian besar stabil di seluruh studi, yang menunjukkan bahwa studi stabilitas bobot terhadap perbedaan individu akan layak. Colle and Reid (1998) menilai skala SWAT dan NASA TLX dalam serangkaian percobaan, menemukan SWAT agak lebih sensitif terhadap berbagai manipulasi eksperimental daripada NASA TLX. Pola hasil serupa antara kedua metode dan perbedaannya terlalu kecil untuk menyatakan bahwa satu teknik lebih baik dari yang lain. Ini bertentangan dengan beberapa penelitian lain yang menemukan NASA TLX lebih sensitif, terutama pada tingkat beban kerja yang rendah (Hart dan Staveland 1988; Nygren 1991; Hill, Iavecchia et al. 1992). Byers, Bittner et al. (1988) dan Hill, Iavecchia et al. (1992) menemukan NASA TLX agak lebih sensitif



daripada SWAT terhadap manipulasi eksperimental, namun demikian, Hart dan Wickens (1990, p267) juga melaporkan bahwa dari beberapa ukuran subjektif, NASA TLX terbukti berkorelasi terbaik dengan ukuran kinerja sambil menampilkan variabilitas intersubject rendah dan baik. penerimaan pengguna. Sebaliknya, Whitaker, Hohne et al. (1997) menemukan SWAT lebih sensitif daripada NASA TLX. NASA TLX dan SWAT biasanya dilaporkan lebih sensitif daripada skala unidimensional seperti Keseluruhan Beban Kerja (OW) dan Modified Cooper-Harper (MCH) meskipun kerja awal oleh Wierwille dan rekannya menemukan metode KIA lebih sensitif. Sejumlah kecil level dalam setiap dimensi SWAT telah dikritik karena tidak memberikan sensitivitas yang memadai; lebih banyak dimensi akan membuat proses penyortiran kartu yang membosankan menjadi tidak praktis. Meskipun NASA TLX menawarkan presisi yang lebih besar dalam setiap subskala, sulit untuk mengatakan bahwa ia menawarkan diagnostikitas yang lebih besar atau akurasi yang lebih besar, jika konsep seperti itu berlaku di sini. Jelas, ada ruang untuk perbaikan, perdebatan tentang prosedur pengukuran dan interpretasi hasil. NASA TLX tampaknya memiliki penerimaan pengguna yang lebih tinggi daripada SWAT karena fase pengembangan skala yang lebih pendek. Prosedur penyortiran kartu dari metode SWAT tampaknya menjadi faktor signifikan dalam penerimaan yang lebih rendah oleh pengguna; Subjek bahkan menemukan prosedur pembandingan berpasangan NASA TLX suatu pemaksaan, meskipun hanya membutuhkan beberapa menit untuk menyelesaikannya. Lebih lanjut, tidak jelas apakah beban tambahan untuk melakukan prosedur penskalaan untuk agregasi memiliki nilai lebih (Hendy, Hamilton et al. 1993), Kemungkinan rata-rata sederhana dari semua skala (jika bahkan secara matematis diizinkan) akan cenderung melebih-lebihkan beban kerja yang sebenarnya, karena beberapa skala mungkin tumpang tindih dalam penilaian mereka. Beberapa praktisi telah menemukan pengembangan skala SWAT agak sulit dan beberapa menyarankan alternatif yang mereka klaim sebagai sensitif jika tidak lebih sensitif, meskipun kurang ketelitian matematis dari SWAT asli. Luximon dan Goonetilleke (2001) mengeksplorasi 5 varian pada metode SWAT, menemukan bahwa pendekatan yang lebih sederhana lebih sensitif dan kurang memakan waktu untuk melakukan, meskipun mereka tidak memiliki ketelitian matematis dari SWAT standar. Biers dan Masline (1987; Biers 1995) telah mengeksplorasi formulasi alternatif yang, dalam studi terbatas yang dilakukan, dilakukan serta SWAT, tetapi dengan sedikit kerja. Jika SWAT, atau peringkat lainnya berdasarkan penskalaan konjoin, terbukti terlalu berat untuk penggunaan praktis, namun demikian dapat berfungsi sebagai standar pengembangan skala; yaitu, metode yang lebih berat dapat memberikan perkiraan kesalahan yang terkait dengan metode perkiraan. Sebagai contoh, prosedur NASA TLX 6 skala, dengan 10 atau 20 poin per skala (berpotensi tak terbatas), akan memakan banyak waktu untuk metode konjoin praktis. Subjek mungkin diinduksi untuk rela menderita proses penyortiran kartu yang besar, membosankan, (atau subset daripadanya) jika ada kemungkinan besar mengembangkan skala universal pada akhirnya, tetapi jika proses terbukti spesifik secara individu, mungkin ada sedikit keuntungan untuk pendekatan ini. Kesamaan antara hasil empiris SWAT dan NASA TLX tampaknya menunjukkan bahwa ada harapan untuk data interval atau rasio yang dihasilkan dari penilaian subjektif, yang telah menjadi masalah untuk model prediksi beban kerja (Reid dan Nygren 1988)



KESIMPULAN Dalam dua puluh tahun terakhir, ilmu pengukuran beban kerja belum berkembang sejauh yang diharapkan. Banyak masalah dan kekhawatiran awal 1980-an ada bersama kita hari ini. Ilmu pengetahuannya tidak sepenuhnya statis, khususnya dalam bidang psikofisiologis, dan tinjauan kritis terhadap topik tersebut dapat mengisi laporan yang cukup besar. Tampaknya ada lebih banyak literatur yang sering muncul dan tidak mungkin untuk mengikuti semua perkembangan yang mungkin berguna kecuali seseorang mengkhususkan diri dalam pengukuran beban kerja. Beban kerja mental itu multidimensi bukanlah tantangan serius saat ini, tetapi apakah beban kerja itu skalar atau vektor belum diselesaikan dan mungkin hanya relevan dengan pemodelan prediktif, ketika analis ingin menilai beban kerja yang terkait dengan melakukan dua tugas baru bersama. Upaya untuk membangun model komputasi perilaku manusia yang dimoderasi oleh beban kerja dapat memberikan testbed yang berguna untuk menambah metode eksperimental yang mencoba memvalidasi langkah-langkah yang diusulkan. Ukuran beban kerja subyektif yang mendukung pemodelan prediktif, seperti VACP dan DRAWS, biasanya fokus pada permintaan tugas di berbagai saluran. Ketika digabungkan dengan durasi tugas dalam simulasi, pendekatan ini menghasilkan ukuran agregat yang sensitif terhadap kesulitan dan waktu tugas. Hasil ini memberikan informasi diagnostik di mana beban kerja yang tinggi berkembang dalam sistem dan dapat digunakan untuk memvalidasi model untuk skenario lain. Pendekatan pemodelan prediktif yang berfokus pada metrik beban kerja keseluruhan seperti tekanan waktu, permintaan tugas yang membingungkan dengan waktu yang tersedia. Jika tuntutan tugas dan beban kerja yang dihasilkan dapat ditandai dengan satu parameter, maka ukuran beban kerja subyektif keseluruhan mungkin cukup. Dalam semua kasus, sangat diinginkan untuk mengaitkan kinerja objektif yang diprediksi dengan pengukuran empiris jika model kinerja yang sesuai tersedia sebagai langkah menuju memvalidasi simulasi keseluruhan. Ketika mengukur beban kerja secara empiris, rekomendasi saat ini sebagian besar sama dengan dua puluh tahun yang lalu: pilih berbagai teknik pengukuran beban kerja yang tampaknya sesuai untuk aplikasi dan cenderung memberikan wawasan; jangan memilih terlalu banyak tindakan berlebihan, karena ini dapat menghasilkan hasil yang bertentangan hanya secara kebetulan. Pemahaman tentang masalah yang diteliti mungkin memerlukan sejumlah percobaan atau uji coba dalam operasi konvergen untuk mengklarifikasi mengapa beberapa hasil memisahkan antara langkah-langkah. Sejumlah peneliti di lapangan telah menciptakan alat untuk membantu memandu pemilihan teknik pengukuran. Sumber terbuka, versi domain publik dari alat-alat ini, dengan referensi ke data validasi, akan menjadi tambahan yang berguna untuk faktor manusia dan komunitas penelitian. Berdasarkan ulasan literatur ini, langkah-langkah psikofisiologis tidak boleh direkomendasikan untuk masalah yang diterapkan sampai peneliti dapat mengembangkan teori, penyatuan formal yang menjelaskan interaksi berbagai fenomena fisiologis dan hubungan dengan beban kerja, meskipun kemajuan teknologi baru-baru ini dibuat. Sebagai praktik umum, ukuran beban kerja global dan univariat disarankan bersama dengan NASA TLX, serta langkah-langkah tugas sekunder primer dan tertanam yang relevan secara kontekstual. SWAT adalah alternatif untuk TLX NASA, meskipun lebih melelahkan.