EVALUATION [PDF]

  • Author / Uploaded
  • issah
  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

EVALUATION



We noted in the first section of this book that ESP had developed in response to certain pressures. Developments in the theoretical bases of language teaching were indicating a need to pay more attention to the individual learner, and at the same time the world of commerce and technology were producing a host of people with specific language learning needs. A demand was generated as a result for courses which learning needs. A demand was generated as a result for courses which would equip particular learners with the necessary skills to carry out specific tasks in English (or any other specified language). These same pressures have generated an equally strong need for a more open and coherent approach to evaluation. Any language teaching course has certain evaluation requirements, but in ESP these requirements are brought sharply into focus by the fact that the ESP course normally has specified objectives. ESP is accountable teaching. ESP learners and sponsors are investors in the ESP course and they want to see a return on their investment of time and / or money. The managers of the ESP course are accountable to these investors. This accountability has produced a demand for more and better evaluation procedures. Two levels of evaluation have thus been brought into prominence: Kami mencatat di bagian pertama buku ini bahwa ESP telah dikembangkan dalam menanggapi tekanan tertentu. Perkembangan dalam dasar teori pengajaran bahasa menunjukkan kebutuhan untuk lebih memperhatikan pelajar individu, dan pada saat yang sama dunia perdagangan dan teknologi menghasilkan sejumlah orang dengan kebutuhan pembelajaran bahasa tertentu. Permintaan dihasilkan sebagai hasil untuk kursus yang membutuhkan pembelajaran. Permintaan dihasilkan sebagai hasil untuk kursus yang akan membekali peserta didik tertentu dengan keterampilan yang diperlukan untuk melakukan tugas-tugas tertentu dalam bahasa Inggris (atau bahasa tertentu lainnya). Tekanan yang sama ini telah menghasilkan kebutuhan yang sama kuatnya untuk pendekatan evaluasi yang lebih terbuka dan koheren. Setiap kursus pengajaran bahasa memiliki persyaratan evaluasi tertentu, tetapi dalam ESP persyaratan ini dibawa dengan tajam ke dalam fokus oleh fakta bahwa kursus ESP biasanya



memiliki tujuan yang ditentukan. ESP adalah pengajaran yang bertanggung jawab. Pembelajar dan sponsor ESP adalah investor dalam kursus ESP dan mereka ingin melihat pengembalian investasi waktu dan / atau uang mereka. Manajer kursus ESP bertanggung jawab kepada investor ini. Akuntabilitas ini telah menghasilkan permintaan akan prosedur evaluasi yang lebih banyak dan lebih baik. Dengan demikian, dua tingkat evaluasi menjadi terkenal: A) Learner assessment. As with any language course there is a need to assess student performance at strategic points in the course, for example, at the beginning and at the end. But this assessment takes on a greater importance in ESP, because ESP is concerned with the ability to perform particular communicative tasks. The facility to assess proficiency is, therefore, central to the whole concept of ESP. The results of this kind of evaluation, for example, enable sponsors, teachers and learners to decide whether and how much language tuition is required. B) Course ealuation. A second important form of evaluation is the value of the ESP course itself. This kind of evaluation helps to assess whether the course objectives are being met - whether the course, in other words, is doing what it was designed to do. (This type of evaluation should be a feature of any kind of ELT course. Unfortunately, it is rarely attempted in the General English context, even though there are educational reasons for doing so.) A) Penilaian pelajar. Seperti halnya kursus bahasa apa pun, ada kebutuhan untuk menilai kinerja siswa di titik-titik strategis dalam kursus, misalnya, di awal dan di akhir. Tetapi penilaian ini lebih penting dalam ESP, karena ESP mementingkan kemampuan untuk melakukan tugas-tugas komunikatif tertentu. Fasilitas untuk menilai kemahiran, oleh karena itu, penting bagi keseluruhan konsep ESP. Hasil evaluasi semacam ini, misalnya, memungkinkan sponsor, guru, dan peserta didik untuk memutuskan apakah dan berapa banyak biaya bahasa yang diperlukan.



B) Evaluasi kursus. Bentuk evaluasi penting kedua adalah nilai kursus ESP itu sendiri. Evaluasi semacam ini membantu menilai apakah tujuan kursus terpenuhi - apakah kursus, dengan kata lain, melakukan



apa yang dirancang untuk dilakukan. (Jenis evaluasi ini harus menjadi fitur dari semua jenis kursus ELT. Sayangnya, ini jarang dicoba dalam konteks Bahasa Inggris Umum, meskipun ada alasan pendidikan untuk melakukannya.) These two forms of evaluation are not always distinct. Evaluation of the learners reflects not just the learners' performance but to some extent the effectiveness or otherwise of the course too. An ESP course is, after all, supposed to be successful: it is set up in order to enable particular learners to do certain things with language. If it consistently fails to meet this objective, then something must be wrong with the course design: the objectives may be too ambitious given the resources available; the analysis of the learners' initial competence may be wrong; the methodology may be inappropriate. Evaluation of the learners is impossible to indicate exactly where a fault lies, but it will at least indicate the existence of a fault somewhere. More precisc diagnostic diagnostics can then be used to trace the faulr. Kedua bentuk evaluasi ini tidak selalu berbeda. Evaluasi peserta didik tidak hanya mencerminkan kinerja peserta didik tetapi pada tingkat tertentu keefektifan atau sebaliknya dari kursus juga. Kursus ESP, bagaimanapun juga, dianggap berhasil: kursus ini dibuat untuk memungkinkan peserta didik tertentu melakukan hal-hal tertentu dengan bahasa. Jika secara konsisten gagal memenuhi tujuan ini, maka ada sesuatu yang salah dengan desain kursus: tujuan mungkin terlalu ambisius mengingat sumber daya yang tersedia; analisis kompetensi awal peserta didik mungkin salah; metodologi mungkin tidak tepat. Evaluasi peserta didik tidak mungkin untuk menunjukkan secara tepat di mana letak kesalahan, tetapi setidaknya akan menunjukkan adanya kesalahan di suatu tempat. Lebih banyak diagnostik diagnostik yang cepat dapat digunakan untuk melacak kesalahan In this sense, then, both the course and learner evaluation have a similar function in providing feedback on the ESP course. However, each type of evaluation also has other purposes and procedures. Thus, while bearing in mind their similarity of role as feedback, we shall consider these two kinds of evaluation separately.



Dalam hal ini, evaluasi kursus dan pelajar memiliki fungsi yang sama dalam memberikan umpan balik pada kursus ESP. Namun, setiap jenis evaluasi juga memiliki tujuan dan prosedur lain. Jadi, sambil mengingat kesamaan peran mereka sebagai umpan balik, kami akan mempertimbangkan kedua jenis evaluasi ini secara terpisah. A) Learner assessment In spite of the importance, noted above, which ESP should logically give an assessment of student performance, there is a general lack of discussion or guidance on ESP testing. Munby (1978), for example, while laying down highly detailed procedures for the specifications of learning objectives, makes no mention at all of how these objectives might be tested. A) Penilaian pelajar Terlepas dari pentingnya, yang disebutkan di atas, yang ESP harus secara logis memberikan penilaian kinerja siswa, ada kurangnya diskusi atau panduan umum tentang pengujian ESP. Munby (1978), misalnya, ketika meletakkan prosedur yang sangat rinci untuk spesifikasi tujuan pembelajaran, tidak menyebutkan sama sekali tentang bagaimana tujuan ini dapat diuji. Alderson and Waters (1983) maintain that the lack of importance assigned to evaluation can be attributed to pervasive prejudices against testing among applied linguists and other language teaching practitioners. The result of this prejudice is to see assessment as a post hoc operation- a regrettable and dreary task to be stacked on to the end of the course design is usually long after the syllabus, materials and methodology have been fixed. The net result is 'a paradoxical situation in which the need for better tests and evaluation procedures co-occurs alongside an almost universal lack of acceptable instruments' (ibtd). Alderson dan Waters (1983) berpendapat bahwa kurangnya pentingnya ditugaskan untuk evaluasi dapat dikaitkan dengan prasangka meresap terhadap pengujian di antara ahli bahasa terapan dan praktisi pengajaran bahasa lainnya. Hasil dari prasangka ini adalah untuk melihat penilaian sebagai operasi post hoc - tugas yang disesalkan dan suram untuk ditumpuk



pada akhir desain kursus biasanya lama setelah silabus, bahan dan metodologi telah diperbaiki. Hasil akhirnya adalah 'situasi paradoks di mana kebutuhan untuk pengujian yang lebih baik dan prosedur evaluasi terjadi bersamaan di samping kurangnya instrumen yang dapat diterima secara universal' (ibtd). This lack, however, does nor imply that there are no tests available in ESP. In fact Davies and West (1984) list 14 examinations in Specific Purpose English offered by British institutions. The London Chamber of Commerce and Industry, the Associated Examination Board (AEB) and the Pitman Examinations Institute offer examinations in Secretarial and Commercial English. Cambridge offers English for Business and English for Science. The City and Guilds of London Institute offers examinations in Technical English. AEB also offers an examination in English for Academic Purposes (TEEP), as does the British Council (ELTS). The English Language Teaching Development Unit (ELTDU) has produced a Scales of Attention and Test Battery for Occupational English. There is, then, no shortage of available examinations in ESP. What is lacking is any sound theoretical or empirical basis for ESP testing. Far more research is necded before we will really know what the requirements of a good ESP test are. We return to this point below (p. 150). Namun kekurangan ini tidak menyiratkan bahwa tidak ada tes yang tersedia di ESP. Bahkan Davies dan West (1984) mendaftar 14 ujian dalam Bahasa Inggris Tujuan Khusus yang ditawarkan oleh lembaga-lembaga Inggris. Kamar Dagang dan Industri London, Dewan Pemeriksaan Terkait (AEB) dan Institut Pemeriksaan Pitman menawarkan ujian dalam Bahasa Inggris Sekretariat dan Komersial. Cambridge menawarkan Bahasa Inggris untuk Bisnis dan Bahasa Inggris untuk Sains. The City and Guilds of London Institute menawarkan ujian dalam Bahasa Inggris Teknis. AEB juga menawarkan ujian dalam Bahasa Inggris untuk Keperluan Akademik (TEEP), seperti halnya British Council (ELTS). Unit Pengembangan Pengajaran Bahasa Inggris (ELTDU) telah menghasilkan Skala Perhatian dan Tes Baterai untuk Bahasa Inggris Kerja. Maka, tidak ada kekurangan ujian yang tersedia di ESP. Apa yang kurang adalah dasar teori atau empiris yang sehat untuk pengujian ESP. Jauh lebih banyak penelitian diperlukan



sebelum kita benar-benar tahu apa persyaratan tes ESP yang baik. Kami kembali ke titik di bawah ini (hlm. 150). In ESP there are three basic types of assessment: 1)



2) 3)



Placement tests. These are used to "place" learners in the ESP course most suited to their needs. The placement test normally comes at the beginning of the course. Achievement tests. These tests how well the learner is keeping up with the syllabus and can be administered at any time through the course. Proficiency tests. These assess whether or not the student can cope with the demands of a particular situation, for example, study at a university or read technical manuals.



Dalam ESP ada tiga jenis dasar penilaian: 1) Tes penempatan. Ini digunakan untuk "menempatkan" peserta didik dalam kursus ESP yang paling sesuai dengan kebutuhan mereka. Tes penempatan biasanya dilakukan pada awal kursus. 2) Tes prestasi. Tes ini seberapa baik pelajar mengikuti silabus dan dapat diberikan setiap saat melalui kursus. 3) Tes kecakapan. Ini menilai apakah siswa dapat mengatasi tuntutan situasi tertentu, misalnya, belajar di universitas atau membaca manual teknis. These different types of tests do not necessarily vary in terms of content. They differ in terms of their initial function. But even here they need not to be exclusive, since the same test may be used for more than one purpose. For example, all types of types may be used as diagnostic rests, that is, tests to determine the areas of weakness a particular learer-might have. This diagnostic evidence can then be used as a means of determining what and how much tuition the learmer needs. The AEB's Test in English for Educational Purposes is a good example of a test with a dual function. It is used both to assess a student's ability to cope with a course of study (proficiency test) and to indicate what does help the Tearner might need (placement test).



Berbagai jenis tes ini tidak selalu berbeda dalam hal konten. Mereka berbeda dalam hal fungsi awal mereka. Tetapi bahkan di sini mereka tidak perlu eksklusif, karena tes yang sama dapat digunakan untuk lebih dari satu tujuan. Sebagai contoh, semua jenis tipe dapat digunakan sebagai sandaran diagnostik, yaitu tes untuk menentukan area kelemahan yang dimiliki oleh pembelajar tertentu. Bukti diagnostik ini kemudian dapat digunakan sebagai sarana untuk menentukan apa dan berapa banyak uang sekolah yang dibutuhkan pelajar. Tes AEB dalam Bahasa Inggris untuk Tujuan Pendidikan adalah contoh yang baik dari tes dengan fungsi ganda. Hal ini digunakan baik untuk menilai kemampuan siswa untuk menghadapi program studi (tes kecakapan) dan untuk menunjukkan apa yang mungkin dibutuhkan Tearner (tes penempatan). 1. Placement tests The aim of the placement test is to determine the learners' state of knowledge before the ESP course begins. In so doing it should indicate firstly whether the learners need the course at all and secondly, should a need be indicated, what form the course should take. The placement test is, therefore, in the first instance a proficiency test. If a learner is already proficient in the skills required, no further tuition is required. In its second function, the placement test is diagnostic, indicating how "far and in what ways the learner falls short of the proficiency level. In this respect the test has a formative value, in that the test results will be used in forming the nature and content of the ESP course that the learner will take, As already noted, the AEB's Test in English for Educational Purposes can be used in this way for prospective students in higher education. ELTDU's Scales of Attention provides a similar service for commercial and industrial use. The Scales specify the linguistic requirements of given tasks and the associated Battery Test determines what tasks an employee is currently able to do. Matching the results of the Battery Test to the Scales will provide a specification, which can provide the basis for future language training. 1. Tes penempatan Tujuan dari tes penempatan adalah untuk menentukan tingkat pengetahuan peserta didik sebelum kursus ESP dimulai. Dalam melakukan hal itu harus



ditunjukkan terlebih dahulu apakah peserta didik perlu kursus sama sekali dan kedua, jika perlu ditunjukkan, apa bentuk kursus yang harus diambil. Tes penempatan, oleh karena itu, dalam contoh pertama adalah tes kecakapan. Jika pelajar sudah mahir dalam keterampilan yang dibutuhkan, tidak ada biaya kuliah lebih lanjut. Dalam fungsi keduanya, tes penempatan bersifat diagnostik, yang menunjukkan seberapa "jauh dan dalam hal apa pelajar kurang dari tingkat kemahiran. Dalam hal ini tes memiliki nilai formatif, di mana hasil tes akan digunakan dalam membentuk sifat. dan isi kursus ESP yang akan diambil pelajar, Seperti yang telah disebutkan, Tes AEB dalam Bahasa Inggris untuk Tujuan Pendidikan dapat digunakan dengan cara ini untuk calon siswa dalam pendidikan tinggi. Skala Perhatian ELTDU menyediakan layanan serupa untuk penggunaan komersial dan industri Timbangan menentukan persyaratan linguistik dari tugas yang diberikan dan Uji Baterai terkait menentukan tugas apa yang saat ini dapat dilakukan karyawan. Menyesuaikan hasil Uji Baterai dengan Timbangan akan memberikan spesifikasi, yang dapat memberikan dasar untuk pelatihan bahasa di masa depan. . Doubts have been expressed about the ability to accurately diagnose learner needs through tests (Alderson and Hughes, 1981), but in the absence of any more accurate instruments, the course designer has little choice. What should be borne in mind is that any placement test can only be an approximate guide and should be treated with due caution. The good placement test should also reveal positive factors. It should show not just what the learner lacks, but also what the potential for learning can be exploited in the ESP course. Keraguan telah diungkapkan tentang kemampuan untuk secara akurat mendiagnosis kebutuhan pelajar melalui tes (Alderson dan Hughes, 1981), tetapi dengan tidak adanya instrumen yang lebih akurat, perancang kursus memiliki banyak pilihan. Yang harus diingat adalah bahwa setiap tes penempatan hanya dapat menjadi panduan perkiraan dan harus diperlakukan dengan hati-hati. Tes penempatan yang baik juga harus mengungkapkan faktor positif. Seharusnya tidak hanya menunjukkan kekurangan pelajar, tetapi juga potensi pembelajaran yang dapat dieksploitasi dalam kursus ESP.



2. Achievement tests This kind of test is the least problematic, since it is usually internal to the course, It does not have to conform to external influences, but it should rather reflect the nature and content of the course itself (Alderson and Hughes, 1981) . The achievement test is, however, the kind of test the ESP teacher is most likely to have to construct. We will, therefore, give some basic guidance in this task (see e.g. Heaton, 1975 and Oller, 1979 for detailed guidance). In constructing a good ESP achievement test you should follow the same basic principles as you would for constructing any test. For example: 2. Tes prestasi Tes semacam ini adalah yang paling tidak bermasalah, karena biasanya internal untuk kursus, Itu tidak harus sesuai dengan pengaruh eksternal, tetapi harus lebih mencerminkan sifat dan isi dari kursus itu sendiri (Alderson dan Hughes, 1981). Namun, tes prestasi adalah jenis tes yang harus dibangun oleh guru ESP. Karena itu, kami akan memberikan beberapa panduan dasar dalam tugas ini (lihat mis. Heaton, 1975 dan Oller, 1979 untuk panduan terperinci). Dalam membangun tes prestasi ESP yang baik, Anda harus mengikuti prinsip dasar yang sama seperti yang Anda lakukan untuk membangun tes apa pun. Sebagai contoh: (a) Test what you can reasonably assume the learners have learned. This is not necessarily the same as what you have taught. (b) Your test should test what you actually want it to test. Don't, for example, make a test of reading ability dependent on the ability to write. A learner may well be able to read and understand something, but unable to put the ideas down in writing. (c) Avoid bias in the test. Don't, for example, write test items which demand specialist subject knowledge or cultural knowledge. This is a problem with any kind of language test, but it is probably more apparent in ESP tests, which may often involve the use of specialist content - technical, commercial, medical, and so on. The important point is that getting the correct answer should not depend on the specialist subject knowledge outside the material used in the test.



(a) Uji apa yang menurut Anda wajar dapat dipelajari oleh peserta didik. Ini belum tentu sama dengan apa yang telah Anda ajarkan. (b) Tes Anda harus menguji apa yang sebenarnya ingin Anda uji. Jangan, misalnya, membuat tes kemampuan membaca tergantung pada kemampuan menulis. Seorang pembelajar mungkin bisa membaca dan memahami sesuatu, tetapi tidak dapat menuliskan ide-ide itu secara tertulis. (c) Hindari bias dalam ujian. Jangan, misalnya, menulis item tes yang menuntut pengetahuan subjek khusus atau pengetahuan budaya. Ini adalah masalah dengan segala jenis tes bahasa, tetapi mungkin lebih jelas dalam tes ESP, yang mungkin sering melibatkan penggunaan konten spesialis - teknis, komersial, medis, dan sebagainya. Poin penting adalah bahwa mendapatkan jawaban yang benar tidak harus bergantung pada pengetahuan subjek spesialis di luar materi yang digunakan dalam tes. Here is a sample test intended to assess the mastery of the work done in the Blood Cell unit on page 110. Berikut adalah contoh uji yang dimaksudkan untuk menilai penguasaan pekerjaan yang dilakukan dalam unit Sel Darah pada halaman 110. TEST The diagram below shows the flow of coolant through a refrigeration system. Study the diagram and then write a description of how the coolant circulates through the system. UJI Diagram di bawah ini menunjukkan aliran cairan pendingin melalui sistem pendingin. Pelajari diagram dan kemudian tulis deskripsi tentang bagaimana pendingin bersirkulasi melalui sistem.



ADA GAMBAR HALAMAN 148



Figure 39: A sample achievement test What features does this test have that make it a suitable means of evaluating the learners' understanding of the material? Gambar 39: Sampel tes pencapaian Apa fitur yang dimiliki tes ini yang menjadikannya sarana yang tepat untuk mengevaluasi pemahaman peserta didik tentang materi? a) It involves production as well as understanding. It, therefore, tests what the materials were teaching. A test which concentrated on, say, checking comprehension of a reading passage about how the refrigerator works would not test the ability to produce descriptions, which is one of the aims of the materials. a) Ini melibatkan produksi serta pemahaman. Oleh karena itu, tes ini menguji materi yang diajarkan. Sebuah tes yang berkonsentrasi pada, katakanlah, memeriksa pemahaman bacaan tentang cara kerja lemari es tidak akan menguji kemampuan untuk menghasilkan deskripsi, yang merupakan salah satu tujuan dari bahan. b) It is an integrated task rather than a set of discrete-point tests focusing on particular sub-skills, for example, "inking clauses'. It is more economical to test the sub-skills by asking the strudents to combine them into a selfsufficient piece of discourse An integrated test also tests the ability of the learners to use the sub-skills in a coherent piece of communication. b) Ini adalah tugas terpadu daripada satu set tes titik-diskrit yang berfokus pada sub-keterampilan tertentu, misalnya, "klausa tinta '. Lebih ekonomis untuk menguji sub-keterampilan dengan meminta para siswa untuk menggabungkan mereka ke dalam sepotong wacana mandiri Tes terpadu juga menguji kemampuan peserta didik untuk menggunakan sub-keterampilan dalam komunikasi yang koheren. c) The content is of a similar nature to that of the unit: it is concerned with the movement of a fluid through an enclosed system. It should, therefore, indicate whether the learner is able to describe such systems. c) Konten tersebut memiliki sifat yang mirip dengan unit: berkaitan dengan pergerakan fluida melalui sistem tertutup. Karena itu, harus mengindikasikan apakah pelajar mampu menggambarkan sistem seperti itu.



d) The subject matter is probably already known to the learners. (In practice it would be wise to check this beforehand.) The subject knowledge should, therefore, neither obstruct nor give unfair advantage. d) Materi pelajaran mungkin sudah diketahui oleh peserta didik. (Dalam praktiknya akan lebih bijak untuk memeriksa ini sebelumnya.) Oleh karena itu, pengetahuan subjek seharusnya tidak menghalangi atau memberi keuntungan yang tidak adil. e) It does not require knowledge of subject-specific vocabulary, such as auricle 'and "ventricle. The specific vocabulary of the refrigerator system is also given. The test, therefore, does not test subject-specific vocabulary, but rather the ability to exploit such learners within a context of general vocabulary The learners must extract the specific names from the diagrams and use them in their descriptions It tests written production This might not be appropriate in every case. If the exercises in the materials have been done orally, then the test could be changed into an oral test as follows: "Study the diagram. Then prepare and give an oral commentary on the flow of coolant through the system. " e) Ini tidak memerlukan pengetahuan tentang kosakata subjek-spesifik, seperti auricle 'dan "ventricle. Kosakata khusus dari sistem kulkas juga diberikan. Tes, oleh karena itu, tidak menguji kosakata subjek-spesifik, melainkan kemampuan untuk mengeksploitasi peserta didik seperti itu dalam konteks kosa kata umum. Peserta didik harus mengekstraksi nama-nama spesifik dari diagram dan menggunakannya dalam deskripsinya. Ini menguji produksi tertulis Ini mungkin tidak sesuai dalam setiap kasus. Jika latihan dalam materi telah dilakukan secara lisan, maka tes dapat diubah menjadi tes lisan sebagai berikut: "Pelajari diagram. Kemudian siapkan dan berikan komentar lisan tentang aliran cairan pendingin melalui sistem. " 3 Proficiency tests In the introduction to their Guide to English Language Examinations, Davies and West (1984) identify the primary purpose of language testing in the eighties as" proficiency testing is designed to assess whether candidates will be able to perform the language tasks required of them '. Such tests, they say, are primarily criterion-referenced. In other words, the candidate's ability is assessed according



to how far it matches certain criteria judged to be essential for proficiency in a particular task. With criterion-referencing, there is no pass / fail distinction, but rather a scale of degrees of proficiency in the task. An example of such a scale is that used for the British Council's ELTS test which is used to assess a candidate’s ability to study at an English-medium institution of higher education: 3 Tes kecakapan Dalam pengantar Panduan mereka untuk Pemeriksaan Bahasa Inggris, Davies dan West (1984) mengidentifikasi tujuan utama pengujian bahasa pada tahun delapan puluhan karena "tes kecakapan dirancang untuk menilai apakah para kandidat akan dapat melakukan tugas-tugas bahasa yang diperlukan dari mereka '. Tes semacam itu, kata mereka, terutama mengacu pada kriteria. Dengan kata lain, kemampuan kandidat dinilai berdasarkan seberapa jauh itu cocok dengan kriteria tertentu yang dinilai penting untuk kemahiran dalam tugas tertentu. Dengan referensi kriteria, tidak ada lulus / gagal membedakan, tetapi lebih pada skala derajat kemahiran dalam tugas tersebut.Sebuah contoh skala seperti itu adalah yang digunakan untuk tes ELTS British Council yang digunakan untuk menilai kemampuan kandidat untuk belajar di lembaga pendidikan tinggi berbahasa Inggris-menengah:



ADA GAMBAR HALAMAN 150



Figure 40: proficiency scales used in ELTS test Gambar 40: skala kecakapan yang digunakan dalam tes IELTS



The move towards proficiency testing fits very neatly with the concept of ESP, which is crucially concerned with enabling learners to perform certain language tasks. Proficiency tests for specific purposes should, therefore, be able to give a reliable indication of whether a candidate is proficient enough to carry out the tasks that will be required. Such tests also have high face validity in that they look as if they are reliable indicators. Scientists might well question the results of a test which, for example, assessed their proficiency in writing reports on the basis of their ability to answer questions on a short story. But a test which was asked for a report on a science lecture would seem to be a valid indicator of the required proficiency. Yet although specific language proficiency tests seem to be a logical extension of the ESP principle, they remain problematic. Why is this so? Langkah menuju pengujian kemahiran sangat sesuai dengan konsep ESP, yang terutama berkaitan dengan memungkinkan peserta didik untuk melakukan tugas bahasa tertentu. Tes kecakapan untuk tujuan tertentu harus, oleh karena itu, dapat memberikan indikasi yang dapat diandalkan apakah seorang kandidat cukup mahir untuk melakukan tugas-tugas yang akan diperlukan. Tes semacam itu juga memiliki validitas wajah yang tinggi karena terlihat seperti indikator yang dapat diandalkan. Para ilmuwan mungkin mempertanyakan hasil tes yang, misalnya, menilai kemahiran mereka dalam menulis laporan berdasarkan kemampuan mereka untuk menjawab pertanyaan pada sebuah cerita pendek. Tetapi tes yang diminta untuk laporan tentang kuliah sains tampaknya menjadi indikator yang valid dari kecakapan yang diperlukan. Namun meskipun tes kemahiran bahasa tertentu tampaknya merupakan perpanjangan logis dari prinsip ESP, mereka tetap bermasalah. Kenapa begitu? a) As already noted, proficiency tests are primarily criterion-referenced. And therein lies the problem: what should the criteria be? Should they vary with different subject areas? What skills and knowledge enable someone to perform particular tasks? How specific are those skills and knowledge to any particular task? In spite of all the recent developments in our knowledge of language use, we still have to admit that we don't really know what makes communicative performance possible. This argument might be counted by having real-life tasks as tests. However, this is rarely possible to set up in



practice and so still leaves us with the problem of determining what teatures are crucial to the real-life performance. a) Seperti telah disebutkan, tes kecakapan terutama mengacu pada kriteria. Dan di situlah letak masalahnya: bagaimana seharusnya kriteria itu? Haruskah mereka berbeda dengan bidang studi yang berbeda? Keterampilan dan pengetahuan apa yang memungkinkan seseorang untuk melakukan tugas tertentu? Seberapa spesifik keterampilan dan pengetahuan itu untuk tugas tertentu? Terlepas dari semua perkembangan terbaru dalam pengetahuan kita tentang penggunaan bahasa, kita masih harus mengakui bahwa kita tidak benar-benar tahu apa yang membuat kinerja komunikatif menjadi mungkin. Argumen ini dapat dihitung dengan memiliki tugas kehidupan nyata sebagai ujian. Namun, hal ini jarang dimungkinkan untuk dilakukan dalam praktik dan masih menyisakan masalah untuk menentukan teh apa yang penting untuk kinerja kehidupan nyata. b) How specific is specific? Can a test in Engincering, for example, be a valid indicator for all branches of Engineering- marine, electronic, civil, electrical, mechanical, aeronautical etc? Alderson and Hughes (1981) make this point in considering the British Council's ELTS test: 'which ELTS modular test, for example, out of the six presently available (Physical, Life, Social and Medical Sciences, Technology and General Academic) should be taken by a student of Urban and Regional Studies, whose course will include Law and Economics courses as well as courses in Technology? ... What about the (fre- quent) cases of students who have a background in Physical Sciences, who are coming to the UK to do a (to them) novel course in Technology? Do they take the Physical Science test or the Technology test? " b) Seberapa spesifik spesifik? Bisakah tes di Engincering, misalnya, menjadi indikator yang valid untuk semua cabang Teknik-kelautan, elektronik, sipil, listrik, mekanik, aeronautika dll? Alderson dan Hughes (1981) membuat poin ini dalam mempertimbangkan tes ELTS British Council: 'tes modular ELTS, misalnya, dari enam yang tersedia saat ini (Fisik, Kehidupan, Ilmu Sosial dan Medis, Teknologi dan Akademik Umum) harus diambil oleh siswa Studi Urban dan Regional, yang kursusnya akan mencakup kursus Hukum dan Ekonomi serta kursus di Teknologi? ... Bagaimana dengan kasus (sering) siswa yang



memiliki latar belakang dalam Ilmu Fisika, yang datang ke Inggris untuk melakukan kursus novel (kepada mereka) dalam bidang Teknologi? Apakah mereka mengikuti tes Ilmu Fisika atau tes Teknologi? " Until we know more about what enables a language user to perform particular communicative tasks, we must view proficiency tests as only approximate guides. Sampai kita tahu lebih banyak tentang apa yang memungkinkan pengguna bahasa untuk melakukan tugas-tugas komunikatif tertentu, kita harus melihat tes kecakapan sebagai hanya perkiraan panduan. Conclusion In this section we have considered some of the mechanics of evaluating learner performance, and in particular we have outlined some of the problems associated with specific purpose testing. We should like, in conclusion, to consider the role that tests play within a learning-centered approach to ESP. Kesimpulan Pada bagian ini kami telah mempertimbangkan beberapa mekanisme untuk mengevaluasi kinerja pelajar, dan khususnya kami telah menguraikan beberapa masalah yang terkait dengan pengujian tujuan khusus. Kesimpulannya, kita harus mempertimbangkan peran yang dimainkan tes dalam pendekatan pembelajaran-terpusat untuk ESP. The value of tests depends primarily on how they are used. Teachers and learners necd, first of all, a positive atitude to tests. Since the tests are here to stay (at least until we can think of a better alternative), it is no good closing our eyes to them and hoping they will go away. Rather, tests should be recommended for the important roles they play in the teaching-learning process, and every effort is made - by teachers and learners - to get the most out of them. We need to see test results less as an end in themselves and more as the starting point for genuine negotiation and interaction between the teacher and the learners, and among the learners themselves. A grade, however good or bad, is in itself of little significance: its real meaning lies in understanding the reasons why it was given and what it tells the students about how they might improve their future work.



Nilai tes tergantung terutama pada bagaimana mereka digunakan. Guru dan peserta didik perlu, pertama-tama, sikap positif terhadap tes. Karena tes di sini untuk tetap (setidaknya sampai kita bisa memikirkan alternatif yang lebih baik), tidak baik menutup mata kita untuk mereka dan berharap mereka akan pergi. Sebaliknya, tes harus direkomendasikan untuk peran penting yang mereka mainkan dalam proses belajar-mengajar, dan setiap upaya dilakukan - oleh guru dan peserta didik - untuk mendapatkan hasil maksimal dari mereka. Kita perlu melihat hasil tes lebih sedikit sebagai tujuan pada diri mereka sendiri dan lebih sebagai titik awal untuk negosiasi dan interaksi yang tulus antara guru dan peserta didik, dan di antara peserta didik itu sendiri. Nilai, betapapun baik atau buruknya, itu sendiri tidak begitu penting: makna sebenarnya terletak pada memahami alasan mengapa itu diberikan dan apa yang diberitahukan kepada siswa tentang bagaimana mereka dapat meningkatkan pekerjaan masa depan mereka. Evaluation can fulfill two functions - assessment and feedhck. Assess- ment is a matter of measur- ing what the learners already know. But any assessment should also provide positive feedback to inform teachers and learners about what is still not known, thus providing important input to the content and methods of future work. Although used in the first instance to assess learner performance, the key to the development of a positive attitude to tests lies in recognition and capitalising on their feedback function, and play down the obsessive or fearful attitudes engendered by viewing tests exclusively as determiners of grades. Given, also, the fact that most ESP learners arc adults, there is no reason why the educational use of tests should not be taken a stage further, with learners becoming increasingly involved in providing feedback to themselves and their peers, and sharing in decisions about the most appropriate procedures for evaluating their progress. Such work can involve both useful realistic communicaton practice and deepen the learners' awareness of the learning process. Evaluasi dapat memenuhi dua fungsi - penilaian dan umpan balik. Penilaian adalah masalah mengukur apa yang sudah diketahui peserta didik. Tetapi penilaian apa pun juga harus memberikan umpan balik positif untuk memberi tahu guru dan pelajar tentang apa yang masih belum diketahui, sehingga memberikan masukan penting untuk konten dan metode pekerjaan masa depan. Meskipun digunakan dalam contoh pertama untuk menilai



kinerja pelajar, kunci untuk pengembangan sikap positif terhadap tes terletak pada pengakuan dan memanfaatkan fungsi umpan balik mereka, dan mengecilkan sikap obsesif atau takut yang ditimbulkan dengan melihat tes secara eksklusif sebagai penentu nilai. Mengingat, juga, fakta bahwa sebagian besar peserta didik ESP adalah orang dewasa, tidak ada alasan mengapa penggunaan tes pendidikan tidak boleh melangkah lebih jauh, dengan peserta didik menjadi semakin terlibat dalam memberikan umpan balik kepada diri mereka sendiri dan rekan-rekan mereka, dan berbagi dalam keputusan tentang prosedur yang paling tepat untuk mengevaluasi kemajuan mereka. Pekerjaan semacam itu dapat melibatkan praktik komunikasi realistis yang bermanfaat dan memperdalam kesadaran peserta didik tentang proses pembelajaran. B. Course evaluation The ESP course, like any course, should regularly demonstrate that its continued existence in its present form is justified. Since the ESP course exists to satisfy a particular educational need, evaluation helps to show how well the course is actually fulfilling the need. A sponsor may also wish to be supplied with clear information about the suitability of the course and may well base decisions as to further investment and support on the results. B. Evaluasi kursus Kursus ESP, seperti kursus apa pun, harus secara teratur menunjukkan bahwa keberlanjutan keberadaannya dalam bentuk yang sekarang dibenarkan. Karena kursus ESP ada untuk memenuhi kebutuhan pendidikan tertentu, evaluasi membantu menunjukkan seberapa baik kursus memenuhi kebutuhan. Sponsor juga mungkin ingin diberikan informasi yang jelas tentang kesesuaian kursus dan mungkin mendasarkan keputusan untuk investasi lebih lanjut dan dukungan pada hasil. Thus evaluating an ESP course helps to establish whether it is meeting its aims. The information gathered forms the starting point for any necessary revisions of the course, and may also help guide the design of other similar courses in your teaching institution or elsewhere.



The course evaluation also plays a useful social role, by showing the various parties involved (teachers, learners, sponsors, etc.) that their views are important. There are four main aspects of the ESP course evaluation to be considered (Alderson and Waters, 1983): Dengan demikian, mengevaluasi kursus ESP membantu menentukan apakah program tersebut memenuhi tujuannya. Informasi yang dikumpulkan membentuk titik awal untuk setiap revisi kursus yang diperlukan, dan juga dapat membantu memandu desain kursus serupa lainnya di lembaga pengajaran Anda atau di tempat lain. Evaluasi kursus juga memainkan peran sosial yang bermanfaat, dengan menunjukkan berbagai pihak yang terlibat (guru, pelajar, sponsor, dll.) Bahwa pandangan mereka penting. Ada empat aspek utama dari evaluasi kursus ESP untuk dipertimbangkan (Alderson dan Waters, 1983): a) What should be evaluated? b) How can ESP courses be evaluated? c) Who should be involved in the evaluation? d) When (and how often) should evaluation take place? a) Apa yang harus dievaluasi? b) Bagaimana kursus ESP dapat dievaluasi? c) Siapa yang harus dilibatkan dalam evaluasi? d) Kapan (dan seberapa sering) evaluasi harus dilakukan? a) What should be evaluated? The short answer is: everything of significance. However, there are two important constraints: a) Apa yang harus dievaluasi? Jawaban singkatnya adalah: segala sesuatu yang penting. Namun, ada dua kendala penting:



i) Your ability to collect the information; ii) Your ability to use the information once it has been collected. It will annoy everyone concerned if you collect all sorts of detailed information evaluations, possibly at considerable inconvenience, time and expense, and then do little or nothing with it. Next time round, your colleagues (and others) may not be so cooperative. i) Kemampuan Anda untuk mengumpulkan informasi; ii) Kemampuan Anda untuk menggunakan informasi setelah dikumpulkan. Ini akan mengganggu semua orang yang peduli jika Anda mengumpulkan semua jenis evaluasi informasi terperinci, mungkin dengan ketidaknyamanan, waktu dan biaya yang cukup besar, dan kemudian melakukan sedikit atau tidak sama sekali dengan itu. Lain kali, kolega Anda (dan lainnya) mungkin tidak begitu kooperatif. In a learning-centered approach to ESP, the overall aim of the ESP course is to meet two main needs of the learners: their needs as language Learners, and their needs as language users (sce chapter 6). It follows that the 'what' of ESP course evaluation is concerned with assessing the extent to which the course satisfies both kinds of needs. Thus, the inquiry should begin with questions such as: Dalam pendekatan pembelajaran-berpusat pada ESP, tujuan keseluruhan kursus ESP adalah untuk memenuhi dua kebutuhan utama pembelajar: kebutuhan mereka sebagai pembelajar bahasa, dan kebutuhan mereka sebagai pengguna bahasa (sce bab 6). Oleh karena itu 'apa' evaluasi kursus ESP berkaitan dengan menilai sejauh mana kursus memenuhi kedua jenis kebutuhan. Dengan demikian, pertanyaan harus dimulai dengan pertanyaan seperti: Is the course fulfilling the learners' language learning needs? the learners' language using needs?



-Has the course fulfilled -Is the course fulfilling Apakah kursus memenuhi kebutuhan belajar bahasa peserta didik? bahasa pembelajar menggunakan kebutuhan? -Memiliki kursus terpenuhi -Apakah kursusnya memuaskan



If the response to any of these questions is a 'yes', then congratulations are in order! However, assuming that you get only a qualified "yes", (or even an outright 'no'!) In reply to one or more of them, the next question that needs to be asked is: Jika jawaban atas salah satu dari pertanyaan ini adalah 'ya', maka selamat! Namun, dengan asumsi bahwa Anda hanya mendapatkan "ya" yang memenuhi syarat, (atau bahkan 'tidak' langsung!). Sebagai balasan untuk satu atau lebih dari mereka, pertanyaan berikutnya yang perlu ditanyakan adalah: What areas of need are not being / have we not been fulfilled? Apa bidang kebutuhan yang tidak / belum kita penuhi? Once we know what these areas are, we can turn our attention to identifying the source (s) of these problems. Now the relevant questions are: Begitu kita tahu apa area-area ini, kita dapat mengalihkan perhatian kita untuk mengidentifikasi sumber (s) dari masalah-masalah ini. Sekarang pertanyaan yang relevan adalah: Were the unfulGlled needs identified during the course design process? If not, why not? How can the course design process be improved to avoid this problem in future?



How can the course be changed to take these needs into account? If these needs were identified during the course design process, why are they not being / have they not been fulfilled? Is the fault in: Apakah kebutuhan yang tidak terpenuhi diidentifikasi selama proses desain kursus? Jika tidak, mengapa tidak? Bagaimana proses desain kursus ditingkatkan untuk menghindari masalah ini di masa depan? Bagaimana kursus dapat diubah untuk memperhitungkan kebutuhan ini? Jika kebutuhan ini diidentifikasi selama proses perancangan kursus, mengapa tidak / belum dipenuhi? Apakah kesalahan dalam: a) the syllabus (es); b) the materials; c) the teaching and learning techniques; d) the testing procedures; e) logistical / administrative arrangements; f ) the course evaluation system? a) silabus (es); b) bahan; c) teknik belajar mengajar; d) prosedur pengujian; e) pengaturan logistik / administrasi; f) sistem evaluasi kursus?



b)How can ESP courses be evaluated? In theory, there are very many ways in which the ESP course can be evaluated, ranging from simulations to suggestion boxes. However, in practice, most ESP courses are evaluated using one or more of the following techniques: -test results; - questionnaires; - discussions; - interviews; - informal means (e.g. unsolicited comments, 'casual' chats etc.). b) Bagaimana kursus ESP dapat dievaluasi? Secara teori, ada banyak cara di mana kursus ESP dapat dievaluasi, mulai dari simulasi hingga kotak saran. Namun, dalam praktiknya, sebagian besar kursus ESP dievaluasi menggunakan satu atau lebih teknik berikut: -hasil tes; - kuesioner; - diskusi; - wawancara; - sarana informal (mis. komentar yang tidak diminta, obrolan 'santai' dll.). Which techniques you use will depend on what suits your teaching situation best. It needs to be stressed that gathering the evaluation information is only the first stage in the process. The information must be collated next, and if it is extensive, summarized. After this, it needs to be discussed with all interested



parties, and some conclusions drawn. Finally, it should be included in a detailed course evaluation report, as a basis for further discussion and decision-making. As with (a) above, nothing is more discouraging than if useful suggestions for change are consigned to the wastepaper bin through apathy or laziness on the part of teachers or course designers. Having reached your conclusions, use them! Teknik mana yang Anda gunakan akan tergantung pada apa yang paling sesuai dengan situasi pengajaran Anda. Perlu ditekankan bahwa mengumpulkan informasi evaluasi hanyalah tahap pertama dalam proses. Informasi harus disusun selanjutnya, dan jika luas, dirangkum. Setelah ini, perlu didiskusikan dengan semua pihak yang berkepentingan, dan beberapa kesimpulan diambil. Akhirnya, harus dimasukkan dalam laporan evaluasi kursus terperinci, sebagai dasar untuk diskusi dan pengambilan keputusan lebih lanjut. Seperti dengan (a) di atas, tidak ada yang lebih mengecewakan daripada jika saran yang berguna untuk perubahan diserahkan ke tempat sampah melalui apatis atau kemalasan pada bagian dari guru atau perancang kursus. Setelah mencapai kesimpulan Anda, gunakan! b)Who should be involved in the evaluation? The extent of involvement of any group will vary, but it is likely, in practice, that the bodies most concerned will be the ESP teaching institution, the ESP teachers, the learners and the course sponsors. (Former students can also provide useful information.) It is important to get a representative cross-section of views and to take them properly into account. Evaluation is concerned with people's perceptions of value and their views will, therefore, vary according to their own interests and concerns. With learners, in particular, it can be difficult to get feedback which is an expression of their real views. They may be reluctant to criticize authority, maybe thinking it might prejudice their assessment. They might simply be apathetic, feeling that any course revisions will not help them, but only future students. Orientation exercises (see Waters, 1985) can be used to get learners accustomed to expressing their views honestly and candidly, although it must be said that an open and trusting relationship between the teacher and the students is the best basis for promoting frank and useful feedback . b) Siapa yang harus dilibatkan dalam evaluasi?



Tingkat keterlibatan kelompok mana pun akan berbeda-beda, tetapi dalam praktiknya, kemungkinan besar bahwa badan yang paling terkait adalah lembaga pengajaran ESP, guru ESP, peserta didik dan sponsor kursus. (Mantan siswa juga dapat memberikan informasi yang bermanfaat.) Penting untuk mendapatkan penampang pandangan yang representatif dan mempertimbangkannya dengan tepat. Evaluasi berkaitan dengan persepsi orang tentang nilai dan pandangan mereka, oleh karena itu, akan bervariasi sesuai dengan minat dan kepedulian mereka sendiri. Dengan peserta didik, khususnya, akan sulit untuk mendapatkan umpan balik yang merupakan ekspresi dari pandangan mereka yang sebenarnya. Mereka mungkin enggan mengkritik otoritas, mungkin berpikir hal itu dapat merusak penilaian mereka. Mereka mungkin saja apatis, merasa bahwa setiap revisi kursus tidak akan membantu mereka, tetapi hanya siswa-siswa masa depan. Latihan orientasi (lihat Waters, 1985) dapat digunakan untuk membuat peserta didik terbiasa mengekspresikan pandangan mereka secara jujur dan terus terang, meskipun harus dikatakan bahwa hubungan yang terbuka dan saling percaya antara guru dan siswa adalah dasar terbaik untuk mempromosikan umpan balik yang jujur dan bermanfaat. . Who you ask and how you ask will affect what you find out. Thus, the methodology of course evaluation procedures, although coming midway in our list of points here, should actually be seen as a primary consideration, and care should always be taken, in any statement about evaluation findings, to make explicit how the information was obtained , that is, from whom, and by what means. Siapa yang Anda tanyakan dan bagaimana Anda bertanya akan memengaruhi apa yang Anda temukan. Dengan demikian, metodologi prosedur evaluasi kursus, meskipun berada di tengah-tengah daftar poin kami di sini, sebenarnya harus dilihat sebagai pertimbangan utama, dan kehati-hatian harus selalu diambil, dalam pernyataan tentang temuan evaluasi, untuk membuat eksplisit bagaimana informasi diperoleh , yaitu dari siapa, dan dengan cara apa. d)When (and how often) should evaluation take place?



There is an undoubted danger in doing course evaluation too frequently. Respondents have only so much time to give the right quantity and quality of information: the ESP teacher is limited in how quickly and insightfully he or sbe can process it and so on. However, the dangers in not doing cvaluation courses often are enough are equal, or greater. Learners, sponsors and others will evaluate the course informally anyway. If there is no proper channel or forum for these views, there is a risk of misunderstanding, or at worst, hostility. d) Kapan (dan seberapa sering) evaluasi harus dilakukan? Ada bahaya yang tidak diragukan dalam melakukan evaluasi kursus terlalu sering. Responden hanya memiliki begitu banyak waktu untuk memberikan kuantitas dan kualitas informasi yang tepat: guru ESP terbatas dalam seberapa cepat dan penuh wawasan dia dapat memprosesnya dan seterusnya. Namun, bahaya tidak melakukan kursus penilaian cukup sering sama, atau lebih besar. Peserta didik, sponsor dan yang lainnya akan mengevaluasi kursus secara informal. Jika tidak ada saluran atau forum yang tepat untuk pandangan-pandangan ini, ada risiko kesalahpahaman, atau paling buruk, permusuhan. It is difficult to prescribe how often an evaluation course should be done. All sensitive and responsive teaching will include this as a continuing feature anyway. So much will also depend on the characteristics of the individual teaching situation. However, in our experience, the most important times occur: Sulit untuk menentukan seberapa sering kursus evaluasi harus dilakukan. Semua pengajaran yang sensitif dan responsif akan memasukkan ini sebagai fitur yang berkelanjutan. Begitu banyak juga akan tergantung pada karakteristik situasi pengajaran individu. Namun, dalam pengalaman kami, saat-saat paling penting terjadi: i) in the first week of the course. The tone established here will probably have a greater overall effect on the success of the course than what happened later, since the initial impressions are very often more enduring than later ones. ii) at regular intervals throughout the course, for example, every half term. in iii) at the end of the course.



iv) (if possible) after the course. This is potentially the most valuable, since the learners will be in a position to judge how well the course prepared them for the target situation they are now in. i) pada minggu pertama kursus. Nada yang ditetapkan di sini mungkin akan memiliki efek keseluruhan yang lebih besar pada keberhasilan kursus daripada apa yang terjadi kemudian, karena kesan awal lebih sering lebih bertahan daripada yang kemudian. ii) secara berkala sepanjang kursus, misalnya, setiap semester. di iii) di akhir kursus. iv) (jika mungkin) setelah kursus. Ini berpotensi yang paling berharga, karena peserta didik akan berada dalam posisi untuk menilai seberapa baik kursus mempersiapkan mereka untuk situasi target mereka sekarang. Finally, a general word of caution. Evaluation can be time-consuming, complex and frustrating. Apart from the matters already discussed, other possible difficulties may arise. For example, problems identified might have no obvious solutions, or only solutions that are too radical or expensive for everyone to accept. Feedback from one party may contradict feedback from another. In some parts of the world, willing to evaluate in consultation with the learners might be taken as a sign of incompetence: "It's the teachers' job to know these things - why should we do their jobs? Alternatively, criticizing a course might be seen as showing a lack of respect for authority On the other hand, an evaluation session can easily degenerate into a forum for airing minor, personal grievances Recognising that course evaluation is likely to bring with it disadvantages of this kind, as well as benefits, is probably half the battle, and, in overall terms, it is likely that a sound evaluation system will provide a deeper insight, from all sides, into the nature of the most effective learning experiences and processes that can be accommodated As Brumfit (1983 ) says: Akhirnya, kata umum hati-hati. Evaluasi bisa memakan waktu, rumit dan membuat frustrasi. Terlepas dari hal-hal yang telah dibahas, kesulitan lain yang mungkin timbul. Misalnya, masalah yang diidentifikasi mungkin tidak memiliki solusi yang jelas, atau hanya solusi yang terlalu radikal atau



mahal untuk diterima oleh semua orang. Umpan balik dari satu pihak dapat bertentangan dengan umpan balik dari pihak lain. Di beberapa bagian dunia, bersedia untuk mengevaluasi dengan berkonsultasi dengan peserta didik dapat dianggap sebagai tanda ketidakmampuan: "Adalah tugas para guru untuk mengetahui hal-hal ini - mengapa kita harus melakukan pekerjaan mereka? Atau, mengkritik suatu kursus dapat dilihat sebagai menunjukkan kurangnya rasa hormat terhadap otoritas Di sisi lain, sesi evaluasi dapat dengan mudah berubah menjadi forum untuk menyiarkan keluhan kecil, pribadi. Mengakui bahwa evaluasi kursus kemungkinan akan membawa kerugian seperti ini, serta manfaatnya, mungkin setengah dari pertempuran, dan, secara keseluruhan, ada kemungkinan bahwa sistem evaluasi yang baik akan memberikan wawasan yang lebih dalam, dari semua sisi, ke sifat pengalaman belajar yang paling efektif dan proses yang dapat diakomodir Seperti yang dikatakan Brumfit (1983): "One of the most useful roles of formal feedback sessions (is) to reveal to students the wide variety of their own demands and needs, so that they become increasingly aware of the need for a general syllabus whi ch (can) be individualized within boundaries imposed by finance and time. " Thus, in addition to its 'political' aspects, course evaluation, at its best, is an indispensable part of a learning-centered approach to ESP. "Salah satu peran yang paling berguna dari sesi umpan balik formal (adalah) untuk mengungkapkan kepada siswa berbagai macam tuntutan dan kebutuhan mereka sendiri, sehingga mereka menjadi semakin sadar akan kebutuhan akan silabus umum yang dapat disesuaikan secara individu dalam batas-batas dipaksakan oleh keuangan dan waktu. " Jadi, di samping aspek-aspek 'politisnya', evaluasi kursus, yang terbaik, adalah bagian yang tak terpisahkan dari pendekatan pembelajaran-berpusat pada ESP. Conclusion At the beginning of this chapter we identified two kinds of evaluation: evaluation of the student and evaluation of the course. We have outlined ways in which both



types of evaluation can be carried out and we have described how cach fits into a learning-centered approach. For student assessment, it means emphasizing what tests can tell us about learning needs. In course evaluation we need to involve all those who share the learning process in making the ESP course as satisfying to the parties as possible. The origins of ESP lie in satisfying needs. Evaluation helps to assess how well the needs that have created the demand for a course are being served. Kesimpulan Pada awal bab ini kami mengidentifikasi dua jenis evaluasi: evaluasi siswa dan evaluasi kursus. Kami telah menguraikan cara-cara di mana kedua jenis evaluasi dapat dilakukan dan kami telah menggambarkan bagaimana cach cocok dengan pendekatan yang berpusat pada pembelajaran. Untuk penilaian siswa, itu berarti menekankan tes apa yang dapat memberi tahu kita tentang kebutuhan belajar. Dalam evaluasi kursus kita perlu melibatkan semua pihak yang berbagi proses pembelajaran dalam membuat kursus ESP senyaman mungkin bagi para pihak. Asal usul ESP terletak pada kebutuhan yang memuaskan. Evaluasi membantu menilai seberapa baik kebutuhan yang telah menciptakan permintaan untuk kursus dilayani.