Kamis, 25 April 2013

Pembuatan Instrumen Evaluasi Tes dan Non-tes Kualitas alat evaluasi (Validitas, Reabilitas, Daya pembeda)



Pembuatan Instrumen Evaluasi Tes dan Non-tes
Instrumen evaluasi
Secara umum yang dimaksud dengan instrumen adalah suatu alat yang memenuhi persyaratan akademis, sehingga dapat dipergunakan sebagai alat ukur atau pengumpulan data mengenai suatu variable. Dalam bidang penelitian instrumen diartikan sebagai alat untuk mengumpulkan data mengenai variabel-variabel penelitian untuk kebutuhan penelitian, sedangkan dalam bidang pendidikan instrumen digunakan untuk mengukur prestasi belajar siswa, faktor-faktor yang diduga mempunyai hubungan atau berpengaruh terhadap hasil belajar, perkembangan hasil belajar, keberhasilan proses belajar mengajar dan keberhasilan pencapaian suatu program tertentu (Djaali & Pudji Mulyono, 2007)
Pada dasarnya instrumen dapat dibagi dua yaitu tes dan non-tes. Yang termasuk kelompok tes adalah tes prestasi belajar, tes intelegensi, tes bakat, dan tes kemampuan akademik, sedangkan yang termasuk dalam kelompok non tes ialah skala sikap, skala penilaian, observasi, wawancara, angket dokumentasi dan sebagainya.
Teknik pembuatan instrumen evaluasi tes dan non-tes
      A.     Tes
a.      Pengertian
Secara umum tes diartikan sebagai alat yang dipergunakan untuk mengukur pengetahuan atau penguasaan objek ukur terhadap seperangkat materi tertentu. Menurut Sudijono (1996) tes adalah alat atau prosedur yang digunakan dalam rangka pengukuran dan penilaian. Tes dapat juga diartikan sebagai alat pengukur yang mempunyai standar objektif, sehingga dapat dipergunakan secara meluas, serta betul-betul dapat dipergunakan untuk mengukur dan membandingkan keadaan psikis atau tingkah laku individu. Sedangkan menurut Norman (1976) tes merupakan salah satu prosedur evaluasi yang komprehensif, sistematik, dan objektif yang hasilnya dapat dijadikan dasar dalam pengambilan keputusan (Djaali & Pudji Mulyono, 2007).
b.      Fungsi
Menurut Anas Sudijono (2001: 67) secara umum ada dua fungsi tes antara lain:
1.      Tes sebagai alat pengukur terhadap peserta didik. Dalam hubungan ini tes berfungsi mengukur tingkat perkembangan atau kemajuan yang telah dicapai oleh peserta didik setelah mereka menempuh proses belajar mengajar dalam jangka waktu tertentu.
2.      Tes sebagai alat pengukur keberhasilan program mengajar di sekolah. Sebab melalui tes akan dapat diketahui sudah berapa jauh program pengajaran yang telah ditentukan atau dicapai.
c.       Jenis Tes
Ada beberapa jenis tes yang sering digunakan dalam proses pendidikan, yaitu:
1.      Tes penempatan
Tes yang dilaksanakan untuk keperluan penempatan bertujuan agar setiap siswa yang mengikuti kegiatan pembelajaran di kelas atau pada jenjang pendidikan tertentu dapat mengikuti kegiatan pembelajaran secara efektif, karena dengan bakat dan kemampuannya masing-masing. Contohnya tes bakat, tes kecerdasan dan tes minat.


1.      Tes Diagnostik
Tes diagnostik dilaksanakan untuk mengidentifikasi kesulitan belajar yang dialami siswa, menentukan faktor-faktor yang menyebabkan kesulitan belajar dan menetapkan cara mengatasi kesulitan belajar tersebut. Dengan demikian jelas ada kaitan yang erat antara tes penempatan dan diagnostik. Bahkan dapat dikatakan keduanya saling melengkapi dalam memberikan kontribusi terhadap peningkatan efektivitas kegiatan pendidikan pada suatu jenis atau jenjang pendidikan tertentu.
2.      Tes Formatif
Tes formatif pada dasarnya adalah tes yang bertujuan untuk mendapatkan umpan balik bagi usaha perbaikan kualitas pembelajaran dalam konteks kelas. Kualitas pembelajaran di kelas ditentukan oleh intensitas proses belajar (proses intern) dalam diri setiap siswa sebagai subjek belajar sekaligus peserta didik.
3.      Tes Sumatif
Hasil tes sumatif berguna untuk (a) menentukan kedudukan  atau rangking masing-masing siswa dalam kelompoknya (b) menentukan dapat atau tidaknya siswa melanjutkan program pembelajaran berikutnya, dan (c) menginformasikan kemajuan siswa untuk disampaikan kepada pihak lain seperti orang tua, sekolah, masyarakat, dan lapangan kerja. Jika tes sumatif dilaksanakan pada setiap akhir semester, maka setiap akhir jenjang pendidikan dilaksanakan tes akhir atau biasa disebut evaluasi belajar tahap akhir (Djaali & Pudji Mulyono, 2007)
a.      Bentuk Tes
Untuk melaksanakan evaluasi hasil mengajar dan belajar, seorang guru dapat menggunakan dua macam tes, yakni tes yang telah distandarkan (standardized test) dan tes buatan guru sendiri (teacher-made test). Achievement test yang biasa dilakukan oleh guru dapat dibagi menjadi dua golongan, yakni tes lisan (oral tes) dan tes tertulis (writen tes). Tes tertulis dapat dibagi atas tes essay dan tes objektif atau disebut juga short-answer test (Ngalim Purwanto, 2006).
Tes Lisan
Tes lisan merupakan sekumpulan item pertanyaan atau pernyataan yang disusun secara terencana, diberikan oleh seorang guru kepada para siswanya tanpa melalui media tulis. Pada kondisi tertentu, seperti jumlah siswa kecil (kelompok siswa yang praktek laboratorium) atau sebagian siswa yang memerlukan tes remedial, maka tes lisan dapat digunakan secara efektif. Tes lisan ini sebaiknya berfungsi sebagai  tes pelengkap, setelah tes utama dalam bentuk tertulis dilakukan (Sukardi, 2008).
Tes Essay
Secara ontology tes esai adalah salah satu bentuk tes tertulis, yang susunannya terdiri atas item-item pertanyaan yang masing-masing mengandung permasalahan dan menuntut jawaban siswa melui uraian-uraian kata yang merefleksikan kemampuan berpikir siswa (Sukardi, 2008).
Menurut Sukardi (2008: 96) untuk meningkatkan mutu pertanyaan esai sebagai alat pengukur hasil belajar yang kompleks, memerlukan dua hal penting yang perlu diperhatikan oleh para evaluator. Kedua hal penting tersebut, yaitu:
 

(a) bagaimana mengkonstruksi pertanyaan esai yang mengukur perilaku yang direncanakan, dan (b) bagaimana menskor jawaban  yang diperoleh dari siswa. Berikut adalah cara-cara dalam menyusun tes esai yang dimaksud.
  1. Para guru hendaknya memfokuskan pertanyaan esai pada materi pembelajaran yang tidak dapat diungkap dengan bentuk tes lain misalnya tes objektif. Ada beberapa faktor penting dalam proses belajar mengajar,yang hanya bisa diungkap oleh tes esai.
  2. Para guru hendaknya memformulasikan item pertanyaan yang mengungkap perilaku spesifik yang diperoleh dari pengalaman hasil belajar. Tes yang direncanakan oleh guru, baik tes objektif maupun tes esai perlu tetap mengukur penilaian tujuan intruksional.
  3. Item-item pertanyaan tes esai sebaiknya jelas dan tidak menimbulkan kebingungan sehingga para siswa dapat menjawab dengan tidak ragu-ragu
  4. Sertakan petunjuk waktu pengerjaan untuk setiap pertanyaan, agar para siswa dapat memperhitungkan kecepatan berpikir, menulis dan menuangkan ide sesuai dengan waktu yang disediakan.
  5. Ketika mengonstruksi sejumlah pertanyaan esai, para guru hendaknya menghindari penggunaan pertanyaan pilihan. Pertanyaan pilihan biasanya terletak pada kalimat instruksi pengerjaan pada awal tes, misalnya “pilih empat soal dari lima pertanyaan yang tersedia”.
Menurut Sri Esti W.D (2004: 429) juga berpendapat bahwa ada beberapa petunjuk atau saran untuk menyusun tes isian seperti di bawah ini:
  1. Kita hendaknya tidak mengutip kalimat atau pernyataan dalam buku teks atau buku catatan.
  2. Bagian yang kosong hendaknya hanya dapat diisi dengan satu jawaban yang benar
  3. Bagian yang dikosongkan terdiri dari satu kata kunci, atau kata pokok bukan sembarang kata
  4. Kalimat harus sederhana dan jelas sehingga lebih mudah dimengerti
  5. Bagian yang kosong ditaruh di akhir kalimat, misalnya menteri keuangan yang bertugas sekarang ialah
Tes Objektif
Merupakan tes yang cara pemeriksaannya dapat dilakukan secara objektif yang dilakukan dengan cara mencocokkan kunci jawaban dengan hasil jawaban tes. hal ini memungkinkan tes untuk menjawab banyak pertanyaan dalam waktu yang relatif singkat.
Ada beberapa jenis tes objektif
1. Tes Objektif Pilihan Ganda
Item tes pilihan ganda merupakan jenis tes objektif yang paling banyak digunakan oleh para guru. Tes ini dapat mengukur pengetahuan yang luas dengan tingkat domain yang bervariasi. Item tes pilihan ganda memiliki semua persyaratan sebagai tes yang baik, yakni dilihat dari segi ojektivitas, reliabilitas, dan daya pembeda antara siswa yang berhasil dengan siswa yang gagal (Sukardi, 2008).

2. Tes Objektif Benar-Salah
Item tes benar-salah dibedakan menjadi dua macam bentuk yaitu, item tes bentuk regular atau tidak dimodifikasi dan item tes bentuk modifikasi. Di bidang pendidikan umum maupun kejuruan, item tes benar salah yang tidak dimodifikasi atau regular banyak digunakan oleh para guru. Salah satu alasannya adalah bahwa item tes benar salah jenis regular dapat digunakan dalam proses belajar mengajar  sebagai tehnik untuk mengawali dimulainya diskusi yang hangat, menarik dan bermakna. Item tes betul salah apabila dicermati secara intensif , akan membawa peserta didik ke dalam diskusi isu-isu pembelajaran yang bergeser sedikit menjadi problem solving (Sukardi, 2008).

3. Tes Objektif Menjodohkan
Item tes menjodohkan sering juga disebut matching test item. Item tes menjodohkan ini juga termasuk dalam kelompok tes objektif. Secara fisik , bentuk item tes menjodohkan, terdiri atas dua kolom yang sejajar. Pada kolom pertama berisi pernyataan yang disebut daftar stimulus dan kolom kedua berisi kata atau fakta yang disebut juga daftar respon atau jawaban (Sukardi, 2008).

Teknik Pembuatan Tes
Ada dua macam teknik yang dapat digunakan dalam melaksanakan evaluasi, yaitu teknik tes dan teknik non tes. Teknik tes meliputi tes lisan, tes tertulis dan tes perbuatan. Tes lisan dilakukan dalam bentuk pertanyaan lisan di kelas yang dilakukan pada saat pembelajaran di kelas berlangsung atau di akhir pembelajaran. Tes tertulis adalah tes yang dilakukan tertulis, baik pertanyaan maupun jawabannya. Sedangkan tes perbuatan atau tes unjuk kerja adalah tes yang dilaksanakan dengan jawaban menggunakan perbuatan atau tindakan.
Evaluasi dengan menggunakan teknik tes bertujuan untuk mengetahui:
a.  Tingkat kemampuan awal siswa
b.  Hasil belajar siswa
c.  Perkembangan prestasi siswa
d.  Keberhasilan guru dalam melaksanakan kegiatan pembelajaran
Tes lisan dilakukan melalui pertanyaan lisan untuk mengetahui daya serap siswa. Tujuan tes lisan ini terutama untuk menilai:
a.  Kemampuan memecahkan masalah
b.  Proses berpikir terutama melihat hubungan sebab akibat
c.  Kemampuan menggunakan bahasa lisan
d.  Kemampuan mempertanggungjawabkan pendapat atau konsep yang dikemukakan.
Tes tertulis dapat berbentuk uraian (essay) atau soal bentuk obyektif (objective tes). Tes uraian merupakan alat penilaian hasil belajar yang paling tua. Secara umum tes uraian ini adalah pertanyaan yang menuntut siswa menjawab dalam bentuk menguraikan, menjelaskan, mendiskusikan, membandingkan, memberikan alasan, dan bentuk lain yang sejenis sesuai dengan tuntutan pertanyaan dengan menggunakan kata-kata dan bahasa sendiri.

Cara-cara penyusunan tes esai yang dimaksud:
a.      Guru hendaknya memfokuskan pertanyaan esai pada materi pembelajaran yang tidak dapat diungkap dengan bentuk tes lain misalnya tes objektif
b.      Guru kendaknya memformulasikan item pertanyaan yang mengungkap perilaku spesifik yang diperoleh dari pengalaman hasil belajar.

a.      Item-item pertanyaan tes esai sebaiknya jelas dan tidak menimbulkan kebingungan sehingga siswa dapat menjawabnya dengan tidak ragu-ragu
b.      Sertakan petunjuk waktu pengerjaan untuk setiap pertanyaan, agar para siswa dapat memperhitungkan kecepatan berpikir, menulis dan menuangkan ide sesuai dengan waktu yang disediakan.
c.       Ketika mengontruksi sejumlah pertanyaan esai, para guru hendaknya menghindari penggunaan pertanyaan pilihan. Misalnya pilih empat soal dari lima pertanyaan yang tersedia.

1.      Bentuk soal benar-salah

Bentuk soal benar salah adalah bentuk tes yang soal-soalnya berupa pernyataan. Sebagian dari pernyataan itu merupakan pernyataan yang benar dan sebagian lagi merupakan pernyataan yang salah.


Kelebihan betul salah yaitu;

  1. Item tes betul salah memiliki karakteristik yang menguntungkan, yaitu mudah dan cepat dalam menilai
  2. Untuk item betul salah yang di konstruksi secara cermat, membawa implikasi kepada peserta didik, yaitu waktu mengerjakan soal lebih cepat diselesaikan
  3. Seperti bentuk tes objektif lainnya, item tes benar salah hasil akhir penilaian dapat objektif
Kelemahan betul salah;
  1. Mengonstruksi item tes betul salah pada umumnya diperlukan waktu yang lebih lama jika dibandingkan dengan pembuatan tes esai
  2. Penggunaan pertanyaan alternatif lebih memungkinkan peserta didik mengira-ngira jawaban.

2.      Bentuk soal pilihan ganda atau pilihan jamak (multiple choice)

Soal pilihan ganda adalah bentuk tes yang mempunyai satu jawaban yang benar atau paling tepat.
Kelebihan bentuk soal pilihan ganda yaitu:
  1. Tes pilihan ganda memiliki karakteristik yang baik untuk suatu alat pengukur hasil belajar siswa
  2. Item tes pilihan ganda yang di konstruksi dengan intensif dapat mencakup hampir seluruh bahan pembelajaran yang diberikan oleh guru di kelas.
  3. Item tes pilihan ganda adalah tepat untuk mengukur penguasaan informasi para siswa yang hendak dievaluasi.

Kelemahan bentuk soal pilihan ganda yaitu;
  1. Mengonstruksi item tes betul salah pada umumnya diperlukan waktu yang lebih lama jika dibandingkan dengan pembuatan tes esai
  2. Penggunaan pertanyaan alternative lebih memungkinkan peserta didik mengira-ngira jawaban.

   
1.      Bentuk soal menjodohkan (matching)

Bentuk soal menjodohkan terdiri atas dua kelompok pernyataan yang paralel. Kedua kelompok pernyataan ini berada dalam satu kesatuan. Kelompok sebelah kiri merupakan bagian yang berisi soal-soal yang harus dicari jawabannya.

Kelebihan bentuk soal menjodohkan
  1. Penilaiannya dapat dilakukan dengan cepat dan objektif.
  2. Tepat digunakan untuk mengukur kemampuan bagaimana mengidentifikasi antara dua hal yang berhubungan.
  3. Dapat mengukur ruang lingkup pokok bahasan atau sub pokok bahasan yang lebih luas.


Kelemahan bentuk soal menjodohkan
  1. Hanya dapat mengukur hal-hal yang didasarkan atas fakta dan hafalan
  2. Sukar untuk menentukan materi atau pokok bahasan yang mengukur hal-hal yang berhubungan

2.      Bentuk soal jawaban singkat (isian)

Bentuk soal jawaban singkat merupakan soal yang menghendaki jawaban dalam bentuk kata, bilangan, kalimat, atau simbol.
Kelebihan bentuk soal jawaban singkat;
  1. Menyusun soalnya relatif mudah
  2. Kecil kemungkinan siswa memberi jawaban dengan cara menebak
  3. Menuntut siswa untuk dapat menjawab dengan singkat dan tepat
  4. Hasil penilaiannya cukup objektif
Kelemahan bentuk soal jawaban singkat;
  1. Kurang dapat mengukur aspek pengetahuan yang lebih tinggi.
  2. Memerlukan waktu yang agak lama untuk menilainya sekalipun tidak selama bentuk uraian
  3. Menyulitkan pemeriksaan apabila jawaban siswa membingungkan pemeriksa.
  4. A.     Non Tes
    a. Pengertian
    Tehnik evaluasi nontes berarti melaksanakan  penilaian dengan tidak menggunakan tes. Tehnik penilaian ini umumnya untuk menilai kepribadian anak secara menyeluruh meliputi sikap, tingkah laku, sifat, sikap sosial, ucapan, riwayat hidup dan lain-lain. Yang berhubungan dengan kegiatan belajar dalam pendidikan, baik secara individu maupun secara kelompok.
    Berikut adalah beberapa instrumen non-tes yang sering digunakan dalam evaluasi di bidang pendidikan
         b. Jenis-jenis Tehnik Non-Tes
    Beberapa alat ukur yang hendak diuraikan pada bagian ini adalah observasi, angket, wawancara, daftar cek dan skala nilai/rating scale.
    1.      Observasi
    Secara garis besar terdapat dua rumusan tentang pengertian observasi, yaitu pengertian secara sempit dan luas. Dalam arti sempit, observasi berarti pengamatan secara langsung terhadap apa yang diteliti, Dalam arti luas observasi meliputi pengamatan yang dilakukan secara langsung mau pun tidak langsung terhadap objek yang diteliti (Susilo Rahardjo & Gudnanto, 2011).
    Menurut Susilo Surya dan Natawidjaja ( dalam Susilo Rahardjo & Gudnanto, 2011: 48-49) membedakan observasi menjadi observasi partisipatif, observasi sistematis, dan observasi experimental.
    2.      Angket
    Ign Masidjo (1995: 70) menyatakan bahwa angket adalah suatu daftar pertanyaan tertulis yang terinci dan lengkap yang harus dijawab oleh responden tentang pribadinya atau hal-hal yang diketahuinya. Sedangkan Susilo Rahardjo & Gudnanto (2011: 92) berpendapat angket atau kuesioner adalah merupakan suatu tehnik atau cara memahami siswa dengan mengadakan komunikasi tertulis, yaitu dengan memberikan daftar pertanyaan yang harus dijawab atau dikerjakan oleh resonden secara tertulis juga.
    Pada pokoknya angket dibagi menjadi dua, berdasarkan cara menjawab pertanyaan dan bagaimana jawaban diberikan. Ditinjau dari cara menjawab pertanyaannya angket dapat dibagi dua. Yaitu angket terbuka dan tertutup (Ign. Masidjo, 1995). Sedangkan menurut Susilo Rahardjo & Gudnanto (2011: 95-97) dilihat dari bentuk pertanyaannya angket dibedakan menjadi tiga yaitu: angket terbuka, angket tertutup dan angket terbuka tertutup.
    1. Angket terbuka, ialah angket yang menggunakan pertanyaan-pertanyaan terbuka. Responden diberikan jawaban sebebas-bebasnya untuk menjawab pertanyaan-pertanyaan yang disediakan.
    2. Angket tertutup, ialah angket yang menggunakan pertanyaan-pertanyaan tertutup. Responden tinggal memilih jawaban-jawaban yang sudah disediakan.
    3. Angket terbuka dan tertutup, ialah angket yang pertanyaan-pertanyaan nya berupa gabungan dari pertanyaan terbuka dan tertutup, baik dalam suatu item, maupun dalam keseluruhan item. Pada umumnya angket ini banyak digunakan untuk kepentingan bimbingan dan konseling.
    4. 1.      Wawancara
      Kompetensi evaluasi lain yang juga perlu dimiliki oleh para guru sebagai evaluator di bidang pendidikan adalah penggunaan evaluasi non tes dengan menggunakan tehnik wawancara/interview. Mengenai apa yang dimaksud dengan wawancara dalam evaluasi non tes. Johnson and Johnson (dalam Sukardi, 2008: 187) menyatakan sebagai berikut: An interview is a personal interaction between interviewer (teacher) and one or more interviwees (students) in which verbal questions are asked. Wawancara adalah interaksi pribadi antara pewawancara (guru) dengan yang diwawancarai (siswa) di mana pertanyaan verbal diajukan kepada mereka.
      Dalam wawancara ada beberapa persyaratan penting yang perlu diperhatikan:
      1. Adanya interaksi atau tatap muka guru dengan siswa
      2. Adanya percakapan verbal di antara mereka dan memiliki tujuan tertentu
      Dalam konteks evaluasi pendidikan, wawancara dapat dilakukan secara individual maupun secara berkelompok, di mana seorang guru bertatap muka dan melakukan tenya jawab terhadap siswanya. Di samping itu wawancara dapat dilakukan baik sebelum, selama dan sesudah proses belajar mengajar berlangsung (Sukardi, 2008).
      2.      Daftar cek
      Daftar cek adalah sebuah daftar yang memuat sejumlah pernyataan singkat, tertulis tentang berbagai gejala yang dimaksudkan sebagai penolong pencatatan ada tidaknya sesuatu gejala dengan cara memberi tanda cek (V) pada setiao emunculan gejala yang dimaksud. Daftar cek bertujuan untuk mengetahui apakah gejala yang berupa pernyataan yang tercantum dalam daftar cek ada atau tidak ada pada seorang individu atau kelompok (Ign. Masidjo, 1995).
      3.      Skala nilai/Rating scale
      Skala rating merupakan alat ukur keterampilan yang masih juga tergolong alat ukur non tes. Seperti alat ukur daftar cek lis, alat ukur ini juga sudah lama digunakan di bidang evaluasi pendidikan. Pada umumnya, alat ukur rating terdiri atas dua bagian, yaitu:
      1. Satu rangkaian karakteristik atau kualitas yang hendak dinilai
      2. Beberapa tipe skala ukur yang menunjukkan tingkat atau derajat atribut subjek atau objek yang ada (Crondlund & Linn, dalam Sukardi, 2008).
      Skala rating bukan hanya sebuah daftar karakteristik , tetapi juga usaha evaluator dalam mendeskriosikan siswa atau responden dengan karakteristik multi tingkat (Sukardi, 2008).

      Teknik Pembuatan Non Tes

      Teknik tes bukanlah satu-satunya teknik untuk melakukan evaluasi hasil belajar, sebab masih ada teknik lainnya yang dapat digunakan, yaitu teknik non tes. Dengan teknik non tes maka penilaian atau evaluasi hasil belajar peserta didik dilakukan dengan tanpa menguji peserta didik melainkan dilakukan melalui:

      1. Pengamatan atau observasi

      Secara umum, pengertian observasi adalah cara menghimpun bahan-bahan keterangan yang dilakukan dengan mengadakan pengamatan dan pencatatan secara sistematis terhadap fenomena-fenomena yang sedang dijadikan sasaran pengamatan. Alat yang digunakan berupa lembar observasi yang disusun dalam bentuk check list atau skala penilaian.

      2. Wawancara

      Secara umum yang dimaksud dengan wawancara adalah cara menghimpun bahan-bahan keterangan yang dilaksanakan dengan melakukan tanya jawab lisan secara sepihak. Alat yang digunakan adalah pedoman wawancara yang mengacu pada tujuan yang telah ditetapkan.
      3. Angket

      Angket adalah wawancara yang dilakukan secara tertulis. Angket dapat digunakan sebagai alat penilaian hasil belajar. Angket dapat diberikan langsung kepada peserta didik, dapat pula diberikan kepada orang tua mereka.
      4. Skala

      Skala adalah alat untuk mengukur nilai, sikap, minat, perhatian, dan lain-lain yang disusun dalam bentuk pernyataan untuk dinilai oleh responden dan hasilnya dalam bentuk rentangan nilai sesuai dengan kriteria yang ditentukan.


      Kualitas alat evaluasi (Validitas, Reabilitas, Daya pembeda)
      Keberhasilan mengungkapkan hasil belajar dan proses belajar siswa sebagaimana adanya (objektivitas hasil penilaian)sangat bergantung pada kualitas alat penilainya di samping pada cara pelaksanaannya. Suatu alat evaluasi yang baik akan mencerminkan kemampuan sebenarnya dari tes yang dievaluasi dan bisa membedakan yang pandai (di atas rata-rata), dan siswa yang kemampuannya sedang(pada kelompok rata-rata), dan siswa yang kemampuannya kurang (di bawah rata-rata), sehingga penyebaran skor atau nilai evaluasi tersebut berdistribusi normal).
      a.      Validitas

      Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Tes yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes yang memiliki validitas rendah.
      Validitas suatu instrumen selalu bergantung kepada situasi dan tujuan khusus penggunaan instrumen tersebut. Suatu tes yang valid untuk satu situasi mungkin tidak valid untuk situasi yang lain. Sebagai contoh : menilai kemampuan siswa dalam matematika dan diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak memahami pertanyaannya. Contoh lain adalah menilai kemampuan berbicara, tetapi ditanyakan tentang tata bahasa atau kesusastraan seperti puisi atau sajak. Penilaian tersebut tidak tepat (valid). Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan penilaian. Oleh sebab itu keabsahannya tergantung pada sejauh mana ketepatan alat evaluasi itu dalam melaksanakan fungsinya. Dengan demikian suatu alat evaluasi disebut valid jika ia dapat mengevaluasi dengan tepat sesuatu yang dievaluasi.

      b.      Reabilitas
      Reabilitas merupakan penerjemahan dari kata Reability yang mempunyai asal kata rely dan ability. Pengukuran yang memiliki reabilitas tinggi disebut sebagai pengukuran yang reliabel (reliable) walaupun reabilitas mempunyai berbagai nama lain seperti kepercayaan, keterandalan, kestabilan, konsistensi, dan sebagainya, namun ide pokok yang terkandung dalam konsep reabilitas adalah sejauh mana hasil suatu pengukuran dapat dipercaya.
      Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif sama, selama aspek yang diukur dalam diri subjek memang belum berubah. Dalam hal ini, relatif yang dimaksudkan tidak tepat sama, tetapi mengalami perubahan yang tak berarti (tidak signifikan)dan bisa diabaikan.
      Perubahan  hasil  evaluasi ini  disebabkan adanya  unsur   pengalaman  dari   peserta tes  dan kondisi  lainnya.




      Dari uraian di atas dapat dipahami bahwa prinsip reabilitas akan menyangkut pertanyaan : “ seberapa jauhkah pengukuran yang dilakukan secara berulang kali terhadap subjek atau sekelompok subjek yang sama, memberikan hasil-hasil yang relatif tidak mengalami perubahan “. Bila hasil yang diperoleh selalu sama (setidak-tidaknya mendekati sama). Maka dapat dikatakan bahwa alat pengukur berupa tes tersebut telah memiliki reabilitas yang tinggi. Jadi perinsif reabilitas menghendaki adanya keakuratan dari hasil pengukuran yang berulang-ulang terhadap seorang subjek atau sekelompok subjek yang sama.
      Dengan catatan subjek-subjek yang diukur itu tidak mengalami perubahan.
      Estimasi terhadap tingginya reabilitas dapat dilakukan melalui berbagai metode pendekatan. Masing-masing metode pendekatan dikembangkan sesuai dengan sifat dan fungsi alat ukur yang bersangkutan dengan mempertimbangkan dengan mempertimbangkan pula segi-segi praktisnya.
      Terdapat tiga macam pendekatan reabilitas yaitu :

      1.      Pendekatan tes ulang (test-retest)

      Dalam pendekatan ini dilakukan dengan menyajikan tes dua kali pada satu kelompok subjek dengan tenggang waktu di antara kedua kajian tersebut. Asumsi yang menjadi dasar dalam cara ini adalah bahwa suatu tes yang reliabel tentu akan menghasilkan skor tampak yang relatif sama apabila dikenakan dua kali pada waktu yang berbeda. Semakin besar variasi perbedaan skor subjek antara kedua pengenaan itu berarti semakin sulit untuk mempercayai bahwa tes itu memberikan hasil ukur konsisten.

      2.      Pendekatan Bentuk Paralel (paralel-forms)

      Tes bentuk paralel adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan tetapi butir-butir soalnya berbeda. Dengan bahasa sederhana dapat dikatakan bahwa kita harus punya dua tes yang kembar. Sebenarnya, dua tes yang paralel hanya ada secara teoritik, tidak benar-benar paralel secara empirik.
      Pendekatan ini dilakukan dengan memberikan sekaligus dua bentuk tes yang paralel satu sama lain, kepada sekelompok subjek. Dalam pelaksanaannya, kedua tes paralel itu dapat digabungkan terlebih dahulu seakan-akan merupakan suatu bentuk tes semula dipisahkan kembali untuk diberi skor masing-masing, sehingga diperoleh dua distribusi skor.

      3.      Pendekatan Tes Tunggal

      Pendekatan tes tunggal dalam estimasi reliabilitas dimaksudkan, antara lain, untuk menghindari masalah-masalah yang biasanya ditimbulkan oleh pendekatan tes ulang dan oleh pendekatan bentuk paralel. Dalam menggunakan pendekatan ini prosedurnya hanya memerlukan satu kali pengenaan sebuah tes pada sekelompok individu sebagai subjek (single trial administration). Oleh karena itu pendekatan ini mempunyai nilai praktis dan efisiensi yang tinggi. Dengan hanya satu kali tes pengenaan tes akan diperoleh satu distribusi skor tes dari kelompok subjek bersangkutan


      Analisis data untuk pendekatan tes tunggal bisa dibagi ke dalam dua macam teknik, yaitu :
      Teknik Belah Dua
      Dalam menentukan reabilitas suatu  perangkat tes (evaluasi) dengan menggunakan teknik belah dua, dilakukan dengan jalan membelah alat evaluasi tersebut menjadi dua bagian yang sama (relatif sama), sehingga masing-masing tes memiliki dua macam skor. Salah satu syarat yang harus dipenuhi untuk teknik belah dua ini adalah jumlah soal dalam perangkat harus genap, supaya kedua bagian itu jumlah soalnya sama.

      Teknik belah dua ini bisa dilakukan dengan dua cara, yaitu :

      a.      Pembelahan menurut nomor (soal) ganjil dan nomor genap atau disingkat Metode Ganjil Genap. Misalkan suatu perangkat tes terdiri dari 20 butir soal, maka kelompok belahan pertama terdiri dari skor-skor untuk nomor 1, 3, 5, 7, 9, 11, 13, 15, 17, dan 19 sedangkan untuk kelompok kedua terdiri dari 2, 4, 6, 8, 10, 12, 14, 16, 18, 20.
      b.      Pembelahan menurut nomor urut yang disebut dengan metode awal akhir. Misal perangkat tes terdiri dari 20 butir soal, maka kelompok bahan pertama terdiri dari skor-skor untuk nomor 1 sampai dengan 10 dan kelompok belahan kedua terdiri dari skor-skor untuk nomor 11 sampai dengan 20.

             c. Daya Pembeda
      Yang dimaksud Daya Pembeda suatu soal tes ialah bagaimana kemampuan soal itu untuk membedakan siswa-siswa yang termasuk kelompok pandai (upper group) dengan siswa-siswa yang termasuk kelompok kurang (lower group). Daya pembeda suatu soal tes dapat dihitung dengan menggunakan rumus seperti berikut:
                  DP=(WL-WH) / n
      Keterangan:
      DP        : Daya Pembeda
      n          : Jumlah kelompok atas atau kelompok bawah
      WL       : jumlah peserta didik yang menjawab salah dari kelompok bawah
      WH      : jumlah peserta didik yang menjawab salah dari kelompok atas
      Contoh:
      Untuk mendapatkan gambar yang lebih jelas mengenai langkah-langkah yang ditempuh dalam mencari Indeks kesukaran dan daya pembeda suatu item, di bawah ini akan dikemukakan sebuah contoh.


      a.         Kita misalkan murid yang mengikuti tes yang kita berikan adalah sebanyak 50 orang. Lembar jawaban murid-murid tersebut kita susun dari skor tertinggi paling atas sampai dengan skor rendah yang terbawah.
      b.         Kita ambil 27% dari mereka yang mendapatkan skor tertinggi. Dalam hal ini, 27% x 50 orang sama dengan 13,5 orang kita bulatkan menjadi 14 orang. Begitu pula kita ambil 27% dari mereka yang mendapatkan skor yang terendah. Jumlahnya tentu sama dengan kelompok atas, yaitu 14 orang.
      c.         Misalkan data yang diperoleh adalah sebagai berikut:
      ·      Untuk item no.1, dari kelompok bawah salah 9 orang dan dari kelompok atas  salah 2 orang.
      ·      Untuk item no.2, dari kelompok bawah salah 8 orang dan dari kelompok atas salah 5 orang.
      ·      Untuk item no.3, dari kelompok bawah salah 14 orang dan dari kelompok atas salah 5 orang.
      ·      Untuk item no.4, dari kelompok bawah salah 6 orang dan dari kelompok atas tidak ada yang salah.
      ·      Untuk item no.5, dari kelompok bawah salah 13 orang dan dari kelompok atas salah 10 orang.
      ·      Untuk item no.6, dari kelompok bawah salah 2 orang dan dari kelompok atas salah 3 orang.
      d.      Berdasarkan data tersebut, maka dapat dibuat tabel seperti di bawah ini.
      No.Item
      WL
      WH
      WL  +  WH
      WL  -  WH
      1
      2
      3
      4
      5
      6
      9
      8
      14
      6
      13
      2
      2
      5
      8
      0
      11
      3
      11
      13
      23
      6
      24
      5
      7
      3
      6
      6
      2
      -1


      e.       Berdasarkan tabel diatas, maka indeks kesukaran untuk masing-masing item dapat dicari sebagai berikut:
      ·      Untuk item no.1                        ·      Untuk item no.6
      DP=7/14=0,5                                     DP=-1/14=-0,07
      ·      Untuk item no.2
      DP=3/14=0,21
      ·      Untuk item no.3
      DP=6/14=0,43
      ·      Untuk item no.4
      DP=6/14=0,43
      ·      Untuk item no.5
      DP=2/14=0,14

      Daya Pembeda yang ideal adalah daya pembeda 0,40 ke atas. Namun untuk ulangan-ulangan harian, masih dapat ditolerir daya pembeda sebesar 0,20. Item-item yang memenuhi syarat dapat kita simpan dan kita gunakan untuk keperluan evaluasi yang akan datang. Item-item yang tidak memenuhi syarat harus dibuang atau direvisi.

      SEMOGA BERMANFAAT.



1 komentar:

  1. Thanks ya atas artikelnya,, sangat bermanfaat... salam kenalan....!!!!

    BalasHapus