Menentukan skor
Skor adalah hasil pekerjaan menskor yang diperoleh dengan menjumlahkan angka-angka bagi setiap soal tes yang dijawab betul oleh siswa.
Menentukan dalam kamus besar Bahasa Indonesia adalah membuat menjadi tentu (pasti);menetapkan; memastikan: pemerintah yg akan.
Menentukan Skor adalah Menetapkan atau memastikan pekerjaan yang di peroleh dengan menjumlahkan angka-angka bagi setiap soal tes yang dijawab betul oleh siswa.
Menentukan skor pada soal
Menentukan Skor pada soal Essay
Menentukan skor dapat di pilih dari beberapa skala pengukuran, misalnya skala 1-4, 1-10 dan 1-100. Sebaiknya jangan memberikan skor nol. Mulailah skoring dari angka 1. Semakin tinggi skala pengukuran yang digunakan maka hasilnya semakin halus dan akurat. Pemberian skor ini berlaku sama untuk semua nomor soal.
Setelah menetapkan skor langkah selanjutnya adalah menetapkan pembobotan sesuai dengan tingkat kesukaran soal. Sebaiknya gunakan skala 1-10. misalnya soal yang mudah diberi bobot 2, sedang bobotnya 3, dan soal yang sulit bobotnya 5.
Ada juga yang melakukan penilaian lembar jawaban tidak mengikuti cara di atas, dimana setiap soal langsung diberi bobot nilai tanpa mempertimbangkan skala pengukuran. Sehingga skala pengukuran tiap item tidak sama.
untuk lebih jelasnya berikut akan diberikan contoh perhitungan.
No Nomor Soal Nilai Bobot Total Nilai
1 1 3 2 6
2 2 5 5 25
3 3 8 3 24
4 4 6 3 18
5 5 5 3 15
6 6 8 2 16
∑Nilai=35 ∑SK=104
Nilai rata-rata sebelum diberi bobot adalah 35/6 = 5,833
Nilai rata-rata setelah diberi bobot adalah 104/35 = 2,971
Pemberian bobot dalam pengolahan lembar jawaban soal essay sangat penting, karena skor diberikan benar-benar atas dasar kemampuan. Kenyataan juga menunjukkan bahwa setiap item tes tingkat kesukarannya berbeda.
Menentukan skor mentah untuk soal Objektif
Ada dua cara untuk menentukan skor pada bentuk tes objektif:
a. Tanpa Rumus Tebakan (Non-Guessing Formula)
Pemberian skor pada tes objektif pada umumnya digunakan apabila soal belum diketahui tingkat kerumitannya. Untuk soal obyektif bentuk true-false misalnya, setiap item di beri skor maksimal 1 (satu). Apabila test menjawab benar maka diberikan skor 1 dan apabila salah maka diberikan skor 0.
b. Menggunakan Rumus Tebakan (Guessing Formula)
Biasanya rumus ini digunakan apabila soal-soal tes itu pernah di ujicobakan dan dilaksanakan sehingga dapat diketahui tingkat kebenarannya.
Adapun rumus-rumus tebakan sebagai berikut:
• Bentuk Benar-salah (True or False)
S = ΣB- ΣS
Keterangan:
S = skor yang dicari
ΣB = Jumlah Jawaban yang benar
ΣS = Jumlah Jawaban yang Salah
• Bentuk Pilihan Ganda (multiple choice)
s=(∑▒〖B-∑▒S〗)/(n-1)
keterangan:
S = skor yang dicari
ΣB = Jumlah Jawaban yang benar
ΣS = Jumlah Jawaban yang Salah
n = Alternatif jawaban yang disediakan
1 = Bilangan Tetap
B. Acuan Penilaian.
Setelah mendapatkan skor-skor dari pekerjaan peserta didik, maka skor-skor tersebut menjadi dasar penilaian hasil belajar. Penilaian ialah kegiatan memperbandingkan hasil pengukuran (skor) sifat suatu objek dengan acuan yang relevan sedemikian rupa sehingga diperoleh suatu ukuran kualitas. Semakin maju taraf perkembangan peserta didik maka semakin pendek rentang nilai. Ada dua acuan penilaian yaitu Penilaian Acuan Norma (PAN) dan Penilaian Acuan Patokan (PAP).
Penilaian Acuan Norma (PAN)
Penilaian Acuan Norma (Norm Referenced Evaluation) di kenal pula dengan Standar Relatif atau Norma Kelompok. Tes Acuan Norma berasumsi bahwa kemampuan orang itu berbeda dan dapat digambarkan menurut distribusi norma. Perbedaan ini harus di tunjukan oleh hasil pengukuran, misalnya setelah mengikuti kuliah selama satu semester peserta didik di tes. Hasil tes seseorang dibandingkan dengan kelompoknya, sehingga dapat diketahui posisi seseorang. Acuan ini biasanya digunakan pada tes untuk seleksi, karena sesuai dengan tujuannya tes seleksi adalah untuk membedakan kemampuan seseorang dan untuk mengetahui hasil belajar seseorang.
Tujuan penggunaan tes acuan norma biasanya lebih umum dan komprehensif dan meliputi suatu bidang isi dan tugas belajar yang besar. Pada pendekatan acuan norma, standar kinerja yang digunakan bersifat relatif, artinya tingkat kinerja seorang siswa ditetapkan berdasarkan pada posisi relatif dalam kelompoknya. Artinya seorang yang memperoleh nilai di atas rata-rata kelompoknya maka siswa tersebut memperoleh skor yang tinggi, begitu juga sebaliknya. Salah satu keuntungan dari standar relatif ini adalah penempatan skor (kinerja) siswa dilakukan tanpa memandang kesulitan suatu tes secara teliti. Dasar pemikiran dari penggunaan standar PAN adalah adanya asumsi bahwa di setiap populasi yang heterogen terdapat siswa dengan kelompok baik, kelompok sedang dan kelompok kurang.
Contoh “A” acuan norma dalam menentukan nilai siswa:
Dalam kelas matematika, peserta tes terdiri dari 9 orang dengan skor mentah 50, 45, 45, 40, 40, 40, 35, 35, dan 30. Jika menggunakan pendekatan penilaian acuan normal (PAN), maka peserta tes yang mendapat skor tertinggi (50) akan mendapat nilai tertinggi, misalnya 10. sedangkan mereka yang mendapat skor di bawahnya akan mendapat nilai secara proporsional, yaitu 9, 9, 8, 8, 8, 7, 7, 6. Nilai-nilai tersebut diperoleh secara transformasi sebagai berikut :
50/50 x 10=10, 45/50 x 10= 9, 40/50 x 10=8, 35/50 x 10=7, 30/50 x 10=6.
PAN antara lain dimanfaatkan dalam :
Mengklasifikasi siswa dalam kelompoknya.
Menetukan peringkat siswa dalam grupnya.
Menyeleksi siswa berdasar-kan prestasi apa adanya dan pembanding anggota kelompoknya.
PAN digunakan pada :
Tes akhir (sumatif)
Tes seleksi dengan acuan intra kelompok (situasi pada kelompok tersebut)
Tes prognostik, yang bertujuan membuat ramalan (dasar : apabila seseorang menduduki tempat yang sama, semakin tampaklah tingkat kemampuan orang tersebut)
Kekurangan dari penggunaan standar relatif di antaranya adalah:
Dianggap tidak adil
Membuat persaingan yang tidak sehat di antara siswa
Penilaian Acuan Patokan (PAP)
Penilaian Acuan Patokan (criterion referenced evaluation) yang dikenal juga dengan standar mutlak. Penilaian Acuan Patokan berasumsi bahwa hampir semua orang bisa belajar apa saja namun waktunya yang berbeda. Konsekuensi acuan ini adalah adanya program remedi. Penafsiran skor hasil tes selalu dibandingkan dengan kriteria yang telah ditetapkan lebih dahulu. Hasil tes ini di nilai lulus atau tidak. Lulus berarti bisa melakukan, tidak lulus berarti tidak bisa melakukan. Acuan ini banyak digunakan untuk bidang sains dan teknologi serta mata kuliah praktek. Tujuan penggunaan acuan kriteria untuk menyeleksi (secara pasti) status individual mengenai domain perilaku yang ditetapkan/dirumuskan dengan baik. Hal itu dimaksudkan untuk mendapat gambaran yang jelas tentang kinerja peserta tes tanpa memperhatikan bagaimana kinerja tersebut dibandingkan dengan kinerja yang lain.
Dalam pendekatan dengan Acuan Patokan, penentuan tingkatan didasarkan pada skor-skor yang telah ditetapkan sebelumnya dalam bentuk presentasi. Untuk mendapatkan nilai A atau B, seorang siswa harus mendapatkan skor tertentu sesuai dengan batas yang ditentukan tanpa terpengaruh oleh kinerja (skor) yang diperoleh siswa lain dalam kelasnya. Salah satu kelemahan dalam menggunakan standar absolut adalah skor siswa bergantung pada tingkat kesulitan tes yang mereka terima. Artinya apabila tes yang diterima siswa mudah maka para siswa akan mendapat nilai A atau B, dan sebaliknya apabila tes tersebut terlalu sulit untuk diselesaikan maka kemungkinan untuk mendapatkan nilai A atau B akan sangat kecil.
Dalam menginterpretasi skor mentah menjadi nilai dengan menggunakan pendekatan acuan kriteria, maka terlebih dahulu ditentukan kriteria kelulusan dengan batas-batas nilai kelulusan. Umumnya kriteria nilai yang digunakan dalam bentuk rentang skor berikut:
Rentang Skor Nilai
80 – 100 A
70 – 79 B
60 – 69 C
45 – 59 D
<> E
Contoh “B” di bawah ini, mempunyai data yang sama dengan contoh “A”, jika digunakan penilaian acuan Patokan, maka langkah pertama yang dilakukan adalah menetapkan Patokan, misalnya sebagai berikut:
Rentang Skor Nilai
90 – 100 10
80 – 89 9
70 – 79 8
60 – 69 7
50 – 59 6
40 – 49 5
30 – 39 4
20 – 29 3
10 – 19 2
0 – 9 1
Setelah kriteria ditetapkan, langkah berikutnya adalah mengkonversi skor mentah ke nilai. Untuk skor :
50 dikonversi menjadi nilai 6
45 dikonversi menjadi nilai 5
40 dikonversi menjadi nilai 5
35 dikonversi menjadi nilai 4
30 dikonversi menjadi nilai 4
Berikut ini disajikan tabel tentang skor mentah, konversi nilai berdasarkan pendekatan normal dan Patokan:
Tabel. Skor Mentah, Nilai Berdasarkan Pendekatan Normal dan Patokan.
Skor Mentah Nilai Berdasarkan Pendekatan Keterangan
Normal Kriteria
50 10 6
45 9 5
40 8 5
35 7 4
30 6 4
Mencermati tabel di atas, tampak bahwa terjadi perbedaan yang berarti antara informasi yang disajikan oleh kedua pendekatan yang digunakan. Untuk skor 50, seorang siswa akan mendapatkan nilai 10 jika menggunakan pendekatan acuan penilaian normal. Tetapi akan memperoleh nilai 6 jika menggunakan pendekatan acuan penilaian patokan.
PAP antara lain dimanfaatkan dalam :
Penentuan prestasi siswa dalam mencapai tujuan pengajaran.
Menyeleksi siswa atas dasar kualitas prestasi.
Mengukur keefektifan pengajaran (metode, teknik, pemilihan bahan,penggunaan alat, dsb.)
Umpan balik bagi perbaikan pengajaran.
Mengetahui kelamahan/ kesulitan siswa untuk pengajaran remidial.
PAP digunakan pada :
Tes akhir (sumatif)
Tes seleksi dengan acuan diluar kelompok, misalnya patokan tujuan yang harus dicapai (standar tertentu)
Tes formatif (tes pembinaan dalam pengajaran), termasuk tes unit, postes ulangan harian/ formatif.
Tes diagnosis, mengetahui jenis dan penyebab kesulitan belajar.
Kamis, 25 April 2013
Pembuatan Instrumen Evaluasi Tes dan Non-tes Kualitas alat evaluasi (Validitas, Reabilitas, Daya pembeda)
Pembuatan
Instrumen Evaluasi Tes dan Non-tes
Instrumen evaluasi
Secara umum yang dimaksud dengan instrumen adalah suatu
alat yang memenuhi persyaratan akademis, sehingga dapat dipergunakan sebagai
alat ukur atau pengumpulan data mengenai suatu variable. Dalam bidang
penelitian instrumen diartikan sebagai alat untuk mengumpulkan data mengenai
variabel-variabel penelitian untuk kebutuhan penelitian, sedangkan dalam bidang
pendidikan instrumen digunakan untuk mengukur prestasi belajar siswa,
faktor-faktor yang diduga mempunyai hubungan atau berpengaruh terhadap hasil
belajar, perkembangan hasil belajar, keberhasilan proses belajar mengajar dan
keberhasilan pencapaian suatu program tertentu (Djaali & Pudji Mulyono,
2007)
Pada dasarnya instrumen dapat dibagi dua yaitu tes dan
non-tes. Yang termasuk kelompok tes adalah tes prestasi belajar, tes
intelegensi, tes bakat, dan tes kemampuan akademik, sedangkan yang termasuk
dalam kelompok non tes ialah skala sikap, skala penilaian, observasi,
wawancara, angket dokumentasi dan sebagainya.
Teknik pembuatan
instrumen evaluasi tes dan non-tes
A. Tes
a.
Pengertian
Secara umum tes diartikan sebagai alat yang dipergunakan
untuk mengukur pengetahuan atau penguasaan objek ukur terhadap seperangkat
materi tertentu. Menurut Sudijono (1996) tes adalah alat atau prosedur yang
digunakan dalam rangka pengukuran dan penilaian. Tes dapat juga diartikan
sebagai alat pengukur yang mempunyai standar objektif, sehingga dapat
dipergunakan secara meluas, serta betul-betul dapat dipergunakan untuk mengukur
dan membandingkan keadaan psikis atau tingkah laku individu. Sedangkan menurut
Norman (1976) tes merupakan salah satu prosedur evaluasi yang komprehensif,
sistematik, dan objektif yang hasilnya dapat dijadikan dasar dalam pengambilan
keputusan (Djaali & Pudji Mulyono, 2007).
b.
Fungsi
Menurut Anas Sudijono (2001: 67) secara umum ada dua
fungsi tes antara lain:
1.
Tes sebagai alat pengukur terhadap peserta didik. Dalam
hubungan ini tes berfungsi mengukur tingkat perkembangan atau kemajuan yang
telah dicapai oleh peserta didik setelah mereka menempuh proses belajar
mengajar dalam jangka waktu tertentu.
2.
Tes sebagai alat pengukur keberhasilan program mengajar
di sekolah. Sebab melalui tes akan dapat diketahui sudah berapa jauh program
pengajaran yang telah ditentukan atau dicapai.
c.
Jenis Tes
Ada beberapa jenis tes yang sering digunakan dalam proses
pendidikan, yaitu:
1.
Tes penempatan
Tes yang dilaksanakan untuk keperluan penempatan
bertujuan agar setiap siswa yang mengikuti kegiatan pembelajaran di kelas atau
pada jenjang pendidikan tertentu dapat mengikuti kegiatan pembelajaran secara
efektif, karena dengan bakat dan kemampuannya masing-masing. Contohnya tes
bakat, tes kecerdasan dan tes minat.
1.
Tes Diagnostik
Tes diagnostik dilaksanakan untuk mengidentifikasi
kesulitan belajar yang dialami siswa, menentukan faktor-faktor yang menyebabkan
kesulitan belajar dan menetapkan cara mengatasi kesulitan belajar tersebut.
Dengan demikian jelas ada kaitan yang erat antara tes penempatan dan
diagnostik. Bahkan dapat dikatakan keduanya saling melengkapi dalam memberikan
kontribusi terhadap peningkatan efektivitas kegiatan pendidikan pada suatu
jenis atau jenjang pendidikan tertentu.
2.
Tes Formatif
Tes formatif pada dasarnya adalah tes yang bertujuan
untuk mendapatkan umpan balik bagi usaha perbaikan kualitas pembelajaran dalam
konteks kelas. Kualitas pembelajaran di kelas ditentukan oleh intensitas proses
belajar (proses intern) dalam diri setiap siswa sebagai subjek belajar
sekaligus peserta didik.
3.
Tes Sumatif
Hasil tes sumatif berguna untuk (a) menentukan
kedudukan atau rangking masing-masing siswa dalam kelompoknya (b)
menentukan dapat atau tidaknya siswa melanjutkan program pembelajaran
berikutnya, dan (c) menginformasikan kemajuan siswa untuk disampaikan kepada
pihak lain seperti orang tua, sekolah, masyarakat, dan lapangan kerja. Jika tes
sumatif dilaksanakan pada setiap akhir semester, maka setiap akhir jenjang
pendidikan dilaksanakan tes akhir atau biasa disebut evaluasi belajar tahap
akhir (Djaali & Pudji Mulyono, 2007)
a.
Bentuk Tes
Untuk melaksanakan evaluasi hasil mengajar dan belajar,
seorang guru dapat menggunakan dua macam tes, yakni tes yang telah distandarkan
(standardized test) dan tes buatan guru sendiri (teacher-made test).
Achievement test yang biasa dilakukan oleh guru dapat dibagi menjadi dua
golongan, yakni tes lisan (oral tes) dan tes tertulis (writen tes). Tes
tertulis dapat dibagi atas tes essay dan tes objektif atau disebut juga short-answer
test (Ngalim Purwanto, 2006).
Tes Lisan
Tes lisan merupakan sekumpulan item pertanyaan atau
pernyataan yang disusun secara terencana, diberikan oleh seorang guru kepada
para siswanya tanpa melalui media tulis. Pada kondisi tertentu, seperti jumlah
siswa kecil (kelompok siswa yang praktek laboratorium) atau sebagian siswa yang
memerlukan tes remedial, maka tes lisan dapat digunakan secara efektif. Tes
lisan ini sebaiknya berfungsi sebagai tes pelengkap, setelah tes utama
dalam bentuk tertulis dilakukan (Sukardi, 2008).
Tes Essay
Secara ontology tes esai adalah salah satu bentuk tes
tertulis, yang susunannya terdiri atas item-item pertanyaan yang masing-masing
mengandung permasalahan dan menuntut jawaban siswa melui uraian-uraian kata yang
merefleksikan kemampuan berpikir siswa (Sukardi, 2008).
Menurut Sukardi (2008: 96) untuk meningkatkan mutu
pertanyaan esai sebagai alat pengukur hasil belajar yang kompleks, memerlukan
dua hal penting yang perlu diperhatikan oleh para evaluator. Kedua hal penting
tersebut, yaitu:
(a) bagaimana mengkonstruksi pertanyaan esai yang
mengukur perilaku yang direncanakan, dan (b) bagaimana menskor jawaban
yang diperoleh dari siswa. Berikut adalah cara-cara dalam menyusun tes esai
yang dimaksud.
- Para guru hendaknya memfokuskan pertanyaan esai pada materi pembelajaran yang tidak dapat diungkap dengan bentuk tes lain misalnya tes objektif. Ada beberapa faktor penting dalam proses belajar mengajar,yang hanya bisa diungkap oleh tes esai.
- Para guru hendaknya memformulasikan item pertanyaan yang mengungkap perilaku spesifik yang diperoleh dari pengalaman hasil belajar. Tes yang direncanakan oleh guru, baik tes objektif maupun tes esai perlu tetap mengukur penilaian tujuan intruksional.
- Item-item pertanyaan tes esai sebaiknya jelas dan tidak menimbulkan kebingungan sehingga para siswa dapat menjawab dengan tidak ragu-ragu
- Sertakan petunjuk waktu pengerjaan untuk setiap pertanyaan, agar para siswa dapat memperhitungkan kecepatan berpikir, menulis dan menuangkan ide sesuai dengan waktu yang disediakan.
- Ketika mengonstruksi sejumlah pertanyaan esai, para guru hendaknya menghindari penggunaan pertanyaan pilihan. Pertanyaan pilihan biasanya terletak pada kalimat instruksi pengerjaan pada awal tes, misalnya “pilih empat soal dari lima pertanyaan yang tersedia”.
Menurut Sri Esti W.D (2004: 429) juga berpendapat bahwa
ada beberapa petunjuk atau saran untuk menyusun tes isian seperti di bawah ini:
- Kita hendaknya tidak mengutip kalimat atau pernyataan dalam buku teks atau buku catatan.
- Bagian yang kosong hendaknya hanya dapat diisi dengan satu jawaban yang benar
- Bagian yang dikosongkan terdiri dari satu kata kunci, atau kata pokok bukan sembarang kata
- Kalimat harus sederhana dan jelas sehingga lebih mudah dimengerti
- Bagian yang kosong ditaruh di akhir kalimat, misalnya menteri keuangan yang bertugas sekarang ialah
Tes Objektif
Merupakan tes yang cara pemeriksaannya dapat dilakukan
secara objektif yang dilakukan dengan cara mencocokkan kunci jawaban dengan
hasil jawaban tes. hal ini memungkinkan tes untuk menjawab banyak pertanyaan
dalam waktu yang relatif singkat.
Ada beberapa jenis tes objektif
1. Tes Objektif Pilihan Ganda
Item tes pilihan ganda merupakan jenis tes objektif yang
paling banyak digunakan oleh para guru. Tes ini dapat mengukur pengetahuan yang
luas dengan tingkat domain yang bervariasi. Item tes pilihan ganda memiliki
semua persyaratan sebagai tes yang baik, yakni dilihat dari segi ojektivitas,
reliabilitas, dan daya pembeda antara siswa yang berhasil dengan siswa yang
gagal (Sukardi, 2008).
2. Tes Objektif Benar-Salah
Item tes benar-salah dibedakan menjadi dua macam bentuk
yaitu, item tes bentuk regular atau tidak dimodifikasi dan item tes bentuk
modifikasi. Di bidang pendidikan umum maupun kejuruan, item tes benar salah
yang tidak dimodifikasi atau regular banyak digunakan oleh para guru. Salah
satu alasannya adalah bahwa item tes benar salah jenis regular dapat digunakan
dalam proses belajar mengajar sebagai tehnik untuk mengawali dimulainya
diskusi yang hangat, menarik dan bermakna. Item tes betul salah apabila dicermati
secara intensif , akan membawa peserta didik ke dalam diskusi isu-isu
pembelajaran yang bergeser sedikit menjadi problem solving (Sukardi,
2008).
3. Tes Objektif Menjodohkan
Item tes menjodohkan sering juga disebut matching test
item. Item tes menjodohkan ini juga termasuk dalam kelompok tes objektif.
Secara fisik , bentuk item tes menjodohkan, terdiri atas dua kolom yang
sejajar. Pada kolom pertama berisi pernyataan yang disebut daftar stimulus dan
kolom kedua berisi kata atau fakta yang disebut juga daftar respon atau jawaban
(Sukardi, 2008).
Teknik Pembuatan Tes
Ada dua macam
teknik yang dapat digunakan dalam melaksanakan evaluasi, yaitu teknik tes dan
teknik non tes. Teknik tes meliputi tes lisan, tes tertulis dan tes perbuatan.
Tes lisan dilakukan dalam bentuk pertanyaan lisan di kelas yang dilakukan pada
saat pembelajaran di kelas berlangsung atau di akhir pembelajaran. Tes tertulis
adalah tes yang dilakukan tertulis, baik pertanyaan maupun jawabannya.
Sedangkan tes perbuatan atau tes unjuk kerja adalah tes yang dilaksanakan
dengan jawaban menggunakan perbuatan atau tindakan.
Evaluasi dengan
menggunakan teknik tes bertujuan untuk mengetahui:
a. Tingkat kemampuan awal siswa
b. Hasil belajar siswa
c. Perkembangan prestasi siswa
d. Keberhasilan guru dalam melaksanakan kegiatan pembelajaran
a. Tingkat kemampuan awal siswa
b. Hasil belajar siswa
c. Perkembangan prestasi siswa
d. Keberhasilan guru dalam melaksanakan kegiatan pembelajaran
Tes lisan
dilakukan melalui pertanyaan lisan untuk mengetahui daya serap siswa. Tujuan
tes lisan ini terutama untuk menilai:
a. Kemampuan memecahkan masalah
b. Proses berpikir terutama melihat hubungan sebab akibat
c. Kemampuan menggunakan bahasa lisan
d. Kemampuan mempertanggungjawabkan pendapat atau konsep yang dikemukakan.
a. Kemampuan memecahkan masalah
b. Proses berpikir terutama melihat hubungan sebab akibat
c. Kemampuan menggunakan bahasa lisan
d. Kemampuan mempertanggungjawabkan pendapat atau konsep yang dikemukakan.
Tes tertulis dapat
berbentuk uraian (essay) atau soal bentuk obyektif (objective tes).
Tes uraian merupakan alat penilaian hasil belajar yang paling tua. Secara umum
tes uraian ini adalah pertanyaan yang menuntut siswa menjawab dalam bentuk
menguraikan, menjelaskan, mendiskusikan, membandingkan, memberikan alasan, dan
bentuk lain yang sejenis sesuai dengan tuntutan pertanyaan dengan menggunakan
kata-kata dan bahasa sendiri.
Cara-cara
penyusunan tes esai yang dimaksud:
a. Guru hendaknya
memfokuskan pertanyaan esai pada materi pembelajaran yang tidak dapat diungkap dengan bentuk tes lain misalnya tes objektif
b. Guru kendaknya
memformulasikan item pertanyaan yang mengungkap perilaku spesifik yang
diperoleh dari pengalaman hasil belajar.
a. Item-item
pertanyaan tes esai sebaiknya jelas dan tidak menimbulkan kebingungan sehingga
siswa dapat menjawabnya dengan tidak ragu-ragu
b. Sertakan petunjuk
waktu pengerjaan untuk setiap pertanyaan, agar para siswa dapat memperhitungkan
kecepatan berpikir, menulis dan menuangkan ide sesuai dengan waktu yang
disediakan.
c. Ketika mengontruksi
sejumlah pertanyaan esai, para guru hendaknya menghindari penggunaan pertanyaan
pilihan. Misalnya pilih empat soal dari lima pertanyaan yang tersedia.
1. Bentuk soal
benar-salah
Bentuk soal benar salah adalah bentuk tes yang soal-soalnya berupa pernyataan. Sebagian dari pernyataan itu merupakan pernyataan yang benar dan sebagian lagi merupakan pernyataan yang salah.
Kelebihan betul salah yaitu;
- Item tes betul salah memiliki karakteristik yang menguntungkan, yaitu mudah dan cepat dalam menilai
- Untuk item betul salah yang di konstruksi secara cermat, membawa implikasi kepada peserta didik, yaitu waktu mengerjakan soal lebih cepat diselesaikan
- Seperti bentuk tes objektif lainnya, item tes benar salah hasil akhir penilaian dapat objektif
Kelemahan betul
salah;
- Mengonstruksi item tes betul salah pada umumnya diperlukan waktu yang lebih lama jika dibandingkan dengan pembuatan tes esai
- Penggunaan pertanyaan alternatif lebih memungkinkan peserta didik mengira-ngira jawaban.
2.
Bentuk soal pilihan ganda atau pilihan jamak (multiple
choice)
Soal pilihan ganda
adalah bentuk tes yang mempunyai satu jawaban yang benar atau paling tepat.
Kelebihan bentuk
soal pilihan ganda yaitu:
- Tes pilihan ganda memiliki karakteristik yang baik untuk suatu alat pengukur hasil belajar siswa
- Item tes pilihan ganda yang di konstruksi dengan intensif dapat mencakup hampir seluruh bahan pembelajaran yang diberikan oleh guru di kelas.
- Item tes pilihan ganda adalah tepat untuk mengukur penguasaan informasi para siswa yang hendak dievaluasi.
Kelemahan bentuk
soal pilihan ganda yaitu;
- Mengonstruksi item tes betul salah pada umumnya diperlukan waktu yang lebih lama jika dibandingkan dengan pembuatan tes esai
- Penggunaan pertanyaan alternative lebih memungkinkan peserta didik mengira-ngira jawaban.
1.
Bentuk soal menjodohkan (matching)
Bentuk soal
menjodohkan terdiri atas dua kelompok pernyataan yang paralel. Kedua kelompok
pernyataan ini berada dalam satu kesatuan. Kelompok sebelah kiri merupakan
bagian yang berisi soal-soal yang harus dicari jawabannya.
Kelebihan bentuk soal menjodohkan
- Penilaiannya dapat dilakukan dengan cepat dan objektif.
- Tepat digunakan untuk mengukur kemampuan bagaimana mengidentifikasi antara dua hal yang berhubungan.
- Dapat mengukur ruang lingkup pokok bahasan atau sub pokok bahasan yang lebih luas.
Kelemahan bentuk soal menjodohkan
- Hanya dapat mengukur hal-hal yang didasarkan atas fakta dan hafalan
- Sukar untuk menentukan materi atau pokok bahasan yang mengukur hal-hal yang berhubungan
2.
Bentuk soal jawaban singkat (isian)
Bentuk soal
jawaban singkat merupakan soal yang menghendaki jawaban dalam bentuk kata,
bilangan, kalimat, atau simbol.
Kelebihan bentuk
soal jawaban singkat;
- Menyusun soalnya relatif mudah
- Kecil kemungkinan siswa memberi jawaban dengan cara menebak
- Menuntut siswa untuk dapat menjawab dengan singkat dan tepat
- Hasil penilaiannya cukup objektif
Kelemahan bentuk
soal jawaban singkat;
- Kurang dapat mengukur aspek pengetahuan yang lebih tinggi.
- Memerlukan waktu yang agak lama untuk menilainya sekalipun tidak selama bentuk uraian
- Menyulitkan pemeriksaan apabila jawaban siswa membingungkan pemeriksa.
-
A. Non Tesa. PengertianTehnik evaluasi nontes berarti melaksanakan penilaian dengan tidak menggunakan tes. Tehnik penilaian ini umumnya untuk menilai kepribadian anak secara menyeluruh meliputi sikap, tingkah laku, sifat, sikap sosial, ucapan, riwayat hidup dan lain-lain. Yang berhubungan dengan kegiatan belajar dalam pendidikan, baik secara individu maupun secara kelompok.Berikut adalah beberapa instrumen non-tes yang sering digunakan dalam evaluasi di bidang pendidikanb. Jenis-jenis Tehnik Non-TesBeberapa alat ukur yang hendak diuraikan pada bagian ini adalah observasi, angket, wawancara, daftar cek dan skala nilai/rating scale.1. ObservasiSecara garis besar terdapat dua rumusan tentang pengertian observasi, yaitu pengertian secara sempit dan luas. Dalam arti sempit, observasi berarti pengamatan secara langsung terhadap apa yang diteliti, Dalam arti luas observasi meliputi pengamatan yang dilakukan secara langsung mau pun tidak langsung terhadap objek yang diteliti (Susilo Rahardjo & Gudnanto, 2011).Menurut Susilo Surya dan Natawidjaja ( dalam Susilo Rahardjo & Gudnanto, 2011: 48-49) membedakan observasi menjadi observasi partisipatif, observasi sistematis, dan observasi experimental.2. AngketIgn Masidjo (1995: 70) menyatakan bahwa angket adalah suatu daftar pertanyaan tertulis yang terinci dan lengkap yang harus dijawab oleh responden tentang pribadinya atau hal-hal yang diketahuinya. Sedangkan Susilo Rahardjo & Gudnanto (2011: 92) berpendapat angket atau kuesioner adalah merupakan suatu tehnik atau cara memahami siswa dengan mengadakan komunikasi tertulis, yaitu dengan memberikan daftar pertanyaan yang harus dijawab atau dikerjakan oleh resonden secara tertulis juga.Pada pokoknya angket dibagi menjadi dua, berdasarkan cara menjawab pertanyaan dan bagaimana jawaban diberikan. Ditinjau dari cara menjawab pertanyaannya angket dapat dibagi dua. Yaitu angket terbuka dan tertutup (Ign. Masidjo, 1995). Sedangkan menurut Susilo Rahardjo & Gudnanto (2011: 95-97) dilihat dari bentuk pertanyaannya angket dibedakan menjadi tiga yaitu: angket terbuka, angket tertutup dan angket terbuka tertutup.
- Angket terbuka, ialah angket yang menggunakan pertanyaan-pertanyaan terbuka. Responden diberikan jawaban sebebas-bebasnya untuk menjawab pertanyaan-pertanyaan yang disediakan.
- Angket tertutup, ialah angket yang menggunakan pertanyaan-pertanyaan tertutup. Responden tinggal memilih jawaban-jawaban yang sudah disediakan.
- Angket terbuka dan tertutup, ialah angket yang pertanyaan-pertanyaan nya berupa gabungan dari pertanyaan terbuka dan tertutup, baik dalam suatu item, maupun dalam keseluruhan item. Pada umumnya angket ini banyak digunakan untuk kepentingan bimbingan dan konseling.
-
1. WawancaraKompetensi evaluasi lain yang juga perlu dimiliki oleh para guru sebagai evaluator di bidang pendidikan adalah penggunaan evaluasi non tes dengan menggunakan tehnik wawancara/interview. Mengenai apa yang dimaksud dengan wawancara dalam evaluasi non tes. Johnson and Johnson (dalam Sukardi, 2008: 187) menyatakan sebagai berikut: An interview is a personal interaction between interviewer (teacher) and one or more interviwees (students) in which verbal questions are asked. Wawancara adalah interaksi pribadi antara pewawancara (guru) dengan yang diwawancarai (siswa) di mana pertanyaan verbal diajukan kepada mereka.Dalam wawancara ada beberapa persyaratan penting yang perlu diperhatikan:
- Adanya interaksi atau tatap muka guru dengan siswa
- Adanya percakapan verbal di antara mereka dan memiliki tujuan tertentu
Dalam konteks evaluasi pendidikan, wawancara dapat dilakukan secara individual maupun secara berkelompok, di mana seorang guru bertatap muka dan melakukan tenya jawab terhadap siswanya. Di samping itu wawancara dapat dilakukan baik sebelum, selama dan sesudah proses belajar mengajar berlangsung (Sukardi, 2008).2. Daftar cekDaftar cek adalah sebuah daftar yang memuat sejumlah pernyataan singkat, tertulis tentang berbagai gejala yang dimaksudkan sebagai penolong pencatatan ada tidaknya sesuatu gejala dengan cara memberi tanda cek (V) pada setiao emunculan gejala yang dimaksud. Daftar cek bertujuan untuk mengetahui apakah gejala yang berupa pernyataan yang tercantum dalam daftar cek ada atau tidak ada pada seorang individu atau kelompok (Ign. Masidjo, 1995).3. Skala nilai/Rating scaleSkala rating merupakan alat ukur keterampilan yang masih juga tergolong alat ukur non tes. Seperti alat ukur daftar cek lis, alat ukur ini juga sudah lama digunakan di bidang evaluasi pendidikan. Pada umumnya, alat ukur rating terdiri atas dua bagian, yaitu:- Satu rangkaian karakteristik atau kualitas yang hendak dinilai
- Beberapa tipe skala ukur yang menunjukkan tingkat atau derajat atribut subjek atau objek yang ada (Crondlund & Linn, dalam Sukardi, 2008).
Skala rating bukan hanya sebuah daftar karakteristik , tetapi juga usaha evaluator dalam mendeskriosikan siswa atau responden dengan karakteristik multi tingkat (Sukardi, 2008).Teknik Pembuatan Non Tes
Teknik tes bukanlah satu-satunya teknik untuk melakukan evaluasi hasil belajar, sebab masih ada teknik lainnya yang dapat digunakan, yaitu teknik non tes. Dengan teknik non tes maka penilaian atau evaluasi hasil belajar peserta didik dilakukan dengan tanpa menguji peserta didik melainkan dilakukan melalui:1. Pengamatan atau observasi
Secara umum, pengertian observasi adalah cara menghimpun bahan-bahan keterangan yang dilakukan dengan mengadakan pengamatan dan pencatatan secara sistematis terhadap fenomena-fenomena yang sedang dijadikan sasaran pengamatan. Alat yang digunakan berupa lembar observasi yang disusun dalam bentuk check list atau skala penilaian.2. Wawancara
Secara umum yang dimaksud dengan wawancara adalah cara menghimpun bahan-bahan keterangan yang dilaksanakan dengan melakukan tanya jawab lisan secara sepihak. Alat yang digunakan adalah pedoman wawancara yang mengacu pada tujuan yang telah ditetapkan.3. Angket
Angket adalah wawancara yang dilakukan secara tertulis. Angket dapat digunakan sebagai alat penilaian hasil belajar. Angket dapat diberikan langsung kepada peserta didik, dapat pula diberikan kepada orang tua mereka.4. Skala
Skala adalah alat untuk mengukur nilai, sikap, minat, perhatian, dan lain-lain yang disusun dalam bentuk pernyataan untuk dinilai oleh responden dan hasilnya dalam bentuk rentangan nilai sesuai dengan kriteria yang ditentukan.
Kualitas alat evaluasi (Validitas, Reabilitas, Daya pembeda)Keberhasilan mengungkapkan hasil belajar dan proses belajar siswa sebagaimana adanya (objektivitas hasil penilaian)sangat bergantung pada kualitas alat penilainya di samping pada cara pelaksanaannya. Suatu alat evaluasi yang baik akan mencerminkan kemampuan sebenarnya dari tes yang dievaluasi dan bisa membedakan yang pandai (di atas rata-rata), dan siswa yang kemampuannya sedang(pada kelompok rata-rata), dan siswa yang kemampuannya kurang (di bawah rata-rata), sehingga penyebaran skor atau nilai evaluasi tersebut berdistribusi normal).a. Validitas
Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Tes yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes yang memiliki validitas rendah.
Validitas suatu instrumen selalu bergantung kepada situasi dan tujuan khusus penggunaan instrumen tersebut. Suatu tes yang valid untuk satu situasi mungkin tidak valid untuk situasi yang lain. Sebagai contoh : menilai kemampuan siswa dalam matematika dan diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak memahami pertanyaannya. Contoh lain adalah menilai kemampuan berbicara, tetapi ditanyakan tentang tata bahasa atau kesusastraan seperti puisi atau sajak. Penilaian tersebut tidak tepat (valid). Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan penilaian. Oleh sebab itu keabsahannya tergantung pada sejauh mana ketepatan alat evaluasi itu dalam melaksanakan fungsinya. Dengan demikian suatu alat evaluasi disebut valid jika ia dapat mengevaluasi dengan tepat sesuatu yang dievaluasi.b. ReabilitasReabilitas merupakan penerjemahan dari kata Reability yang mempunyai asal kata rely dan ability. Pengukuran yang memiliki reabilitas tinggi disebut sebagai pengukuran yang reliabel (reliable) walaupun reabilitas mempunyai berbagai nama lain seperti kepercayaan, keterandalan, kestabilan, konsistensi, dan sebagainya, namun ide pokok yang terkandung dalam konsep reabilitas adalah sejauh mana hasil suatu pengukuran dapat dipercaya.
Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif sama, selama aspek yang diukur dalam diri subjek memang belum berubah. Dalam hal ini, relatif yang dimaksudkan tidak tepat sama, tetapi mengalami perubahan yang tak berarti (tidak signifikan)dan bisa diabaikan.Perubahan hasil evaluasi ini disebabkan adanya unsur pengalaman dari peserta tes dan kondisi lainnya.
Dari uraian di atas dapat dipahami bahwa prinsip reabilitas akan menyangkut pertanyaan : “ seberapa jauhkah pengukuran yang dilakukan secara berulang kali terhadap subjek atau sekelompok subjek yang sama, memberikan hasil-hasil yang relatif tidak mengalami perubahan “. Bila hasil yang diperoleh selalu sama (setidak-tidaknya mendekati sama). Maka dapat dikatakan bahwa alat pengukur berupa tes tersebut telah memiliki reabilitas yang tinggi. Jadi perinsif reabilitas menghendaki adanya keakuratan dari hasil pengukuran yang berulang-ulang terhadap seorang subjek atau sekelompok subjek yang sama.Dengan catatan subjek-subjek yang diukur itu tidak mengalami perubahan.
Estimasi terhadap tingginya reabilitas dapat dilakukan melalui berbagai metode pendekatan. Masing-masing metode pendekatan dikembangkan sesuai dengan sifat dan fungsi alat ukur yang bersangkutan dengan mempertimbangkan dengan mempertimbangkan pula segi-segi praktisnya.Terdapat tiga macam pendekatan reabilitas yaitu :
1. Pendekatan tes ulang (test-retest)
Dalam pendekatan ini dilakukan dengan menyajikan tes dua kali pada satu kelompok subjek dengan tenggang waktu di antara kedua kajian tersebut. Asumsi yang menjadi dasar dalam cara ini adalah bahwa suatu tes yang reliabel tentu akan menghasilkan skor tampak yang relatif sama apabila dikenakan dua kali pada waktu yang berbeda. Semakin besar variasi perbedaan skor subjek antara kedua pengenaan itu berarti semakin sulit untuk mempercayai bahwa tes itu memberikan hasil ukur konsisten.
2. Pendekatan Bentuk Paralel (paralel-forms)
Tes bentuk paralel adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan tetapi butir-butir soalnya berbeda. Dengan bahasa sederhana dapat dikatakan bahwa kita harus punya dua tes yang kembar. Sebenarnya, dua tes yang paralel hanya ada secara teoritik, tidak benar-benar paralel secara empirik.
Pendekatan ini dilakukan dengan memberikan sekaligus dua bentuk tes yang paralel satu sama lain, kepada sekelompok subjek. Dalam pelaksanaannya, kedua tes paralel itu dapat digabungkan terlebih dahulu seakan-akan merupakan suatu bentuk tes semula dipisahkan kembali untuk diberi skor masing-masing, sehingga diperoleh dua distribusi skor.
3. Pendekatan Tes Tunggal
Pendekatan tes tunggal dalam estimasi reliabilitas dimaksudkan, antara lain, untuk menghindari masalah-masalah yang biasanya ditimbulkan oleh pendekatan tes ulang dan oleh pendekatan bentuk paralel. Dalam menggunakan pendekatan ini prosedurnya hanya memerlukan satu kali pengenaan sebuah tes pada sekelompok individu sebagai subjek (single trial administration). Oleh karena itu pendekatan ini mempunyai nilai praktis dan efisiensi yang tinggi. Dengan hanya satu kali tes pengenaan tes akan diperoleh satu distribusi skor tes dari kelompok subjek bersangkutan
Analisis data untuk pendekatan tes tunggal bisa dibagi ke dalam dua macam teknik, yaitu :Teknik Belah DuaDalam menentukan reabilitas suatu perangkat tes (evaluasi) dengan menggunakan teknik belah dua, dilakukan dengan jalan membelah alat evaluasi tersebut menjadi dua bagian yang sama (relatif sama), sehingga masing-masing tes memiliki dua macam skor. Salah satu syarat yang harus dipenuhi untuk teknik belah dua ini adalah jumlah soal dalam perangkat harus genap, supaya kedua bagian itu jumlah soalnya sama.
Teknik belah dua ini bisa dilakukan dengan dua cara, yaitu :
a. Pembelahan menurut nomor (soal) ganjil dan nomor genap atau disingkat Metode Ganjil Genap. Misalkan suatu perangkat tes terdiri dari 20 butir soal, maka kelompok belahan pertama terdiri dari skor-skor untuk nomor 1, 3, 5, 7, 9, 11, 13, 15, 17, dan 19 sedangkan untuk kelompok kedua terdiri dari 2, 4, 6, 8, 10, 12, 14, 16, 18, 20.b. Pembelahan menurut nomor urut yang disebut dengan metode awal akhir. Misal perangkat tes terdiri dari 20 butir soal, maka kelompok bahan pertama terdiri dari skor-skor untuk nomor 1 sampai dengan 10 dan kelompok belahan kedua terdiri dari skor-skor untuk nomor 11 sampai dengan 20.c. Daya PembedaYang dimaksud Daya Pembeda suatu soal tes ialah bagaimana kemampuan soal itu untuk membedakan siswa-siswa yang termasuk kelompok pandai (upper group) dengan siswa-siswa yang termasuk kelompok kurang (lower group). Daya pembeda suatu soal tes dapat dihitung dengan menggunakan rumus seperti berikut:DP=(WL-WH) / nKeterangan:DP : Daya Pembedan : Jumlah kelompok atas atau kelompok bawahWL : jumlah peserta didik yang menjawab salah dari kelompok bawahWH : jumlah peserta didik yang menjawab salah dari kelompok atasContoh:Untuk mendapatkan gambar yang lebih jelas mengenai langkah-langkah yang ditempuh dalam mencari Indeks kesukaran dan daya pembeda suatu item, di bawah ini akan dikemukakan sebuah contoh.
a. Kita misalkan murid yang mengikuti tes yang kita berikan adalah sebanyak 50 orang. Lembar jawaban murid-murid tersebut kita susun dari skor tertinggi paling atas sampai dengan skor rendah yang terbawah.b. Kita ambil 27% dari mereka yang mendapatkan skor tertinggi. Dalam hal ini, 27% x 50 orang sama dengan 13,5 orang kita bulatkan menjadi 14 orang. Begitu pula kita ambil 27% dari mereka yang mendapatkan skor yang terendah. Jumlahnya tentu sama dengan kelompok atas, yaitu 14 orang.c. Misalkan data yang diperoleh adalah sebagai berikut:· Untuk item no.1, dari kelompok bawah salah 9 orang dan dari kelompok atas salah 2 orang.· Untuk item no.2, dari kelompok bawah salah 8 orang dan dari kelompok atas salah 5 orang.· Untuk item no.3, dari kelompok bawah salah 14 orang dan dari kelompok atas salah 5 orang.· Untuk item no.4, dari kelompok bawah salah 6 orang dan dari kelompok atas tidak ada yang salah.· Untuk item no.5, dari kelompok bawah salah 13 orang dan dari kelompok atas salah 10 orang.· Untuk item no.6, dari kelompok bawah salah 2 orang dan dari kelompok atas salah 3 orang.d. Berdasarkan data tersebut, maka dapat dibuat tabel seperti di bawah ini.No.ItemWLWHWL + WHWL - WH123456981461322580113111323624573662-1
e. Berdasarkan tabel diatas, maka indeks kesukaran untuk masing-masing item dapat dicari sebagai berikut:· Untuk item no.1 · Untuk item no.6DP=7/14=0,5 DP=-1/14=-0,07· Untuk item no.2DP=3/14=0,21· Untuk item no.3DP=6/14=0,43· Untuk item no.4DP=6/14=0,43· Untuk item no.5DP=2/14=0,14Daya Pembeda yang ideal adalah daya pembeda 0,40 ke atas. Namun untuk ulangan-ulangan harian, masih dapat ditolerir daya pembeda sebesar 0,20. Item-item yang memenuhi syarat dapat kita simpan dan kita gunakan untuk keperluan evaluasi yang akan datang. Item-item yang tidak memenuhi syarat harus dibuang atau direvisi.
SEMOGA BERMANFAAT.
Langganan:
Postingan (Atom)