Sugeng Rawuh Teng Blog Kula "Dinazad"

Sabtu, 16 Mei 2015

Pengembangan Sistem Evaluasi Pendidikan



MAKALAH
ANALISIS BUTIR SOAL TES

Dosen Pengampu :  Rahmad Kamal, M.Pd.I


Description: Description: 3--STIT black-RALAT

Makalah ini disusun untuk memenuhi tugas Mata Kuliah
Pengembangan Sistem Evaluasi Pendidikan di STIT Pemalang
Tahun Akademik 2014/2015

Disusun Oleh :
1.     Septian Khusnul K.     3120011
2.     Dinazad                         3120040
3.     S. Maulana M.              3120064



PROGRAM STUDI PENDIDIKAN AGAMA ISLAM
SEKOLAH TINGGI ILMU TARBIYAH (STIT) PEMALANG
TAHUN 2014/2015
BAB I
PENDAHULUAN

A.    Latar Belakang
Cara untuk memperbaiki proses belajar-mengajar yang paling efektif ialah dengan jalan mengevaluasi tes  hasil belajar yang diperoleh dari proses belajar-mengajar itu sendiri. Dengan kata lain, hasil tes itu diolah sedemikian rupa sehingga dari hasil pengolahan itu dapat diketahui komponen-komponen manakah dari proses mengajar itu yang masih lemah.
Pada dasarnya tujuan umum penyusunan tes adalah untuk memperoleh tes dengan jumlah item minimum, namun dapat menghasilkan skor pengukuran dengan tingkat reliabilitas dan validitas yang tinggi. Oleh karena itu, setelah item ditulis sesuai dengan kaidah penulisan tes yang baik dan sesuai dengan kisi-kisi yang direncanakan, yang secara teoritik tes tersebut sudah baik. Sehingga, perlu untuk dilakukan pengujian empirik. Pengujian item tes secara empirik inilah yang disebut sebagai analisis item tes.[1]
Pengolahan tes hasil belajar dalam rangka memperoleh proses belajar mengajar dapat dilakukan dengan berbagai cara, antara lain:
1.      Dengan membuat analisis soal (item analysis)
2.      Dengan menghitung validitas dan keandalan tes
Dalam makalah ini khusus akan dibicarakan cara yang pertama yaitu teknik analisis soal atau item analisis. Analisis soal (item analysis) berkaitan dengan proses mengumpulkan, meringkas, dan menggunakan informasi tentang tiap butir soal tes, terutama informasi tentang jawaban siswa terhadap butir soal tersebut. Kegiatan analisis butir soal merupakan kegiatan penting dalam penyusunan soal agar diperoleh butir soal yang bermutu.Tujuan kegiatan ini adalah mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum digunakan, meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif, serta mengetahui informasi diagnostik  pada siswa apakah mereka telah memahami materi yang telah diajarkan. Soal yang bermutu adalah soal dapat memberikan informasi setepat-tepatnya tentang siswa mana yang telah menguasai meteri dan siswa yang belum menguasai materi.
Analisis soal untuk tes standar berbeda dengan analisis soal untuk tes buatan guru. Yang lebih diperlukan di kelas adalah analisis soal untuk tes buatan guru. Dengan pengertian demikian, maka yang perlu diketahui mengenai kualitas soal dengan analisis itu adalah tingkat kesukarannya, daya pembedanya dan fungsi distraktornya.
Jadi tujuan khusus dari items analisis ialah mencari soal tes mana yang baik dan mana yang tidak baik, dengan membuat analisis soal, sedikitnya dapat mengetahui dari tiga segi  yang dapat diperoleh dari tiap soal, yaitu: a) dari segi derajat kesukaran itemnya; b) dari segi daya pembeda itemnya; c) dari segi fungsi distraktornya.[2]

B.     Rumusan Masalah
Berdasarkan latar belakang masalah di atas, dapat dirumuskan sebagai beikut:
1.      Bagaimana teknik analisis soal tes (Item Analysis) ?
2.      Bagaimana teknik analisis derajat kesukaran item ?
3.      Bagaimana teknik analisis daya pembeda item ?
4.      Bagaimana teknik analisis fungsi distraktor ?



BAB II
PEMBAHASAN

A.    Analisis Butir Soal
Menurut Nitko yang dikutip oleh Wahidmurni, dkk., kegiatan analisis butir soal merupakan proses pengumpulan, peringkasan, dan penggunaan informasi dari jawaban peserta didik untuk membuat keputusan tentang setiap penilaian. Tujuan dilakukannya analisis butir soal adalah untuk mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum digunakan,  meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif, mengetahui informasi diagnostik pada siswa apakah mereka telah memahami materi yang telah diajarkan.[3]
Pada analisis butir, butir akan dilihat karakteristiknya  dan dipilih butir-butir yang baik. butir yang baik adalah butir-butir yang karakteristiknya  memenuhi syarat sebagaimana kriteria  karakteristik butir yang baik.[4]
Berdasarkan pendapat yang diungkapkan oleh Anastasia dan Urbina dalam Wahidmurni, dkk., tujuan utama analisis butir soal yang dibuat oleh pendidik adalah untuk mengidentifikasi kekurangan-kekurangan dalam tes atau dalam pembelajaan. Manfaat dilakukannya analisis butir soal diantaranya yakni:
1.      Membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan,
2.      Relevan bagi penyusunan tes informal dan lokal seperti tes yang disiapkan penidik untuk peserta didik di kelas,
3.      Mendukung penulisan butir soal yang efektif,
4.      Secara materi dapat memperbaiki tes di kelas,
5.      Meningkatkan validitas soal dan reliabilitas.[5]
Linn dan Gronlund dalam Wahidmurni, dkk., menambahkan bahwa data hasil analisis butir soal juga sangat bermanfaat sebagai dasar untuk:
1.      Diskusi tentang efisien hasil tes,
2.      Untuk kerja remedial,
3.      Peningkatan secara umum pembelajaran di kelas,
4.      Peningkatan keterampilan pada kontruksi tes.
Berdasarkan uraian di atas menunjukkan bahwa analisis butir soal adalah:[6]
1.      Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik,
2.      Meningkatkan butir soal melalui tiga komponen analisis yaitu, tingkat kesukaran, daya pembeda dan pengecoh soal,
3.      Merevisi soal yang tidak relevan degan materi yang diajarkan, ditandai dengan banyaknya anak yang tidak dapat menjawab butir soal tertentu.

B.     Teknik Penganalisisan Item Tes Hasil Belajar
Penganalisisan terhadap butir-butir item tes hasil belajar dapat dilakukan dari tiga segi, yaitu : 1) dari segi derajat kesukaran itemnya, 2) dari segi daya pembeda itemnya, 3) dari segi fungsi distraktornya.
1.      Teknik Analisis Derajat Kesukaran Item
Bermutu atau tidaknya butir-butir item tes hasil belajar pertama-tama dapat dilihat dari derajat kesukaran atau taraf kesulitan yang dimiliki masing-masing butir item.  Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.
Bertitik tolak dari pernyataan tersebut di atas maka butir-butir item hasil belajar di mana seluruh testee tidak dapat menjawab dengan betul (karena terlalu sukar) tidak dapat disebut sebagai item yang baik. Demikian pula sebaliknya, butir-butir item tes hasil belajar dimana seluruh testee dapat menjawab dengan betul (karena terlalu mudah) juga tidak dapat dimasukkan dalam kategori item yang baik.[7]
Seorang siswa akan menjadi hafal akan kebiasaan guru-gurunya dalam hal pembuatan soal ini. Misalnya saja guru A dalam memberikan ulangan soalnya mudah, sebaliknya guru B kalau memberikan ulangan soalnya sukar-sukar. Dengan pengetahuannya tentang kebiasaan ini, maka siswa akan belajar  giat jika menghadapi ulangan dari guru B dan sebaliknya jika akan mendapat ulangan dari guru A, tidak mau belajar giat atau bahkan mungkin tidak mau belajar sama sekali.
Bilangan yang menunjukan sukar dan mudahnya sesuatu soal disebut difficulty index (= angka indek kesukaran item), yang umumnya dilambangkan dengan huruf P (proportion = proporsi). Besarnya indeks kesukaran antara 0,00-1,0. Indeks kesukaran ini menunjukan taraf kesukaran soal. Soal dengan indeks kesukaran 0,0 menunjukan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukan bahwa soalnya terlalu mudah.[8]
                          0,0  ______________________ 1,0
                         sukar                                      mudah
Dengan demikian maka soal dengan P = 0,70 lebih mudah jika dibandingkan dengan P = 0,20. Sebaliknya soal dengan P = 0,30 lebih sukar dari pada soal dengan P = 0,80.
Mengenai bagaimana cara menberikan penafsiran terhadap angka kesukaran item, Robert L. Thorndike dan Elizabert Hegen dalam bukunya berjudul Measurement and Evaluation in Psychology and Education mengemukakan sebagai berikut:[9]
Besarnya P
Interpelasi
Kurang dari 0,30
Terlalu sulit
0,300-0,70
Cukup (sedang)
Lebih dari 0,70
Terlalu mudah

Sedangkan menurut Witherington  dalam bukunya yang berjudul Psyichological Education adalaha sebagai berikut:[10]

Besarnya P
Interpelasi
Kurang dari 0,25
Terlalu sulit
0,25-0,75
Cukup (sedang)
Lebih dari 0,75
Terlalu mudah

Angka indeks kesukaran item itu dapat diperoleh dengan menggunakan rumus :
Rumus 1 :
Keterangan :
P     =  indeks kesukaran
B    =  banyaknya siswa yang menjawab soal itu dengan benar
JS   =  jumlah seluruh siswa peserta tes.[11]
Contoh:
Jumlah siswa peserta tes dalam suatu kelas ada 40 siswa. Dari 40 siswa tersebut terdapat 12 siswa yang mampu mengerjakan soal nomor 1 dengan benar. Maka berapa indeks kesukarannya?
Jawab:
.
    =    =  0,30


Rumus 2 :
Keterangan:
TK  =   taraf kesukaran
U    =   jumlah siswa yang termasuk kelompok pandai (upper group) yang menjawab benar untuk tiap soal.
L     =   jumlah siswa yang termasuk kurang (lower group) yang menjawab benar untuk tiap soal.
T     =   jumlah siswa dari kelompok pandai dan kelompok kurang (jumlah upper group dan lower group)
Misalkan suatu tes yang terdiri atas N soal yang diberikan kepada 40 siswa. Dari hasil tes tersebut, tiap-tiap soal dianalisis taraf kesukarannya. mula-mula hasil tes itu kita susun kedalam peringkat, kemudian kita ambil 25% (10 lembar jawaban siswa kelompok pandai), dan 10 lembar jawaban siswa dari kelompok yang kurang pandai. Kemudian kita tabulasikan. Misalkan dari tabulasi soal nomor 1 kita peroleh hasil sebagai berikut: yang menjawab benar dari kelompok pandai ada 9 siswa, dan yang menjawab benar dari kelompok kurang pandai ada 4 siswa. Dengan menggunakan rumus diatas, maka taraf kesukaran atau TK dari soal nomor 1 adalah:
. =   =  0,65 atau 65% 
Jadi dapat disimpilkan bahwa nilai dari TK atau tingkat kesukarannya adalah 65%.[12]
Contoh lainnya :[13]
Misalkan sebanyak 10 orang testee mengikuti tes hasil belajar tahap akhir dalam mata pelajaran Aqidah-Akhlaq yang dituangkan dalam bentuk soal tes obyektif dengan menyajikan 10 butir item (soal), dengan soal yang dapat dijawab benar diberi bobot 1 dan untuk jawaban salah diberi bobot 0. Setelah tes selesai, dilakukan koreksi dan diberikan skor yang menghasilkan pola penyebarab jawaban sebagai berikut.
Tabel Penyebaran Skor Jawaban 10 Testee Terhadap 10 Butir Item Dalam Tes Hasil Belajar Mata Pelajaran Aqidah-Akhlaq
Testee
Skor Pada Soal Nomor
1
2
3
4
5
6
7
8
9
10
A
0
1
1
0
1
0
1
1
1
0
B
1
0
1
1
1
1
0
0
0
1
C
1
0
0
0
0
0
1
1
1
0
D
0
0
1
1
1
0
1
0
1
1
E
1
0
1
0
1
1
1
0
1
0
F
0
0
1
1
0
0
1
1
1
1
G
1
0
1
0
0
0
0
0
0
1
H
0
0
1
1
0
0
1
0
1
1
I
1
0
0
0
1
0
1
0
1
1
J
1
1
1
1
1
0
1
0
1
1
Jumlah jawaban benar
6
2
8
5
6
2
8
3
8
7

Tabel Perhitungan Indeks Kesukaran Item  Hasil Jawaban 10 Testee Terhadap 10 Butir Item Dalam Tes Hasil Belajar Mata Pelajaran Aqidah-Akhlaq
No Soal
Indeks Kesukaran Item (P)
Interpretasi
1
P =  =  = 0,60
Sedang
2
P = = 0,20
Terlalu sukar
3
P =  = 0,80
Terlalu mudah
4
P = = 0,50
Sedang
5
P =  = 0,60
Sedang
6
P =  = 0,20
Terlalu sukar
7
P =  = 0,80
Terlalu mudah
8
P =  = 0,30
Sedang
9
P = = 0,80
Terlalu mudah
10
P =  = 0,70
Sedang

Dari hasil analisis yang dilakukan terhadap 10 butir item tes hasil belajar tersebut dapat diketahui terdapat 5 soal dalam kategori baik (sedang atau tidak terlalu sukar), 2 soal dalam kategori terlalu sukar, dan 3 soal dalam kategori terlalu mudah. Dengan hasil analisis tersebut, maka tindak lanjut yang dapat dilakukan oleh tester adalah :[14]
a.       Untuk butir soal yang termasuk dalam kategori baik segera dicatat dan disimpan dalam bank soal dan dapat digunakan kembali sewaktu-waktu untuk tes berikutnya.
b.      Untuk butir soal yang dalam kategori terlalu sukar ada kemungkinan 3 hal yang bisa dilakukan yakni butir soal tersebut dibuang (tidak akan dikeluarkan lagi saat tes selanjutnya), diteliti ulang dan ditelusuri faktor yang menyebabkan soal tersebut sukar dikerjakan oleh testee dan setelah dilakukan perbaikan dapat dikeluarkan lagi pada tes selanjutnya, dapat digunakan dalam tes-tes yang membutuhkan seleksi ketat.
c.       Untuk butir soal yang dalam kategori terlalu mudah ada kemungkinan 3 hal yang bisa dilakukan yakni butir soal tersebut dibuang (tidak akan dikeluarkan lagi saat tes selanjutnya), diteliti ulang dan ditelusuri faktor yang menyebabkan soal tersebut sangat mudah dikerjakan oleh testee dan setelah dilakukan perbaikan dapat dikeluarkan lagi pada tes selanjutnya, dapat digunakan dalam tes-tes yang membutuhkan seleksi yang lebih longgar.
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut:
a.       Soal dengan P 0,00 sampai < 0,30 adalah soal sukar
b.      Soal dengan P 0,30 sampai 0,70 adalah soal sedang
c.       Soal dengan P > 0,70 sampai 1,00 adalah soal mudah.[15]
Kegunaan tingkat kesukaran butir soal bagi pendidik adalah : 1) sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi masukan kepada peserta didik tentang hasil belajar mereka, 2) memperoleh informasi tentang penekanan kurikulum atau mencurigai terhadap butir soal yang bias. Adapun keggunaan bagi penguji dan pengajaran adalah ; a) pengenalan konsep yang diperlukan untuk diajarkan ulang, b) mengetahui kelamahan dan kelebihan kurikulum sekolah, c) memberi masukan kepada peserta didik, d) adanya soal-soal yang bias, dan e) membuat tes yang memiliki ketepatan data soal.[16]

2.      Teknik Analisis Daya Pembeda Item
Menurut Suharsimi, daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara peserta didik yang pandai  (berkemampuan tinggi) dengan peserta didik yang bodoh (berkemampuan rendah).[17]
Mengetahui daya pembeda item itu penting sekali, sebab salah satu dasar yang dipegang untuk menyusun butir-butir item tes hasil belajar adalah adanya anggapan, bahwa kemampuan antara siswa yang satu dengan siswa yang lain itu berbeda-beda, dan bahwa butir-butir tes hasil belajar itu haruslah mampu memberikan hasil tes yang mencerminkan adanya perbedaan-perbedaan kemampuan yang terdapat di kalangan peserta didik tersebut.
Manfaat daya pembeda butir soal adalah sebagai berikut :[18]
a.       Untuk meningkatkan mutu setiap butir soal melalui data empiriknya.
b.      Untuk mengetahui seberapa jauh setiap butir soal dapat membedakan kemampuan peserta didik.
Angka yang menunjukan besarnya daya pembeda item disebut indeks diskriminasi item. Angka indek diskriminasi item adalah sebuah angka atau bilangan yang menunjukkan besar kecilnya daya pembeda (discriminatory power) yang dimiliki oleh sebutir item, yang diberi lambang huruf D. Seperti halnya indeks kesukaran, indeks diskriminasi ini berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi ada tanda negatif yaitu digunakan jika sesuatu soal “terbalik” menunjukan kualitas testee. Yaitu anak pandai disebut bodoh dan anak bodoh disebut pandai.
Jika sebutir item angka indeks D = 0,00 (nihil), maka hal ini menunjukkan bahwa butir item yang bersangkutan tidak memiliki daya pembeda sama sekali, yang berarti bahwa jumlah testee kelompok atas yang menjawab benar (atau salah) sama dengan jumlah testee kelompok atas yang menjawab dengan benar. Jadi di antara kedua kelompok testee tersebut tidak ada perbedaannya sama sekali atau perbedaannya = 0. Apabila angka indeks diskriminasi item dan sebutir item bertanda negatif (-), maka butir item lebih banyak dijawab benar oleh testee kelompok bawah dari pada oleh kelompok atas, atau testee yang sebenarnya termasuk dalam kategori pandai lebih banyak menjawab salah sedangkan testee yang sebenarnya dalam kategori kurang panda lebih banyak yang menjawab dengan benar.[19]
Dengan demikian ada tiga titik pada daya pembeda yaitu:[20]
                  -1,00                            0,0                           1,00
            daya pembeda                daya pembeda                 daya pembeda  
     negatif                            rendah                            tinggi
Bagi soal yang dapat dijawab benar oleh peserta didik pandai maupun bodoh, maka soal itu tidak baik karena tidak ada daya pembeda. Demikian pula jika semua peserta didik baik pandai maupun bodoh tidak dapat menjawab dengan benar. Soal tersebut tidak mempunyai daya pembeda. Soal yang baik adalah soal yang dapat dijawab benar oleh siswa yang pandai-pandai saja.
Untuk mengetahui indeks manakah yang dapat menyatakan bahwa sebutir soal dapat dikatakan sebagai butir soal yang memiliki daya pembeda yang baik, menurut Sudijono (1996) dapat digunakan patokan sebagai berikut :[21]

Indeks Diskriminasi Item (D)
Klasifikasi
Interpretasi
< 0,20
Poor
Butir soal memiliki daya pembeda lemah (tidak memiliki daya pembeda yang baik)
0,20 – 0,40
Satisfactory
Butir soal memiliki daya pembeda cukup (sedang)
0,40 – 0,70
Good
Butir soal memiliki daya pembeda yang baik
0,70 – 1,00
Excellent
Butir soal memiliki daya pembeda sangat baik
Bertanda negatif (-)
-
Buti soal tidak memiliki daya pembeda

Untuk menghitung indeks pembeda pengikut tes dikelompokkan yaitu: kelompok pandai atau kelompok atas (upper group) dan kelompok bodoh atau kelompok bawah (lower group).
Jika seluruh kelompok atas dapat menjawab soal tersebut dengan benar, sedang seluruh kelompok bawah menjawab salah, maka soal tersebut mempunyai D paling besar yaitu 1,00. Sebaliknya jika semua kelompok atas menjawab salah,  tetapi kelompok bawah menjawab betul, maka nilai D-nya -1,00. Tetapi jika kelompok atas dan kelompok bawah sama-sama menjawab benar atau salah, maka soal tersebut mempunyai nilai D 0,00. Karena tidak mempunyai daya pembeda sama sekali.
Cara menentukan daya pembeda (nilai D) berbeda antara kelompok kecil (kurang dari 100 orang) dengan kelompok besar (100 orang ke atas).
a.       Untuk kelompok kecil
Seluruh kelompok testee dibagi dua sama besar, 50% kelompok atas dan 50% kelompok bawah.
Contoh :
Siswa
A
B
C
D
E
Skor
9
8
7
7
6



Kelompok atas (JA)

F
G
H
I
J

5
5
4
4
3



Kelompok bawah (JB)

Seluruh pengikut tes, dideretkan mulai dari skor teratas sampai terbawah, lalu dibagi 2.[22]

b.      Untuk kelompok besar
Mengingat biaya dan waktu untuk menganalisis, maka untuk kelompok besar biasanya hanya diambil kedua kubuhnya saja, yaitu 27% skor teratas sebagai kelompok atas (JA) dan 27% skor terbawah sebagai kelompok bawah (JB).
JA   =  jumlah kelompok atas
JB   =  jumlah kelompok bawah
Contoh :
9
9
8
8
8
.
.
.
--
.
.
.
--
.
.
.
2
1
1
1
0




27% sebagai JA











27% sebagai JB

Rumus untuk menentukan indeks diskriminasi (D) :[23]
Keterangan :
J                =  jumlah peserta tes
JA               = banyaknya peserta kelompok atas
JB               =  banyaknya peserta kelompok bawah
BA             =  banyaknya peserta kelompok atas yang menjawab soal itu dngan benar
BB          =  banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar
PA           =  proporsi peserta kelompok atas yang menjawab benar (ingat, P sebagai indeks kesukaran)
PB              =  proporsi peserta kelompok bawah yang menjawab benar.
Contoh perhitungan :[24]
Dari hasil analisis tes yang terdiri dari 10 butir soal yang dikerjakan oleh 20 orang siswa, terdapat dalam tabel sebagai berikut :
Siswa
Kelom-pok
Nilai Soal
Skor Siswa
1
2
3
4
5
6
7
8
9
10
A
B
1
0
1
0
0
0
1
1
1
0
5
B
A
0
1
1
1
1
1
0
0
1
1
7
C
A
1
0
1
0
1
1
1
1
1
1
8
D
B
0
0
1
0
0
1
1
1
1
0
5
E
A
1
1
1
1
1
1
1
1
1
1
10
F
B
1
1
0
0
0
1
1
1
1
0
6
G
B
0
1
0
0
0
1
1
1
1
1
6
H
B
0
1
1
0
0
1
0
1
1
1
6
I
A
1
1
1
0
0
1
1
1
1
1
8
J
A
1
1
1
1

0
1
0
1
1
7
K
A
1
1
1
0
0
1
1
1
1
0
7
L
B
0
1
0
1
1
0
0
1
1
0
5
M
B
0
1
0
0
0
0
0
1
1
0
3
N
A
0
0
1
0
1
1
1
1
1
1
7
O
A
1
1
0
1
1
1
1
1
1
1
9
P
B
0
1
0
0
0
1
0
0
1
0
3
Q
A
1
1
0
1
0
1
1
1
1
1
8
R
A
1
1
1
1
0
1
1
1
1
0
8
S
B
1
0
1
0
0
1
1
1
1
0
6
T
B
0
1
0
1
0
1
1
1
1
0
6
Jumlah
11
15
12
8
6
16
15
17
20
10

Berdasarkan nama-nama siswa dapat kita peroleh skor-skor sebagai berikut :
A =   5            F =   6            K =   7            P =   3
B =   7                 G =            6                      L =   5              Q         =          8
C =   8            H =   6            M      =            3           R         =          8
D =   5            I   =   8                 N =            7       S =          6
E =   10          J   =   7                 O =            9           T          =          6
Dari angka yang belum teratur tersebut kemudian dibuat urutan penyebaran, dari skor yang paling tinggi ke skor yang paling rendah.
Kelompok Atas
10
9
8
8
8
8
7
7
7
7
Kelompok Bawah
6
6
6
6
6
5
5
5
3
3
10 orang
10 orang

Uraian  ini menunjukkan adanya kelompok atas ( JA) dan kelompok bawah ( JB
) dengan pemiliknya sebagai berikut :
Kelompok Atas (JA)
B  =  7
C  =  8
E  = 10
I  =  8
J  =  7
K  =  7
N  =  7
O  =  9
Q  =  8
R  =  8
Kelompok Bawah (JB)
A  =  5
D  =  5
F  =  6
G  =  6
H  =  6
L  =  5
M  =  3
P  =  3
S  =  6
T  =  6
10 orang
10 orang

Pada uraian di atas dapat ditunjukkan kelompok A dan B. Dan hal ini mempermudah menentukan BA dan BB. Dimana
BA = Banyaknya siswa yang menjawab benar pada kelompok atas A dan
BB = banyaknya siswa yang menjawab benar pada kelompok bawah B
Seperti yang diketahui, soal yang baik adalah soal yang dapat membedakan antara anak berkemampuan tinggi dengan anak berkemampuan rendah, dilihat dari dapat atau tidaknya ia mengerjakan soal tes.
Perhatikan tabel analisis khusus untuk butir soal nomor 1.
-          Dari kelompok atas yang menjawab betul 8 orang
-          Dan kelompok bawah yang menjawab betul 3 orang
Menerapkan pada rumus :
JA     =     10                                       JB    =     10
                            PA    =     0,8                                      PB    =     0,3
BA   =     8                                         BB   =     3           
Maka D      =   PA – PB
                         =   0,8 – 0,3
                   =   0,5
Dengan demikian maka indeks diskriminasi untuk soal nomor 1 adalah 0,5.
Sekarang memperhatikan butir soal nomor 8 :
JA     =     10                                       JB    =     10
                            PA    =     0,8                                      PB    =     0,9
BA   =     8                                         BB   =     9           
Maka D      =   PA – PB
                         =   0,8 – 0,9
                   =   - 0,1
Butir soal ini jelek karena lebih banyak dijawab benar oleh kelompok bahwa dibandingkan dengan jawaban benar dari kelompok atas. Ini berarti bahwa untuk menjawab soal dengan benar, dapat dilakukan dengan menebak.
Butir-butir soal yang baik adalah butir-butir soal yang mempunyai indeks diskriminasi 0,4 sampai 0,7.
Dalam Sudijono diberikan contoh sebagai berikut :[25]
Misalkan 10 orang testee mengikuti tes hasil belajar dalam bidang studi Bahasa Arab dalam bentuk multiple choice item sebanyak 10 soal. Dengan soal yang dapat dijawab benar diberi bobot 1 dan untuk jawaban salah diberi bobot 0.
Langkah-langkah yang dikerjakan adalah sebagai berikut :
a.       Mengelompokkan testee menjadi 2 kelompok yaitu kelompok atas (pandai) dan kelompok bawah kurang pandai
Testee
Skor Pada Soal Nomor
Total
1
2
3
4
5
6
7
8
9
10
A
0
1
0
1
0
1
0
1
0
1
5
B
1
1
1
1
1
1
1
1
1
1
10
C
1
1
0
0
0
1
1
1
1
1
7
D
1
1
0
1
0
0
0
0
0
0
3
E
0
1
1
1
1
1
0
1
1
0
7
F
0
1
0
1
1
0
1
0
0
0
4
G
0
1
0
1
0
1
1
1
1
1
7
H
1
1
0
1
1
1
1
1
1
1
9
I
0
1
0
0
1
1
0
0
1
0
4
J
1
0
0
1
1
1
0
0
0
1
5
N = 10
5
9
2
8
6
8
5
6
6
6
61

Mengelompokkan dalam kelas atas dan bawah
Tabel Kelompok Atas
Tabel Kelompok Bawah
Testee
Skor
Testee
Skor
B
10
A
5
H
9
I
5
C
7
J
4
G
7
F
4
E
7
D
3
JA = 5
-
JB = 5
-

b.      Menuliskan atau memberi kode-kode terhadap hasil pengelompokan testee
Testee
Skor Pada Soal Nomor
Total
Kelom-pok
1
2
3
4
5
6
7
8
9
10
A
0
1
0
1
0
1
0
1
0
1
5
Bawah
B
1
1
1
1
1
1
1
1
1
1
10
Atas
C
1
1
0
0
0
1
1
1
1
1
7
Atas
D
1
1
0
1
0
0
0
0
0
0
3
Bawah
E
0
1
1
1
1
1
0
1
1
0
7
Atas
F
0
1
0
1
1
0
1
0
0
0
4
Bawah
G
0
1
0
1
0
1
1
1
1
1
7
Atas
H
1
1
0
1
1
1
1
1
1
1
9
Atas
I
0
1
0
0
1
1
0
0
1
0
4
Bawah
J
1
0
0
1
1
1
0
0
0
1
5
Bawah
N = 10
5
9
2
8
6
8
5
6
6
6
61


c.       Menghitung  BA, BB, PA, PB, dan D untuk 10 butir soal
Nomor Soal
BA
BB
JA
JB
PA =
PB =
D = PA PB
1
3
2
5
5
0,60
0,40
0,20
2
5
4
5
5
1,00
0,80
0,20
3
2
0
5
5
0,40
0,00
0,40
4
4
4
5
5
0,80
0,80
0,00
5
3
3
5
5
0,60
0,60
0,00
6
5
3
5
5
1,00
0,60
0,40
7
4
1
5
5
0,80
0,20
0,60
8
5
1
5
5
1,00
0,20
0,80
9
5
1
5
5
1,00
0,20
0,80
10
4
2
5
5
0,80
0,40
0,40

d.      Memberikan Penafsiran (Interpretasi) Mengenai Kulitas Daya Pembeda Item Yang Dimiliki Oleh 10 Soal
Nomor Butir Soal
Besar D
Klasifikasi
Interpretasi
8 dan 9
0,80
Excellent
Daya pembeda sangat baik
7
0,60
Good
Daya pembda baik
3,6 dan 10
0,40
Satisfactory
Daya pembeda cukup
1 dan 2
0,20
Poor
Daya pembeda lemah
4 dan 5
0,00
-
Tidak memiliki daya  pembeda

Dari hasil analisis tersebut maka dapat disimpulkan bahwa 60%  (6 butir) dari 10 butir soal bahasa arab yang diajukan dalam tes tersebut sudah memiliki daya pembeda yang baik, sedangkan 40% (4 butir) masih tergolong belum memiliki daya pembeda seperti yang diharapkan.

3.      Teknik Analisis Fungsi Distraktor
Pada saat membicarakan tentang tes obyektif bentuk pilihan ganda, item telah dikemukakan bahwa pada tes obyektif tesebut telah dilengkapi dengan beberapa kemungkinan jawaban  atau yang dikenal dengan alternatif. Altenatif jawaban itu jumlahnya berkisar antara 3- 5 buah, dan dari kemungkinan jawaban yang terpasang pada setiap butir item terpasang sebuah jawaban dan sisanya sebagai pengecoh (disrtactor).[26]
Distraktor adalah pengecoh, jawaban-jawaban yang mengecoh. Yang disebut dengan distraktor atau pengecoh adalah opsi-opsi yang bukan merupakan kunci jawaban. Ini bertujuan menarik untuk menjawabnya padahal itu salah. Sebagai tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut maka distraktor yang sudah menjalankan fungsinya dengan baik dapat dipakai lagi pada tesnya.
Tujuan utama dari pemasangan distraktor pada setiap butir item itu adalah, agar dari sekian banyak testee yang mengikuti tes hasil belajar ada yang tertarik untuk memilihnya, sebab mereka menyangka bahwa distraktor yang mereka pilih itu merupakan jawaban betul. Jadi mereka terkecoh, menganggap bahwa distraktor yang terpasang pada item itu sebagai kunci jawaban item, padahal bukan. Dengan kata lain, distraktor baru dapat dikatakan telah dapat menjalankan fungsinya dengan baik, apabila distraktor tersebut telah memiliki daya tarik demikian rupa, sehingga para testee (khususnya yang termasuk kategori kemampuan rendah) merasa bimbang, dan ragu-ragu sehingga pada akhirnya mereka menjadi terkecoh untuk memilih distraktor sebagai jawaban betul, sebab mereka mengira bahwa yang mereka pilih itu kunci jawaban item, padahal bukan.
Pengecoh dikatakan berfungsi efektif apabila paling tidak ada siswa yang terkecoh memilih. Pengecoh yang sama sekali tidak dipilih berarti tidak dapat melakukan fungsinya.[27]
Suatu kemungkinan dapat terjadi, yaitu bahwa dari keseluruhan alternatif yang dipasang pada butir item tertentu, sama sekali tidak dipilih oleh testee. Dengan kata lain, testee menyatakan “blangko”. Pernyataan blangko ini sering dikenal dengan istilah omit dan biasa diberi lambang dengan huruf O.
Sesuatu distraktor dapat diperlakukan dengan tiga cara:
a.       Diterima, karena sudah baik
b.      Ditolak, karena tidak baik
c.       Ditulis kembali, karena kurang baik
Kekurangannya mungkin hanya terletak pada rumusan kalimatnya sehingga hanya perlu ditulis kembali, dengan perubahan seperlunya. Menulis soal adalah suatu pekerjaan sulit, sehingga apabila masih dapat diperbaiki saja, tidak dibuang. Suatu distraktor dapat dikatakan berfungsi baik jika paling sedikit dipilih oleh 5% pengikut tes.[28]
Contoh perhitungan :
Dari analisis sebuah item, polanya diketahui sebagai berikut :
Pilihan Jawab
a
b
c*
d
o
Jumlah
Kelompok atas
5
7
15
3
0
30
Kelompok bawah
8
8
6
5
3
30
Jumlah
13
15
21
9
3
60
c, diberi tanda (*) adalah kunci jawaban
Dari pola jawaban soal ini dapat dicari :
1)      P    =     = 0,35
2)      D   =   PA – PB     =  
                           =    = 0,30
3)        Distraktor     :    semua distraktornya sudah berfungsi dengan baik karena sudah dipilih oleh dari 5% pengikut tes.
4)        Dilihat dari segi omit (kolom pilihan paling kanan) adalah baik. Sebuah item dikatakan baik jika omitnya tidak lebih dari 10% pengikut tes.
(5% dari pengikut tes = 5% x 60 orang = 3 orang)
Sebenarnya ketentuan ini hanya berlaku untuk tes pilihan ganda dengan 5 alternatif dan P = 0,80. Tetapi demi praktisnya diberlakukan untuk semua.[29]
Berikut cara menganalisis fungsi distractor :
Dari sebuah item soal yang dilengkapi dengan altenatif jawaban A, B, C, D, dan E di ikuti oleh 20 peserta tes, dengan hasil sebagai berikut:
Item soal
Alternatif jawaban
Keterangan
A
B
C
D
E
1
5
1
8
6
0
C (kunci jawaban)

Dari data diatas dapat kita berikan sebuah kesimpulan yaitu:
Pengecoh A dipilih oleh 5 orang teste yang berarti :  X 100% = 25%, pengecoh sudah berjalan dengan baik karena telah melebihi 5%.
Pengecoh B dipilih oleh 1 orang testee yang berarti :   X 100% = 5%, pengecoh sudah berjalan karena telah mencapai 5% .
Pengecoh D dipilih oleh 4 orang testee yang berarti :  X 100% = 30%, pengecoh berjalan dengan baik karena telah melebihi 5%.
Pengecoh E tidak dipilih oleh peserta testee yang berarti :  X 100% = 0, pengecoh tidak berjalan.[30]                               


BAB III
PENUTUP

A.    Kesimpulan
Analisis butir soal merupakan suatu prosedur yang sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes yang akan kita susun. Analisis butir soal pada dasarnya bertujuan untuk mengetahui apakah setiap item soal benar-benar baik, sehingga diperlukan analisis terhadapnya.
Analisis butir tes bertujuan untuk mengidentifikasi butir-butir manakah yang termasuk dalam kategori baik, kurang baik, dan jelek. Analisis butir tes memungkinkan kita memperoleh informasi mengenai baik tidaknya suatu butir, sekaligus memperoleh petunjuk untuk melakukan perbaikan.
Penganalisisan terhadap butir-butir soal dapat dilakukan dari tiga segi yaitu:
1.      Teknik analisis kesukaran item soal
Analisis tingkat kesukaran soal yaitu mengkaji soal-soal tes dari segi kesulitannya sehingga dapat diperoleh soal-soal mana yang termasuk mudah, sedang, dan sukar. Tingkat kesukaran soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawab, bukan dilihat dari sudut guru sebagai pembuat soal.
2.      Teknik analisis daya pembeda
Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan (mendiskriminasi) antara kemampuan tinggi dan rendah. Daya pembeda item itu penting sekali bagi salah satu dasar untuk menyusun butir item tes hasil belajar.
3.      Teknik analisis fungsi distraktor
Distraktor adalah pengecoh, jawaban-jawaban yang mengecoh. Ini bertujuan menarik untuk menjawabnya padahal itu salah. Sebagai tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut maka distraktor yang sudah menjalankan fungsinya dengan baik dapat dipakai lagi pada tesnya.


B.     Saran
Analisis butir soal hendaknya kita lakukan untuk dapat mengidentifikasi butir-butir tes secara baik dan tepat dan dapat memahami informasi yang diperoleh untuk melakukan perbaikan.


DAFTAR PUSTAKA

Arikunto, Suharsimi. Dasar-dasar Evaluasi Pendidikan. Jakarta : PT. Bumi Aksara. 2006.
Purwanto, M. Ngalim. Prinsip- Prinsip dan Teknik Evaluasi Pengajaran. Bandung : Remaja Rosdakarya. 2002.
Purwanto. Evaluasi Hasil Belajar. Yogyakarta : Pustaka Pelajar. 2009.
Sudijono, Anas. Pengantar Evaluasi Pendidikan. Jakarta : Rajawali Pers. 2011.
Wahidmurni, dkk.  Evaluasi Pembelajaran : Kompetensi dan Praktik. Yogyakarta : Nuha Litera. 2010.



[1] Purwanto, Evaluasi Hasil Belajar,(Yogyakarta : Pustaka Pelajar, 2009), hlm.96.
[2] M. Ngalim Purwanto, Prinsip- Prinsip dan Teknik Evaluasi Pengajaran, (Bandung : Remaja Rosdakarya, 2002), hlm. 118
[3] Wahidmurni, dkk, Evaluasi Pembelajaran : Kompetensi dan Praktik, (Yogyakarta : Nuha Litera, 2010), hlm. 117.
[4] Purwanto, Op.Cit., hlm.97.
[5] Wahidmurni, Op.Cit, hlm. 118.
[6] Log. Cit., hlm. 118
[7] Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta : Rajawali Pers, 2011), hlm.370.
[8] Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta : PT. Bumi Aksara, 2006), hlm. 207.
[9] Anas Sudijono, Op.Cit, hlm. 372.
[10] Log.Cit, hlm. 372.
[11] Ibid, hlm. 208.
[12] Ngalim Purwanto, Op.Cit, hlm. 119-120
[13] Anas Sudijono, Op.Cit, hlm. 373 -375.
[14] Ibid,hlm. 376-377.
[15] Suharsimi Arikunto, Op.Cit, hlm.  210.
[16] Wahidmurni, dkk., Op.Cit, hlm. 132-133.
[17] Suharimi Arikunto, Op.Cit, hlm. 211.
[18] Wahidmurni, Op.Cit, hlm. 134.
[19] Anas Sudijono, Op.Cit., hlm. 388
[20] Suharsimi Arikunto, Log.Cit, hlm. 211
[21] Anas Sudijono, Op.Cit, hlm. 389.
[22] Ibid, hlm. 212
[23] Ibid, hlm. 213-214.
[24] Ibid, hlm. 215-218
[25] Anas Sudijono, Op.Cit, hlm. 391-395.
[26] Ibid, hlm. 409.
[27] Purwanto, Op.Cit, hlm. 108.
[28] Suharsimi Arikunto, Op. Cit, hlm. 220
[29] Ibid, hlm. 221.
[30] Anas Sudijono, Op.Cit, hlm. 412-413.

Tidak ada komentar:

Posting Komentar