MAKALAH
ANALISIS BUTIR SOAL TES
Dosen Pengampu : Rahmad Kamal, M.Pd.I

Makalah ini disusun untuk memenuhi tugas Mata Kuliah
Pengembangan
Sistem Evaluasi Pendidikan di STIT Pemalang
Tahun Akademik 2014/2015
Disusun Oleh :
1. Septian Khusnul
K. 3120011
2. Dinazad 3120040
3. S. Maulana M. 3120064
PROGRAM STUDI PENDIDIKAN AGAMA ISLAM
SEKOLAH
TINGGI ILMU TARBIYAH (STIT)
PEMALANG
TAHUN 2014/2015
BAB I
PENDAHULUAN
A. Latar Belakang
Cara untuk
memperbaiki proses belajar-mengajar yang paling efektif ialah dengan jalan
mengevaluasi tes hasil belajar yang
diperoleh dari proses belajar-mengajar itu sendiri. Dengan kata lain, hasil tes
itu diolah sedemikian rupa sehingga dari hasil pengolahan itu dapat diketahui
komponen-komponen manakah dari proses mengajar itu yang masih lemah.
Pada dasarnya tujuan umum penyusunan tes
adalah untuk memperoleh tes dengan jumlah item minimum, namun dapat
menghasilkan skor pengukuran dengan tingkat reliabilitas
dan validitas yang tinggi.
Oleh karena itu, setelah item ditulis sesuai dengan kaidah penulisan tes yang
baik dan sesuai dengan kisi-kisi yang direncanakan, yang secara teoritik tes
tersebut sudah baik. Sehingga, perlu untuk dilakukan pengujian empirik.
Pengujian item tes secara empirik inilah yang disebut sebagai analisis item
tes.[1]
Pengolahan tes hasil belajar dalam rangka memperoleh
proses belajar mengajar dapat dilakukan dengan berbagai cara, antara lain:
1.
Dengan
membuat analisis soal (item analysis)
2.
Dengan
menghitung validitas dan keandalan tes
Dalam makalah ini khusus akan dibicarakan cara yang pertama yaitu teknik analisis
soal atau item analisis. Analisis soal (item analysis) berkaitan dengan proses
mengumpulkan, meringkas, dan menggunakan informasi tentang tiap butir soal tes,
terutama informasi tentang jawaban siswa terhadap butir soal tersebut. Kegiatan analisis butir
soal merupakan kegiatan penting dalam penyusunan soal agar diperoleh butir soal
yang bermutu.Tujuan kegiatan ini adalah mengkaji dan menelaah setiap butir soal
agar diperoleh soal yang bermutu sebelum digunakan, meningkatkan kualitas butir
tes melalui revisi atau membuang soal yang tidak efektif, serta mengetahui
informasi diagnostik pada siswa apakah mereka telah memahami materi yang
telah diajarkan. Soal yang bermutu adalah soal dapat memberikan informasi
setepat-tepatnya tentang siswa mana yang telah menguasai meteri dan siswa yang
belum menguasai materi.
Analisis soal untuk tes standar berbeda
dengan analisis soal untuk tes buatan guru. Yang lebih diperlukan di kelas adalah
analisis soal untuk tes buatan guru. Dengan pengertian demikian, maka yang
perlu diketahui mengenai kualitas soal dengan analisis itu adalah tingkat
kesukarannya, daya pembedanya dan
fungsi distraktornya.
Jadi tujuan khusus dari items analisis
ialah mencari soal tes mana yang baik dan mana yang tidak baik, dengan membuat
analisis soal, sedikitnya dapat mengetahui dari tiga segi yang dapat diperoleh dari tiap soal, yaitu:
a) dari segi derajat kesukaran itemnya; b) dari segi daya pembeda itemnya; c) dari
segi fungsi distraktornya.[2]
B. Rumusan Masalah
Berdasarkan latar belakang masalah di atas, dapat
dirumuskan sebagai beikut:
1.
Bagaimana teknik
analisis soal tes (Item Analysis) ?
2.
Bagaimana teknik
analisis derajat kesukaran item ?
3.
Bagaimana teknik
analisis daya pembeda item ?
4.
Bagaimana teknik
analisis fungsi distraktor ?
BAB II
PEMBAHASAN
A. Analisis Butir Soal
Menurut Nitko yang dikutip oleh
Wahidmurni, dkk., kegiatan analisis butir soal merupakan proses pengumpulan,
peringkasan, dan penggunaan informasi dari jawaban peserta didik untuk membuat
keputusan tentang setiap penilaian. Tujuan dilakukannya analisis butir soal
adalah untuk mengkaji dan menelaah setiap butir soal agar diperoleh soal yang
bermutu sebelum digunakan, meningkatkan kualitas butir tes melalui revisi
atau membuang soal yang tidak efektif, mengetahui informasi diagnostik pada
siswa apakah mereka telah memahami materi yang telah diajarkan.[3]
Pada analisis butir, butir akan dilihat
karakteristiknya dan dipilih butir-butir
yang baik. butir yang baik adalah butir-butir yang karakteristiknya memenuhi syarat sebagaimana kriteria karakteristik butir yang baik.[4]
Berdasarkan pendapat yang diungkapkan
oleh Anastasia dan Urbina dalam Wahidmurni, dkk., tujuan utama analisis butir
soal yang dibuat oleh pendidik adalah untuk mengidentifikasi
kekurangan-kekurangan dalam tes atau dalam pembelajaan. Manfaat dilakukannya analisis
butir soal diantaranya yakni:
1.
Membantu
pengguna tes dalam mengevaluasi kualitas tes yang digunakan,
2.
Relevan bagi penyusunan tes informal dan lokal seperti tes yang
disiapkan penidik untuk peserta didik di kelas,
3.
Mendukung penulisan butir soal yang efektif,
4.
Secara materi dapat memperbaiki tes di kelas,
Linn dan Gronlund dalam
Wahidmurni, dkk., menambahkan bahwa data hasil analisis
butir soal juga sangat bermanfaat sebagai dasar untuk:
1.
Diskusi
tentang efisien hasil tes,
2.
Untuk kerja remedial,
3.
Peningkatan secara umum pembelajaran di kelas,
4.
Peningkatan keterampilan pada kontruksi tes.
1.
Menentukan
soal-soal yang cacat atau tidak berfungsi dengan baik,
2.
Meningkatkan butir soal melalui tiga komponen
analisis yaitu, tingkat kesukaran, daya pembeda dan pengecoh soal,
3.
Merevisi soal yang tidak relevan degan materi yang
diajarkan, ditandai dengan banyaknya anak yang tidak dapat menjawab butir soal
tertentu.
B.
Teknik Penganalisisan Item Tes Hasil Belajar
Penganalisisan terhadap butir-butir
item tes hasil belajar dapat dilakukan dari tiga segi, yaitu : 1) dari segi
derajat kesukaran itemnya, 2) dari segi daya pembeda itemnya, 3) dari segi
fungsi distraktornya.
1.
Teknik
Analisis Derajat Kesukaran Item
Bermutu atau tidaknya
butir-butir item tes hasil belajar pertama-tama dapat dilihat dari derajat
kesukaran atau taraf kesulitan yang dimiliki masing-masing butir item. Soal yang baik
adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang
terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya.
Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan
tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.
Bertitik tolak dari pernyataan tersebut di atas maka
butir-butir item hasil belajar di mana seluruh testee tidak dapat menjawab
dengan betul (karena terlalu sukar) tidak dapat disebut sebagai item yang baik.
Demikian pula sebaliknya, butir-butir item tes hasil belajar dimana seluruh
testee dapat menjawab dengan betul (karena terlalu mudah) juga tidak dapat
dimasukkan dalam kategori item yang baik.[7]
Seorang siswa akan menjadi hafal akan kebiasaan
guru-gurunya dalam hal pembuatan soal ini. Misalnya saja guru A dalam
memberikan ulangan soalnya mudah, sebaliknya guru B kalau memberikan ulangan
soalnya sukar-sukar. Dengan pengetahuannya tentang kebiasaan ini, maka siswa
akan belajar giat jika menghadapi
ulangan dari guru B dan sebaliknya jika akan mendapat ulangan dari guru A,
tidak mau belajar giat atau bahkan mungkin tidak mau belajar sama sekali.
Bilangan yang menunjukan sukar dan mudahnya sesuatu soal
disebut difficulty index (=
angka indek kesukaran item), yang umumnya dilambangkan dengan huruf P (proportion
= proporsi). Besarnya indeks kesukaran antara 0,00-1,0. Indeks kesukaran ini
menunjukan taraf kesukaran soal. Soal dengan indeks kesukaran 0,0 menunjukan bahwa soal
itu terlalu sukar, sebaliknya indeks 1,0 menunjukan bahwa soalnya terlalu
mudah.[8]
0,0 ______________________
1,0
sukar mudah
Dengan demikian maka soal dengan P = 0,70 lebih mudah
jika dibandingkan dengan P = 0,20. Sebaliknya soal dengan P = 0,30 lebih sukar
dari pada soal dengan P = 0,80.
Mengenai bagaimana cara menberikan
penafsiran terhadap angka kesukaran item, Robert L. Thorndike dan Elizabert
Hegen dalam bukunya berjudul Measurement and Evaluation in Psychology and
Education mengemukakan sebagai berikut:[9]
Besarnya P
|
Interpelasi
|
Kurang dari 0,30
|
Terlalu sulit
|
0,300-0,70
|
Cukup (sedang)
|
Lebih dari 0,70
|
Terlalu mudah
|
Sedangkan menurut Witherington dalam bukunya yang berjudul Psyichological
Education adalaha sebagai berikut:[10]
Besarnya P
|
Interpelasi
|
Kurang dari 0,25
|
Terlalu sulit
|
0,25-0,75
|
Cukup (sedang)
|
Lebih dari 0,75
|
Terlalu mudah
|
Angka
indeks kesukaran item itu dapat diperoleh dengan menggunakan rumus :
Rumus
1 :

Keterangan :
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan
benar
JS = jumlah seluruh siswa peserta tes.[11]
Contoh:
Jumlah siswa peserta tes dalam suatu kelas ada 40 siswa. Dari 40
siswa tersebut terdapat 12 siswa yang mampu mengerjakan soal nomor 1 dengan benar. Maka
berapa indeks kesukarannya?
Jawab:
.

=
=
0,30

Rumus 2 :

Keterangan:
TK = taraf kesukaran
U = jumlah
siswa yang termasuk kelompok pandai (upper group) yang menjawab benar
untuk tiap soal.
L = jumlah
siswa yang termasuk kurang (lower group) yang menjawab benar untuk
tiap soal.
T =
jumlah siswa dari kelompok pandai dan kelompok kurang (jumlah
upper group dan lower group)
Misalkan suatu tes yang terdiri atas N soal
yang diberikan kepada 40 siswa. Dari hasil tes tersebut, tiap-tiap soal
dianalisis taraf kesukarannya. mula-mula hasil tes itu kita susun kedalam
peringkat, kemudian kita ambil 25% (10 lembar jawaban siswa kelompok pandai),
dan 10 lembar jawaban siswa dari kelompok yang kurang pandai. Kemudian kita
tabulasikan. Misalkan dari tabulasi soal nomor 1 kita peroleh hasil sebagai berikut: yang
menjawab benar dari kelompok pandai ada 9 siswa, dan yang menjawab benar dari
kelompok kurang pandai ada 4 siswa. Dengan menggunakan rumus diatas, maka taraf
kesukaran atau TK dari soal nomor 1 adalah:
.
=
= 0,65 atau 65%


Jadi dapat disimpilkan bahwa nilai dari TK
atau tingkat kesukarannya adalah 65%.[12]
Contoh lainnya :[13]
Misalkan sebanyak 10 orang
testee mengikuti tes hasil belajar tahap akhir dalam mata pelajaran
Aqidah-Akhlaq yang dituangkan dalam bentuk soal tes obyektif dengan menyajikan
10 butir item (soal), dengan soal yang dapat dijawab benar diberi bobot 1 dan
untuk jawaban salah diberi bobot 0. Setelah tes
selesai, dilakukan koreksi dan diberikan skor yang menghasilkan pola penyebarab
jawaban sebagai berikut.
Tabel Penyebaran Skor Jawaban 10 Testee
Terhadap 10 Butir Item Dalam Tes Hasil Belajar Mata Pelajaran Aqidah-Akhlaq
Testee
|
Skor Pada Soal Nomor
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
A
|
0
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
0
|
B
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
C
|
1
|
0
|
0
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
D
|
0
|
0
|
1
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
E
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
0
|
1
|
0
|
F
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
G
|
1
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
H
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
I
|
1
|
0
|
0
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
J
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
Jumlah jawaban benar
|
6
|
2
|
8
|
5
|
6
|
2
|
8
|
3
|
8
|
7
|
Tabel Perhitungan Indeks Kesukaran
Item Hasil Jawaban 10 Testee Terhadap 10 Butir Item Dalam Tes Hasil
Belajar Mata Pelajaran Aqidah-Akhlaq
No Soal
|
Indeks Kesukaran Item (P)
|
Interpretasi
|
1
|
P =
![]() ![]() |
Sedang
|
2
|
P =
![]() |
Terlalu sukar
|
3
|
P =
![]() |
Terlalu mudah
|
4
|
P =
![]() |
Sedang
|
5
|
P =
![]() |
Sedang
|
6
|
P =
![]() |
Terlalu sukar
|
7
|
P =
![]() |
Terlalu mudah
|
8
|
P =
![]() |
Sedang
|
9
|
P =
![]() |
Terlalu mudah
|
10
|
P =
![]() |
Sedang
|
Dari hasil analisis yang dilakukan terhadap 10 butir item tes hasil
belajar tersebut dapat diketahui terdapat 5 soal dalam kategori baik (sedang
atau tidak terlalu sukar), 2 soal dalam kategori terlalu sukar, dan 3 soal
dalam kategori terlalu mudah. Dengan hasil analisis tersebut, maka tindak
lanjut yang dapat dilakukan oleh tester adalah :[14]
a.
Untuk
butir soal yang termasuk dalam kategori baik segera dicatat dan disimpan dalam
bank soal dan dapat digunakan kembali sewaktu-waktu untuk tes berikutnya.
b.
Untuk butir
soal yang dalam kategori terlalu sukar ada kemungkinan 3 hal yang bisa dilakukan yakni butir
soal tersebut dibuang (tidak akan dikeluarkan lagi saat tes selanjutnya), diteliti
ulang dan ditelusuri faktor yang menyebabkan soal tersebut sukar dikerjakan oleh testee dan
setelah dilakukan perbaikan dapat dikeluarkan lagi pada tes selanjutnya, dapat
digunakan dalam tes-tes yang membutuhkan seleksi ketat.
c.
Untuk
butir soal yang dalam kategori terlalu mudah ada kemungkinan 3 hal yang bisa dilakukan yakni butir soal
tersebut dibuang (tidak akan dikeluarkan lagi saat tes selanjutnya), diteliti
ulang dan ditelusuri faktor yang menyebabkan soal tersebut sangat mudah dikerjakan oleh testee dan setelah
dilakukan perbaikan dapat dikeluarkan lagi pada tes selanjutnya, dapat
digunakan dalam tes-tes yang membutuhkan seleksi yang lebih longgar.
Menurut ketentuan yang sering diikuti, indeks kesukaran
sering diklasifikasikan sebagai berikut:
a.
Soal
dengan P 0,00 sampai < 0,30 adalah soal sukar
b.
Soal
dengan P 0,30 sampai 0,70 adalah soal sedang
Kegunaan tingkat kesukaran butir soal
bagi pendidik adalah : 1) sebagai pengenalan konsep terhadap pembelajaran ulang
dan memberi masukan kepada peserta didik tentang hasil belajar mereka, 2)
memperoleh informasi tentang penekanan kurikulum atau mencurigai terhadap butir
soal yang bias. Adapun keggunaan bagi penguji dan pengajaran adalah ; a)
pengenalan konsep yang diperlukan untuk diajarkan ulang, b) mengetahui
kelamahan dan kelebihan kurikulum sekolah, c) memberi masukan kepada peserta
didik, d) adanya soal-soal yang bias, dan e) membuat tes yang memiliki
ketepatan data soal.[16]
2.
Teknik
Analisis Daya Pembeda Item
Menurut Suharsimi, daya pembeda soal adalah
kemampuan suatu soal untuk membedakan antara peserta
didik yang pandai (berkemampuan tinggi) dengan peserta didik yang bodoh
(berkemampuan rendah).[17]
Mengetahui daya pembeda
item itu penting sekali, sebab salah satu dasar yang dipegang untuk menyusun
butir-butir item tes hasil belajar adalah adanya anggapan, bahwa kemampuan
antara siswa yang satu dengan siswa yang lain itu berbeda-beda, dan bahwa
butir-butir tes hasil belajar itu haruslah mampu memberikan hasil tes yang
mencerminkan adanya perbedaan-perbedaan kemampuan yang terdapat di kalangan
peserta didik tersebut.
Manfaat daya pembeda butir
soal adalah sebagai berikut :[18]
a. Untuk meningkatkan mutu
setiap butir soal melalui data empiriknya.
b. Untuk mengetahui seberapa
jauh setiap butir soal dapat membedakan kemampuan peserta didik.
Angka yang menunjukan besarnya daya pembeda item disebut indeks
diskriminasi item. Angka indek
diskriminasi item adalah sebuah angka atau bilangan yang menunjukkan besar
kecilnya daya pembeda (discriminatory power) yang dimiliki oleh sebutir
item, yang diberi lambang huruf D. Seperti halnya indeks kesukaran, indeks
diskriminasi ini berkisar antara 0,00 sampai 1,00. Hanya
bedanya, indeks kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks
diskriminasi ada tanda negatif yaitu digunakan jika sesuatu soal “terbalik” menunjukan kualitas testee.
Yaitu anak pandai disebut bodoh dan anak bodoh disebut pandai.
Jika sebutir item angka indeks D =
0,00 (nihil), maka hal ini menunjukkan bahwa butir item yang bersangkutan tidak
memiliki daya pembeda sama sekali, yang berarti bahwa jumlah testee kelompok
atas yang menjawab benar (atau salah) sama dengan jumlah testee kelompok
atas yang menjawab dengan benar. Jadi di antara kedua
kelompok testee tersebut tidak ada perbedaannya sama sekali atau perbedaannya =
0. Apabila angka indeks diskriminasi item dan sebutir item bertanda negatif
(-), maka butir item lebih banyak dijawab benar oleh testee kelompok bawah dari
pada oleh kelompok atas, atau testee yang sebenarnya termasuk dalam kategori
pandai lebih banyak menjawab salah sedangkan testee yang sebenarnya dalam
kategori kurang panda lebih banyak yang menjawab dengan benar.[19]
Dengan demikian ada tiga titik pada daya pembeda yaitu:[20]
-1,00 ↔ 0,0 ↔ 1,00
daya pembeda daya pembeda daya
pembeda
negatif rendah
tinggi
Bagi soal yang dapat dijawab benar oleh peserta didik
pandai maupun bodoh, maka soal itu tidak baik karena tidak ada daya pembeda.
Demikian pula jika semua peserta
didik baik pandai maupun bodoh tidak dapat menjawab
dengan benar. Soal tersebut tidak mempunyai daya pembeda. Soal yang baik adalah
soal yang dapat dijawab benar oleh siswa yang pandai-pandai saja.
Untuk mengetahui indeks manakah yang
dapat menyatakan bahwa sebutir soal dapat dikatakan sebagai butir soal yang
memiliki daya pembeda yang baik, menurut Sudijono (1996) dapat digunakan
patokan sebagai berikut :[21]
Indeks Diskriminasi Item (D)
|
Klasifikasi
|
Interpretasi
|
< 0,20
|
Poor
|
Butir soal memiliki daya pembeda lemah (tidak memiliki daya
pembeda yang baik)
|
0,20 – 0,40
|
Satisfactory
|
Butir soal memiliki daya pembeda cukup (sedang)
|
0,40 – 0,70
|
Good
|
Butir soal memiliki daya pembeda yang baik
|
0,70 – 1,00
|
Excellent
|
Butir soal memiliki daya pembeda sangat baik
|
Bertanda negatif (-)
|
-
|
Buti soal tidak memiliki daya pembeda
|
Untuk menghitung indeks pembeda
pengikut tes dikelompokkan yaitu: kelompok pandai atau kelompok atas (upper
group) dan kelompok bodoh atau kelompok bawah (lower group).
Jika seluruh kelompok atas dapat
menjawab soal tersebut dengan benar, sedang seluruh kelompok bawah menjawab
salah, maka soal tersebut mempunyai D paling besar yaitu 1,00. Sebaliknya jika semua kelompok atas menjawab salah, tetapi kelompok bawah menjawab betul, maka
nilai D-nya
-1,00. Tetapi jika kelompok atas dan kelompok bawah sama-sama menjawab benar
atau salah, maka soal tersebut mempunyai nilai D 0,00. Karena tidak mempunyai
daya pembeda sama sekali.
Cara menentukan daya pembeda (nilai D) berbeda antara
kelompok kecil (kurang dari 100 orang) dengan kelompok besar (100 orang ke
atas).
a.
Untuk
kelompok kecil
Seluruh
kelompok testee dibagi dua sama besar, 50% kelompok atas dan 50% kelompok
bawah.
Contoh
:
Siswa
A
B
C
D
E
|
Skor
![]()
8
7
7
6
|
Kelompok atas (JA)
|
F
G
H
I
J
|
![]()
5
4
4
3
|
Kelompok bawah (JB)
|
Seluruh
pengikut tes, dideretkan mulai dari skor teratas sampai terbawah, lalu dibagi
2.[22]
b. Untuk kelompok besar
Mengingat biaya dan waktu untuk menganalisis, maka
untuk kelompok besar biasanya hanya diambil kedua kubuhnya saja, yaitu 27% skor
teratas sebagai kelompok atas (JA) dan 27% skor terbawah sebagai
kelompok bawah (JB).
JA =
jumlah kelompok atas
JB =
jumlah kelompok bawah
Contoh
:
![]()
9
8
8
8
.
.
.
--
.
.
.
![]()
.
.
.
2
1
1
1
0
|
27%
sebagai JA
27%
sebagai JB
|
Rumus
untuk menentukan indeks diskriminasi (D) :[23]

Keterangan
:
J = jumlah peserta tes
JA =
banyaknya peserta kelompok atas
JB = banyaknya peserta kelompok bawah
BA = banyaknya peserta kelompok atas yang menjawab
soal itu dngan benar
BB
= banyaknya peserta kelompok bawah yang menjawab soal itu dengan
benar

PA
= proporsi peserta kelompok atas yang menjawab benar (ingat, P
sebagai indeks kesukaran)

PB = proporsi peserta kelompok bawah yang menjawab
benar.
Contoh perhitungan :[24]
Dari hasil analisis tes yang terdiri
dari 10 butir soal yang dikerjakan oleh 20 orang siswa, terdapat dalam tabel
sebagai berikut :
Siswa
|
Kelom-pok
|
Nilai Soal
|
Skor Siswa
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|||
A
|
B
|
1
|
0
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
5
|
B
|
A
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
0
|
1
|
1
|
7
|
C
|
A
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
8
|
D
|
B
|
0
|
0
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
0
|
5
|
E
|
A
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
10
|
F
|
B
|
1
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
1
|
0
|
6
|
G
|
B
|
0
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
1
|
1
|
6
|
H
|
B
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
1
|
6
|
I
|
A
|
1
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
1
|
8
|
J
|
A
|
1
|
1
|
1
|
1
|
|
0
|
1
|
0
|
1
|
1
|
7
|
K
|
A
|
1
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
0
|
7
|
L
|
B
|
0
|
1
|
0
|
1
|
1
|
0
|
0
|
1
|
1
|
0
|
5
|
M
|
B
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
1
|
1
|
0
|
3
|
N
|
A
|
0
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
7
|
O
|
A
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
P
|
B
|
0
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
3
|
Q
|
A
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
8
|
R
|
A
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
8
|
S
|
B
|
1
|
0
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
0
|
6
|
T
|
B
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
6
|
Jumlah
|
11
|
15
|
12
|
8
|
6
|
16
|
15
|
17
|
20
|
10
|
|
Berdasarkan nama-nama siswa dapat kita peroleh
skor-skor sebagai berikut :
A = 5 F = 6 K = 7 P = 3
B = 7
G = 6
L = 5 Q = 8
C = 8 H = 6
M = 3 R = 8
D = 5
I = 8
N = 7
S = 6
E = 10
J = 7 O = 9
T = 6
Dari angka yang belum teratur tersebut kemudian dibuat urutan
penyebaran, dari skor yang paling tinggi ke skor yang paling rendah.
Kelompok Atas
10
9
8
8
8
8
7
7
7
7
|
Kelompok Bawah
6
6
6
6
6
5
5
5
3
3
|
10 orang
|
10 orang
|
Uraian ini menunjukkan adanya kelompok atas ( JA) dan kelompok bawah ( JB ) dengan pemiliknya sebagai berikut :
Kelompok Atas (JA)
B = 7
C = 8
E = 10
I = 8
J = 7
K = 7
N = 7
O = 9
Q = 8
R = 8
|
Kelompok Bawah (JB)
A = 5
D = 5
F = 6
G = 6
H = 6
L = 5
M = 3
P = 3
S = 6
T = 6
|
10 orang
|
10 orang
|
Pada uraian di atas dapat ditunjukkan kelompok A dan B. Dan hal ini
mempermudah menentukan BA dan BB. Dimana
BA = Banyaknya siswa
yang menjawab benar pada kelompok atas A dan
BB = banyaknya siswa
yang menjawab benar pada kelompok bawah B
Seperti yang diketahui, soal yang baik
adalah soal yang dapat membedakan antara anak berkemampuan tinggi dengan anak
berkemampuan rendah, dilihat dari dapat atau tidaknya ia mengerjakan soal tes.
Perhatikan tabel analisis khusus untuk butir soal
nomor 1.
-
Dari kelompok atas yang menjawab betul 8 orang
-
Dan kelompok bawah yang menjawab betul 3 orang
Menerapkan pada rumus :


PA = 0,8 PB = 0,3
BA = 8 BB = 3
Maka D = PA – PB
= 0,8 – 0,3
= 0,5
Dengan demikian maka indeks diskriminasi untuk
soal nomor 1 adalah 0,5.
Sekarang memperhatikan butir soal nomor 8 :


PA = 0,8 PB = 0,9
BA = 8 BB = 9
Maka D = PA – PB
= 0,8 – 0,9
= - 0,1
Butir soal ini jelek karena lebih banyak dijawab
benar oleh kelompok bahwa dibandingkan dengan jawaban benar dari kelompok atas.
Ini berarti bahwa untuk menjawab soal dengan benar, dapat dilakukan dengan
menebak.
Butir-butir soal yang baik adalah butir-butir soal
yang mempunyai indeks diskriminasi 0,4 sampai 0,7.
Misalkan 10 orang testee
mengikuti tes hasil belajar dalam bidang studi Bahasa Arab dalam bentuk multiple
choice item sebanyak 10
soal. Dengan
soal yang dapat dijawab benar diberi bobot 1 dan untuk jawaban salah diberi
bobot 0.
Langkah-langkah yang dikerjakan
adalah sebagai berikut :
a.
Mengelompokkan
testee menjadi 2 kelompok yaitu kelompok atas (pandai) dan kelompok bawah
kurang pandai
Testee
|
Skor Pada Soal Nomor
|
Total
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||
A
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
5
|
B
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
10
|
C
|
1
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
1
|
1
|
7
|
D
|
1
|
1
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
3
|
E
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
0
|
7
|
F
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
0
|
0
|
0
|
4
|
G
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
7
|
H
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
I
|
0
|
1
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
4
|
J
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
5
|
N = 10
|
5
|
9
|
2
|
8
|
6
|
8
|
5
|
6
|
6
|
6
|
61
|
Mengelompokkan dalam kelas atas dan bawah
Tabel Kelompok Atas
|
Tabel Kelompok Bawah
|
||
Testee
|
Skor
|
Testee
|
Skor
|
B
|
10
|
A
|
5
|
H
|
9
|
I
|
5
|
C
|
7
|
J
|
4
|
G
|
7
|
F
|
4
|
E
|
7
|
D
|
3
|
JA = 5
|
-
|
JB = 5
|
-
|
b.
Menuliskan
atau memberi kode-kode terhadap hasil pengelompokan testee
Testee
|
Skor Pada Soal Nomor
|
Total
|
Kelom-pok
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|||
A
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
5
|
Bawah
|
B
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
10
|
Atas
|
C
|
1
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
1
|
1
|
7
|
Atas
|
D
|
1
|
1
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
3
|
Bawah
|
E
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
0
|
7
|
Atas
|
F
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
0
|
0
|
0
|
4
|
Bawah
|
G
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
7
|
Atas
|
H
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
Atas
|
I
|
0
|
1
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
4
|
Bawah
|
J
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
5
|
Bawah
|
N = 10
|
5
|
9
|
2
|
8
|
6
|
8
|
5
|
6
|
6
|
6
|
61
|
|
c.
Menghitung
BA, BB, PA, PB, dan D untuk 10
butir soal
Nomor Soal
|
BA
|
BB
|
JA
|
JB
|
PA =
![]() |
PB =
![]() |
D = PA
![]() |
1
|
3
|
2
|
5
|
5
|
0,60
|
0,40
|
0,20
|
2
|
5
|
4
|
5
|
5
|
1,00
|
0,80
|
0,20
|
3
|
2
|
0
|
5
|
5
|
0,40
|
0,00
|
0,40
|
4
|
4
|
4
|
5
|
5
|
0,80
|
0,80
|
0,00
|
5
|
3
|
3
|
5
|
5
|
0,60
|
0,60
|
0,00
|
6
|
5
|
3
|
5
|
5
|
1,00
|
0,60
|
0,40
|
7
|
4
|
1
|
5
|
5
|
0,80
|
0,20
|
0,60
|
8
|
5
|
1
|
5
|
5
|
1,00
|
0,20
|
0,80
|
9
|
5
|
1
|
5
|
5
|
1,00
|
0,20
|
0,80
|
10
|
4
|
2
|
5
|
5
|
0,80
|
0,40
|
0,40
|
d.
Memberikan
Penafsiran (Interpretasi) Mengenai Kulitas Daya Pembeda Item Yang Dimiliki Oleh
10 Soal
Nomor Butir Soal
|
Besar D
|
Klasifikasi
|
Interpretasi
|
8 dan 9
|
0,80
|
Excellent
|
Daya pembeda sangat baik
|
7
|
0,60
|
Good
|
Daya pembda baik
|
3,6 dan 10
|
0,40
|
Satisfactory
|
Daya pembeda cukup
|
1 dan 2
|
0,20
|
Poor
|
Daya pembeda lemah
|
4 dan 5
|
0,00
|
-
|
Tidak memiliki daya
pembeda
|
Dari hasil analisis tersebut maka dapat disimpulkan
bahwa 60% (6 butir) dari 10 butir soal bahasa arab yang diajukan dalam
tes tersebut sudah memiliki daya pembeda yang baik, sedangkan 40% (4 butir)
masih tergolong belum memiliki daya pembeda seperti yang diharapkan.
3.
Teknik
Analisis Fungsi Distraktor
Pada saat membicarakan tentang tes obyektif bentuk pilihan ganda, item
telah dikemukakan bahwa pada tes obyektif tesebut telah dilengkapi dengan
beberapa kemungkinan jawaban atau yang
dikenal dengan alternatif. Altenatif jawaban itu jumlahnya berkisar antara 3- 5
buah, dan dari kemungkinan jawaban yang terpasang pada setiap butir item
terpasang sebuah jawaban dan sisanya sebagai pengecoh (disrtactor).[26]
Distraktor adalah pengecoh, jawaban-jawaban yang
mengecoh. Yang disebut dengan distraktor atau pengecoh adalah opsi-opsi yang
bukan merupakan kunci jawaban. Ini bertujuan menarik untuk menjawabnya
padahal itu salah. Sebagai tindak lanjut atas hasil penganalisaan terhadap
fungsi distraktor tersebut maka distraktor yang sudah menjalankan fungsinya
dengan baik dapat dipakai lagi pada tesnya.
Tujuan utama dari pemasangan
distraktor pada setiap butir item itu adalah, agar dari sekian banyak testee
yang mengikuti tes hasil belajar ada yang tertarik untuk memilihnya, sebab
mereka menyangka bahwa distraktor yang mereka pilih itu merupakan jawaban
betul. Jadi mereka terkecoh, menganggap bahwa distraktor
yang terpasang pada item itu sebagai kunci jawaban item, padahal bukan. Dengan
kata lain, distraktor baru dapat dikatakan telah dapat menjalankan fungsinya
dengan baik, apabila distraktor tersebut telah memiliki daya tarik demikian
rupa, sehingga para testee (khususnya yang termasuk kategori kemampuan rendah)
merasa bimbang, dan ragu-ragu sehingga pada akhirnya mereka menjadi terkecoh
untuk memilih distraktor sebagai jawaban betul, sebab mereka mengira bahwa yang
mereka pilih itu kunci jawaban item, padahal bukan.
Pengecoh dikatakan berfungsi efektif
apabila paling tidak ada siswa yang terkecoh memilih. Pengecoh yang sama sekali
tidak dipilih berarti tidak dapat melakukan fungsinya.[27]
Suatu kemungkinan dapat terjadi, yaitu bahwa dari
keseluruhan alternatif yang dipasang pada butir item tertentu, sama sekali tidak dipilih
oleh testee. Dengan kata lain, testee menyatakan “blangko”. Pernyataan blangko
ini sering dikenal dengan istilah omit dan biasa diberi
lambang
dengan huruf O.
Sesuatu distraktor dapat diperlakukan
dengan tiga cara:
a. Diterima, karena sudah baik
b. Ditolak, karena tidak baik
c. Ditulis kembali, karena
kurang baik
Kekurangannya mungkin hanya terletak
pada rumusan kalimatnya sehingga hanya perlu ditulis
kembali, dengan perubahan seperlunya. Menulis soal adalah suatu pekerjaan
sulit, sehingga apabila masih dapat diperbaiki saja, tidak dibuang. Suatu
distraktor dapat dikatakan berfungsi baik jika paling sedikit dipilih oleh
5% pengikut tes.[28]
Contoh perhitungan :
Dari analisis sebuah item, polanya diketahui
sebagai berikut :
Pilihan Jawab
|
a
|
b
|
c*
|
d
|
o
|
Jumlah
|
Kelompok atas
|
5
|
7
|
15
|
3
|
0
|
30
|
Kelompok bawah
|
8
|
8
|
6
|
5
|
3
|
30
|
Jumlah
|
13
|
15
|
21
|
9
|
3
|
60
|
c, diberi tanda (*) adalah kunci jawaban
Dari
pola jawaban soal ini dapat dicari :
1) P =
= 0,35

2)
D = PA – PB = 

=
= 0,30

3)
Distraktor : semua
distraktornya sudah berfungsi dengan baik karena sudah dipilih oleh dari 5%
pengikut tes.
4)
Dilihat dari segi omit (kolom
pilihan paling kanan) adalah baik. Sebuah item dikatakan baik jika omitnya
tidak lebih dari 10% pengikut tes.
(5%
dari pengikut tes = 5% x 60 orang = 3 orang)
Sebenarnya
ketentuan ini hanya berlaku untuk tes pilihan ganda dengan 5 alternatif dan P =
0,80. Tetapi demi praktisnya diberlakukan untuk semua.[29]
Berikut
cara menganalisis fungsi distractor :
Dari sebuah item soal yang dilengkapi dengan altenatif jawaban A, B, C,
D, dan E di ikuti oleh 20 peserta tes, dengan hasil sebagai berikut:
Item soal
|
Alternatif jawaban
|
Keterangan
|
||||
A
|
B
|
C
|
D
|
E
|
||
1
|
5
|
1
|
8
|
6
|
0
|
C (kunci jawaban)
|
Dari data diatas dapat
kita berikan sebuah kesimpulan yaitu:
Pengecoh A dipilih oleh
5 orang teste yang berarti :
X 100% = 25%, pengecoh sudah berjalan dengan
baik karena telah melebihi 5%.

Pengecoh B dipilih oleh
1 orang testee yang berarti :
X 100% = 5%, pengecoh sudah berjalan karena
telah mencapai 5% .

Pengecoh D dipilih oleh
4 orang testee yang berarti :
X 100% = 30%, pengecoh berjalan dengan baik
karena telah melebihi 5%.

Pengecoh E tidak dipilih
oleh peserta testee yang berarti :
X 100% = 0, pengecoh tidak berjalan.[30]

BAB III
PENUTUP
A. Kesimpulan
Analisis butir soal merupakan suatu prosedur yang
sistematis, yang akan memberikan informasi-informasi yang sangat khusus
terhadap butir tes yang akan kita susun. Analisis butir soal pada dasarnya bertujuan
untuk mengetahui apakah setiap item soal benar-benar baik, sehingga diperlukan
analisis terhadapnya.
Analisis butir tes bertujuan untuk mengidentifikasi
butir-butir manakah yang termasuk dalam kategori baik, kurang baik, dan jelek.
Analisis butir tes memungkinkan kita memperoleh informasi mengenai baik
tidaknya suatu butir, sekaligus memperoleh petunjuk untuk melakukan perbaikan.
Penganalisisan terhadap butir-butir soal dapat dilakukan
dari tiga segi yaitu:
1.
Teknik
analisis kesukaran item soal
Analisis tingkat kesukaran soal yaitu mengkaji soal-soal
tes dari segi kesulitannya sehingga dapat diperoleh soal-soal mana yang
termasuk mudah, sedang, dan sukar. Tingkat kesukaran soal dipandang dari
kesanggupan atau kemampuan siswa dalam menjawab, bukan dilihat dari sudut guru
sebagai pembuat soal.
2.
Teknik
analisis daya pembeda
Daya pembeda item adalah kemampuan suatu butir item tes
hasil belajar untuk dapat membedakan (mendiskriminasi) antara kemampuan tinggi
dan rendah. Daya pembeda item itu penting sekali bagi salah satu dasar untuk
menyusun butir item tes hasil belajar.
3.
Teknik
analisis fungsi distraktor
Distraktor adalah pengecoh, jawaban-jawaban yang
mengecoh. Ini bertujuan menarik untuk menjawabnya padahal itu salah. Sebagai
tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut maka
distraktor yang sudah menjalankan fungsinya dengan baik dapat dipakai lagi pada
tesnya.
B. Saran
Analisis butir soal hendaknya kita lakukan untuk dapat
mengidentifikasi butir-butir tes secara baik dan tepat dan dapat memahami
informasi yang diperoleh untuk melakukan perbaikan.
DAFTAR PUSTAKA
Arikunto, Suharsimi. Dasar-dasar
Evaluasi Pendidikan. Jakarta : PT. Bumi Aksara. 2006.
Purwanto, M.
Ngalim. Prinsip- Prinsip dan Teknik Evaluasi Pengajaran. Bandung : Remaja Rosdakarya. 2002.
Purwanto. Evaluasi Hasil Belajar. Yogyakarta : Pustaka
Pelajar. 2009.
Sudijono, Anas. Pengantar
Evaluasi Pendidikan. Jakarta : Rajawali Pers. 2011.
Wahidmurni, dkk. Evaluasi Pembelajaran : Kompetensi dan
Praktik. Yogyakarta : Nuha Litera. 2010.
[2] M. Ngalim Purwanto, Prinsip- Prinsip dan
Teknik Evaluasi Pengajaran, (Bandung
: Remaja Rosdakarya, 2002), hlm. 118
[3] Wahidmurni, dkk, Evaluasi Pembelajaran : Kompetensi
dan Praktik, (Yogyakarta : Nuha Litera, 2010), hlm. 117.
[8] Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan,
(Jakarta : PT. Bumi Aksara, 2006), hlm. 207.
[28]
Suharsimi Arikunto, Op. Cit, hlm. 220
[30] Anas Sudijono, Op.Cit,
hlm. 412-413.
Tidak ada komentar:
Posting Komentar