ANALISIS BUTIR SOAL PENDIDIKAN AGAMA ISLAM KELAS IX
SEMESTER I
Abstrak:
Tujuan penelitian ini adalah untuk mengetahui analisis butir soal (tingkat kesukaran butir soal, daya
pembeda butir soal, validitas butir soal, dan reliabilitas butir soal). Penelitian ini menggunakan metode kuantitatif dengan bantuan
program Excel. Teknik pengumpulan data yang dilakukan adalah teknik dokumen. Dokumen
berupa lembar jawaban soal Pendidikan Agama Islam Kelas IX Semester I berjumlah
27 lembar dengan 35 butir soal tes berbentuk pilihan
ganda. Hasil penelitian ini adalah; 1) Hasil uji taraf kesukaran, pada bentuk
soal pilihan ganda yang termasuk soal sukar berjumlah 3 butir (3%), soal yang
sedang berjumlah 13 butir (37%), dan soal yang mudah berjumlah 21 butir (60%).
Bahwa butir soal tersebut memiliki yang tingkat kesukaran yang tidak berimbang.
2) Hasil uji daya beda, pada bentuk
soal pilihan ganda yang termasuk soal dengan daya bedanya jelek terdiri dari 11 butir
soal (31%), soal dengan daya beda cukup
berjumlah 8 butir soal (23%),
soal dengan daya beda baik berjumlah 13
butir soal (37%), dan daya beda baik sekali berjumlah 3 butir soal (9%). Memperoleh hasil bahwa soal tersebut memiliki kualitas daya beda soal
yang kurang baik. 3) Hasil uji validitas yang didapatkan dari 35 butir soal, ada 23 soal
yang valid dan 12 soal yang tidak valid. Berarti tes valid. 4) . Hasil uji reliabilitas, pada bentuk soal pilihan ganda menunjukkan
indeks reliabilitas pada angka 0,9101 dengan kategori sangat tinggi. Hasil tersebut menunjukkan bahwa bentuk soal termasuk dalam
kategori reliabel.
Kata Kunci: Tingkat Kesukaran, Daya Pembeda, Validitas,
dan Reliabilitas
A. Pendahuluan
Peraturan pemerintah Nomor 55 Tahun
2007 menyatakan bahwa pengelolaan Pendidikan Agama dan Pendidikan Keagamaan
berada pada Kementrian Agama. Pada Lampiran KMA No 211 Tahun 2011 dijelaskan
bahwa penilaian yang digunakan untuk mengukur ketercapaian tujuan PAI adalah
dalam rangka membentuk manusia yang beriman, bertaqwa, dan berakhlak mulia.
Penilaian Pendidikan Agama Islam oleh pendidik dilakukan secara
berkesinambungan yang bertujuan untuk memantau proses dan kemajuan belajar
peserta didik serta untuk meningkatkan efektifitas dan efisiensi kegiatan
pembelajaran
Proses pelaksanaan proses
pembelajaran dan penguasaan siswa terhadap mata pelajaran Pendidikan Agama
Islam perlu dievaluasi, terutama alat ukur atau instrumennya. Evaluasi
yang didefinifisikan oleh
Keberhasilan kegiatan evaluasi hasil
belajar di sekolah sangat tergantung pada pembuatan soal, pelaksanaan ujian,
serta mengolah hasil ujian tersebut. Dengan demikian, kemampuan dalam membuat
soal yang baik merupakan salah satu faktor yang berpengaruh terhadap
keberhasilan kegiatan evaluasi di sekolah.
Salah satu cara untuk memperbaiki proses belajar mengajar yang paling
efektif ialah dengan jalan mengevaluasi tes hasil belajar yang diperoleh dari
proses belajar mengajar itu sendiri. Sebagaimana diketahui bahwa tes bisa
berbentuk tertulis, lisan atau perbuatan (Anida, 2018:2). Maka
tes harus memenuhi persyaratan. Jadi uraian
berikut termasuk serial analisis hasil tes. Ada 4 cara menilai tes yaitu
pertama meneliti secara jujur soal-soal yang sudah disusun, kedua mengadakan
analisis soal (item analysis), ketiga checking validitas dan keempat checking
reliabilitas. Dari keempat cara tersebut di atas, tulisan ini menguraikan cara
kedua yaitu item analisis soal yang terdiri dari empat hal
yaitu taraf kesukaran, daya pembeda soal, validitas dan reliabilitas butir soal. Tulisan ini secara berurutan membahas empat hal
tersebut.
Analisis butir soal adalah kegiatan mengkaji pertanyaan tes agar diperoleh
pertanyaan yang memiliki kualitas memadai. Tujuan kegiatan ini yaitu untuk
mengkaji dan menelaah setiap butir soal juga bertujuan untuk membantu meningkatkan
tes melalui revisi atau membuang soal yang tidak efektif, serta untuk
mengetahui informasi diagnostik pada siswa apakah mereka memahami materi yang
telah diajarkan. Soal yang berkualitas yaitu soal yang dapat memberi informasi
setepat-tepatnya sesuai dengan tujuannya, diantaranya dapat menentukan siswa
yang sudah ataupun belum menguasai materi yang diajarkan guru (Sudjana,
2014:135).
Butir yang baik adalah butir-butir yang karakteristiknya memenuhi syarat
sebagaimana kriteria karakteristik butir yang baik. Analisis butir akan
menggugurkan sebagian butir yang dianalisis karena karakteristiknya tidak
memenuhi syarat sebagai butir yang baik sehingga tidak mempunyai kemampuan mengukur
hasil belajar dengan baik (Purwanto, 2016:97). Analisis yang perlu dilakukan
bagi seorang pendidik adalah analisis butir soal. Kegiatan analisis butir soal
merupakan salah satu bagian kegiatan terpenting dalam penyusunan soal agar
diperoleh butir soal yang bermutu.
Tujuan kegiatan analisis butir soal menurut Aiken dalam Kusaeri (2012:163)
adalah mengkaji, meneliti dan menelaah setiap butir soal agar diperoleh soal
yang bermutu sebelum digunakan, untuk meningkatkan kualitas butir tes perlu
dilakukan revisi atau membuang soal yang tidak efektif, serta mengetahui
informasi diagnostik pada siswa apakah mereka telah memahami materi yang telah
diajarkan. Soal yang bermutu adalah soal yang dapat memberikan informasi
setepat-tepatnya tentang siswa yang telah menguasai materi dan siswa yang belum
menguasai materi. Untuk menganalisa butir soal berdasarkan teori klasik
setidaknya terdapat empat langkah yaitu kesukaran butir soal, daya pembeda,
validitas dan reliabilitas.
Tingkat kesukaran soal merupakan
pengukuran seberapa besar derajat kesukaran soal. Suatu soal dikatakan baik,
apabila memiliki tingkat kesukaran soal yang seimbang (proporsional) dalam
artian soal tersebut tidak terlalu mudah atau terlalu sukar (Arifin, 2013:266).
Saifudin Azwar (2006:129) mengatakan
bahwa tingkat kesukaran butir soal adalah proporsi antara banyaknya
peserta tes yang menjawab butir soal dengan benar dengan banyaknya
peserta tes. Hal ini berarti makin banyak peserta tes yang menjawab butir soal
dengan benar maka makin besar indeks tingkat kesukaran, yang berarti makin
mudah butir soal itu. Sebaliknya makin sedikit peserta tes yang menjawab butir
soal dengan benar maka soal tersebut makin sukar.
Dali S. Naga (2002:67) mengatakan
bahwa daya pembeda soal adalah kemampuan soal dengan skornya dapat membedakan
peserta tes dari kelompok tinggi dan kelompok rendah. Dengan kata lain makin
tinggi daya pembeda soal makin banyak peserta dari kelompok tinggi yang dapat
menjawab soal dengan benar dan makin sedikit peserta tes dari kelompok rendah
yang dapat menjawab soal dengan benar.
Validitas tes yaitu ketepatan pengukuran yang dimiliki oleh butir soal
dalam mengukur apa yang seharusnya diukur lewat butir soal tersebut. Butir soal
dikatakan memiliki validitas yang tinggi apabila terdapat korelasi positif yang
signifikan antara skor butir soal dan skor totalnya. Skor butir soal disini
berkedudukan sebagai variabel bebas dan skor total berkedudukan sebagai
variabel terikat. Setiap butir soal yang dijawab salah diberi skor nol (0).
Jenis data tersebut dalam ilmu statistik dikenal dengan nama data diskret murni
atau dikotomik. Skor total merupakan hasil penjumlahan dari setiap skor butir
soal (misalnya: 1+0+1+1+0 = 3) yang merupakan data kontinyu.
Sedangkan reliabilitas berkaitan dengan masalah kepercayaan. Suatu tes
dapat dikatakan memiliki taraf kepercayaan yang tinggi apabila tes tersebut
dapat memberikan hasil yang tetap. Seandainya hasil tersebut berubah-ubah, maka
perubahan yang terjadi dapat dikatakan tidak berarti. Pemahaman konsep
reliabilitas akan lebih mudah dimengerti apabila telah betul-betul memahami
konsep validitas. Tuntutan bahwa instrument evaluasi harus valid menyangkut
harapan diperolehnya data yang valid, sesuai dengan kenyataan. Dalam hal ini
reliabilitas tuntutannya tidak jauh berbeda. Jika validitas berkaitan dengan
ketepatan objek yang tidak lain adalah tidak menyimpangnya data dari kenyataan,
artinya bahwa data tersebut benar, maka konsep reliabilitas terkait dengan
pemotretan berkali-kali. Instrument yang baik adalah instrument yang dapat
dengan ajeg memberikan data yang sesuai dengan kenyataan.
Reliabilitas adalah derajat kekonsistenan/keajegan hasil penilaian dari
pengulangan suatu prosedur penilaian. Derajat reliabilitas hasil menentukan
tingkat kepercayaan (confidence) terhadap hasi yang dicapai. Reliabilitas suatu
hasil penilaian tidak menjamin validitas hasil penilaian. Hanya saja
reliabilitas meningkatkan kepercayaan dalam keputusan terkait hasil-hasil
penilaian.
Butir soal yang baik adalah yang tidak terlalu mudah atau terlalu sukar.
Apabila butir soal yang terlalu mudah atau terlalu sukar maka butir soal tersebut
tidak dapat mencerminkan capaian hasil pembelajaran yang dilakukan. Soal yang terlalu mudah tidak merangsang
siswa untuk mempertinggi usaha untuk memecahkannya. Sebaliknya soal yang
terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai
semangat untuk mencoba lagi karena diluar jangkauannya. Daya pembeda adalah
kemampuan suatu soal untuk membedakan antara siswa yang pandai (berkemampuan
tinggi) dengan siswa yang bodoh (berkemampuan rendah). Angka yang menunjukkan
besarnya daya pembeda disebut indeks deskriminasi (daya pembeda) ini berkisar
anatara 0,00 sampai 1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda
negatif (-), tetapi pada indeks deskriminasi ada tanda negatif. Tanda negatif
pada indeks deskriminasi digunakan jika sesuatu soal “terbalik” menunjukkan
kualitas testee (Ihwan Mahmudi, 2020:121-123).
Nama lain dari reliabilitas adalah
ketetapan, kepercayaan, kemantapan, keterandalan, keajegan atau kestabilan.
Sedangkan yang dimaksud dengan reliabilitas tes adalah sebagai berikut: menurut
Anne Anastasi dan Susan Urbina (2007:63), reliabilitas tes adalah kestabilan
skor yang diperoleh dari orang yang sama
ketika diuji ulang dengan tes yang sama pada situasi yang berbeda. Suatu tes
dikatakan reliabel jika hasil tes sama pada seseorang walaupun telah diadakan
pengetesan ulang pada waktu yang berbeda
B. Metode Penelitian
Penelitian ini menggunakan metode
kuantitatif dengan bantuan program Excel. Teknik pengumpulan data yang dilakukan adalah
teknik dokumen. Dokumen berupa lembar jawaban soal Pendidikan Agama Islam Kelas
IX Semester I berjumlah 27 lembar dengan 35 butir soal tes berbentuk pilihan
ganda. Analisis
data dilakukan dengan terlebih dahulu melakukan koding hasil lembar jawab ke
dalam Excel dimana jawaban benar diberi nilai 1 dan jawaban salah diberi nilai
0. Setelah seluruh data terkoding dalam excel, selanjutnya dengan menggunakan
rumus matematis dicari taraf kesukaran (p) dan daya pembeda (D) tiap-tiap butir
soal. Nilai p ini berada pada interval 0 sampai dengan 1. Kemudian mencari validitas dan reliabilitas
butir soal.
C. Hasil dan Pembahasan
Hasil analisis butir soal mata pelajaran Pendidikan Agama Islam Kelas IX
adalah sebagai berikut:
a. Kesukaran Butir Soal
Bilangan yang menunjukkan sukar
mudahnya soal disebut indeks kesukaran (difficulty index) yang diberi
simbol dengan huruf P. Besarnya indeks kesukaran soal antara 0,00 sampai 1,0.
Semakin besar indeks kesukaran soal maka semakin mudah soal tersebut dan sebaliknya.
Rumus untuk mencari indeks kesukaran soal, yaitu:
![]()
Keterangan:
P = Indeks kesukaran soal
B = Banyaknya siswa yang menjawab soal benar
N = Jumlah
seluruh peserta tes
(Suharsimi Arikunto, 2013:223)
Kriteria yang digunakan untuk menginterpretasikan hasil perhitungan tingkat
kesukaran butir soal yakni: 0,00 – 0,30 ialah soal yang memiliki kategori
sukar, 0,31 – 0,70 ialah soal yang memiliki kategori sedang, 0,71 – 1,00 ialah
soal yang memiliki kategori mudah (Suharsimi Arikunto, 2013:225).
Berdasarkan hasil analisis dengan bantuan program Excel diketahui bahwa
soal Pendidikan Agama Islam Kelas IX Semester I dengan bentuk pilihan ganda
berjumlah 35 butir soal mendapatkan perincian sebagai berikut; Soal
berkategori sukar berjumlah 1 butir soal (3%), berkategori sedang berjumlah 13
butir soal (37%) dan berkategori mudah berjumlah 21 butir soal (60%)
Dari hasil analisis soal diatas,
maka distribusi ke 35 butir s oal berdasarkan tingkat kesukaran dapat dikategorikan dalam tabel
berikut ini:
Tabel 1 Distribusi
Butir Soal Berdasarkan Tingkat Kesukaran
|
No. |
Taraf Sukar |
Butir Soal |
Jumlah |
Persentase |
|
1. |
0,00-0,30 (Sukar) |
3 |
1 |
3% |
|
2. |
0,31-0,70 (Sedang) |
4, 5, 9, 11, 16, 18, 23, 24, 26, 27, 28, 33, 34 |
13 |
37% |
|
3. |
0,71-1,00 (Mudah) |
1, 2, 7, 8, 10, 11, 12, 13, 14, 15, 17, 19, 20, 21, 22,
25, 30, 31, 32, 35 |
21 |
60% |
Dari presentase tabel distribusi
butir soal di atas, dapat diketahui bahwa di lihat dari tingkat kesukaran
terdapat 21 butir soal dengan kategori soal mudah, 13
butir soal dengan kategori soal sedang dan 1
butir soal dengan kategori sukar. Lebih lanjut dinyatakan bahwanya, sebaiknya digunakan
butir soal yang tingkat kesukarannya berimbang yaitu 25 % = Mudah, 50 % =
sedang, dan 25 % = Sukar (Sunarti, :138). Maka
berdasarkan pemaparan diatas, dapat disimpulkan bahwa soal PAI Kelas IX Semester I yang digunakan dapat dikatakan tidak berimbang.
b. Daya Pembeda
Perhitungan daya beda dilakukan dengan program Microsoft Exel dengan
membagi subjek menjadi dua bagian 50% kelompok atas dan 50% kelompok bawah.
Penafsiran yang digunakan untuk menginterpretasikan hasil perhitungan daya beda
butir soal yakni: 0,00 - 0,20 ialah soal yang memiliki kategori jelek, 0,20 –
0,40 ialah soal yang memiliki kategori cukup, 0,40 – 0,70 ialah soal yang memiliki
kategori baik, 0,70 – 1,00 ialah soal yang memiliki kategori baik sekali.
Sedangkan rumus untuk mencari daya pembeda sebagai berikut:
D =
PA – PB
Keterangan:
D =
Daya Pembeda tes
PA
= Proporsi Kelompok Atas
PB
= Proporsi Kelompok Bawah
Besarnya daya pembeda ditunjukkan
dengan indeks diskriminasi atau daya pembeda dengan menggunakan simbol D.
Kisaran indeks daya pembeda sama dengan indeks kesukaran soal yaitu 0,00 sampai
1,00. Semakin tinggi indeks pembeda soal, maka soal tersebut mampu membedakan
antara siswa
yang pintar dengan siswa yang kurang pintar. Tanda negatif yang dijumpai pada
perhitungan indeks diskriminasi soal menunjukkan bahwa soal menggambarkan
kualitas peserta tes secara terbalik, dimana siswa pandai disebut bodoh dan
siswa bodoh disebut pandai (Suharsimi Arikunto, 2016:226). Untuk menghitung indeks daya pembeda soal, peserta harus dikelompok
terlebih dahulu ke dalam dua kelompok yaitu kelompok pandai-bodoh atau kelompok
atas-bawah. Atau upper group dan lower group.
Berdasarkan hasil analisis dengan bantuan program Microsoft Exel diketahui
bahwa Soal Mata Pelajaran Pendidikan Agama Islam kelas IX Semester I dengan
bentuk soal pilihan ganda berjumlah 35 butir soal mendapatkan hasil perincian
sebagai berikut, soal berkategori jelek berjumlah 11 butir soal (31%),
berkategori cukup berjumlah 8 butir soal (23%), berkategori baik berjumlah 13
butir soal (37%), berkategori baik sekali berjumlah 3 butir soal (9%).
Dari hasil analisis soal diatas,
maka distribusi ke 35 butir soal berdasarkan daya pembeda
dapat dikategorikan dalam tabel berikut ini:
Tabel 2 Distribusi
Butir Soal Berdasarkan Daya Beda Soal
|
No. |
Daya Beda |
Butir Soal |
Jumlah |
Persentase |
|
1. |
0,00-0,20 (Jelek) |
1, 2, 8, 10, 15, 16, 17, 21, 30, 31, 32 |
11 |
31% |
|
2. |
0,21-0,40 (Cukup) |
6, 13, 14, 20, 22, 27, 28, 35 |
8 |
23% |
|
3. |
0,41-0,70 (Baik) |
3, 4, 5, 9, 11, 12, 18, 19, 24, 25, 29, 33, 34 |
13 |
37% |
|
4. |
0,71-1,00 (Sangat Baik) |
7, 23, 26 |
3 |
9% |
Dari presentase tabel distribusi butir soal di atas, dapat diketahui bahwa
di lihat dari daya pembeda terdapat 11 butir soal dengan kategori soal jelek, 8
butir soal dengan kategori soal cukup, 13 butir soal dengan kategori soal baik
dan 3 butir soal dengan kategori sangat baik. Lebih lanjut menurut pemaparan
Sukiman dalam artikel (Taufiq, 2018:16) bahwa kriteria daya beda soal dapat
dikategorikan dengan presentase sebagai berikut: 0-25,9% termasuk kategori
jelek, 26-50,99% termasuk kategori cukup, 59-75,99% termasuk kategori baik,
76-100% termasuk kategori baik sekali. Maka
berdasarkan pemaparan diatas, dapat disimpulkan bahwa soal memiliki kualitas daya beda soal yang
kurang baik.
c. Validitas Butir Soal
Uji validitas butir soal menggunakan korelasi. Rumus validitas sebagai
berikut: ![]()
Keterangan:
= Koefisien korelasi antara variabel X dan
variabel Y
= jumlah perkalian variabel x dan y
=
jumlah dari kuadrat nilai X
= jumlah dari kuadrat nilai Y
=
jumlah nilai x kemudian dikuadratkan
= jumlah nilai y kemudian dikuadratkan
Soal dikatakan valid jika nilai
korelasi r > rtabel dengan taraf signifikan 5 %. Hasil yang
didapatkan dari 35 butir soal, ada 23 soal yang valid dan 12 soal yang tidak
valid. Jadi, termasuk valid karena lebih banyak jumlah soal yang valid.
Tabel 3 Hasil Validasi Empiris Setiap Butir Soal
|
Nomor Soal |
Nilai r hitung |
Nilai r tabel |
Kategori |
|
1 |
0,014 |
0,396 |
Tidak Valid |
|
2 |
0,000 |
0,396 |
Tidak Valid |
|
3 |
0,676 |
0,396 |
Valid |
|
4 |
0,759 |
0,396 |
Valid |
|
5 |
0,725 |
0,396 |
Valid |
|
6 |
0,131 |
0,396 |
Tidak Valid |
|
7 |
0,650 |
0,396 |
Valid |
|
8 |
0,061 |
0,396 |
Valid |
|
9 |
0,746 |
0,396 |
Valid |
|
10 |
0,183 |
0,396 |
Tidak Valid |
|
11 |
0,607 |
0,396 |
Valid |
|
12 |
0,582 |
0,396 |
Valid |
|
13 |
0,432 |
0,396 |
Valid |
|
14 |
0,459 |
0,396 |
Valid |
|
15 |
0,500 |
0,396 |
Valid |
|
16 |
0,083 |
0,396 |
Tidak Valid |
|
17 |
0,464 |
0,396 |
Valid |
|
18 |
0,743 |
0,396 |
Valid |
|
19 |
0,650 |
0,396 |
Valid |
|
20 |
0,210 |
0,396 |
Tidak Valid |
|
21 |
0,155 |
0,396 |
Tidak Valid |
|
22 |
0,678 |
0,396 |
Valid |
|
23 |
0,794 |
0,396 |
Valid |
|
24 |
0,673 |
0,396 |
Valid |
|
25 |
0,704 |
0,396 |
Valid |
|
26 |
0,740 |
0,396 |
Valid |
|
27 |
0,672 |
0,396 |
Valid |
|
28 |
0,266 |
0,396 |
Tidak Valid |
|
29 |
0,339 |
0,396 |
Tidak Valid |
|
30 |
0,352 |
0,396 |
Tidak Valid |
|
31 |
0,000 |
0,396 |
Tidak Valid |
|
32 |
0,070 |
0,396 |
Tidak Valid |
|
33 |
0,728 |
0,396 |
Valid |
|
34 |
0,516 |
0,396 |
Valid |
|
35 |
0,615 |
0,396 |
Valid |
d. Reliabilitas Butir Soal
Nama lain dari reliabilitas adalah
ketetapan, kepercayaan, kemantapan, keterandalan, keajegan atau kestabilan.
Sedangkan yang dimaksud dengan reliabilitas tes adalah sebagai berikut: menurut
Anne Anastasi dan Susan Urbina (2007:63), reliabilitas tes adalah kestabilan
skor yang diperoleh dari orang. Reliabilitas
suatu tes adalah keajegan suatu tes. Tes dikatakan reliabel apabila menunjukkan
hasil yang sama walaupun dilakukan tes berulang ulang. Reliabilitas dinyatakan
dengan angka dan dikenal sebagai koefisiensi reliabilitas. Makin tinggi
koefisien reliabilitas sebuah tes makin tinggi pula reliabilitas tes tersebut (Hanifah, 2014:47-48).
Rumus reliabilitas tes yaitu sebagai berikut:
Rumus Alpha, sebagai berikut:

Sedangkan rumus varians yang digunakan untuk menghitung
reliabilitas, sebagai berikut:

S2 = varians, selalu dituliskan dalam bentuk kuadrat,
karena standar deviasi kuadrat
= Kuadrat jumlah skor yang diperolah siswa
= Jumlah kuadrat skor yang diperolah siswa
N = banyaknya subjek yang mengikuti tes
Klasifikasi tingkat reliabilitas yakni, koefisien korelasi 0,800-1,000
masuk kategori sangat tinggi, 0,600-0,799 termasuk kategori tinggi, 0,400-0,599
termasuk kategori cukup, 0,200-0,399 termasuk kategori rendah, dan 0,000-0,199
t ermasuk kategori sanbgat rendah
(Elviana, 2020:71).
Dari hasil yang diperoleh melalui program Excel reliabilitas
soal PAI yaitu sebesar 0,9101 sesuai
dengan klasifikasi pada tabel di atas masuk dalam kategori sangat tinggi karena
dalam rentang 0,800-1,000. Berarti tes soal PAI
ini mempunyai koefisien yang baik dalam mengukur kemampuan mahasiswa. Hasil
pengukuran harus reliabel artinya harus memiliki tingkat konsistensi dan
kemampuan. Suatu alat tes dikatakan reliabel apabila alat tes tersebut dapat
dipercaya, konsisten, atau tetap.
D. Kesimpulan
Berdasarkan hasil analisis butir soal yang terdiri dari tingkat
kesukaran, daya pembeda, dan termasuk soal yang kurang/tidak berkualitas.
Berikut ini kesimpulan analisis butir soal:
1. Hasil uji taraf kesukaran, pada bentuk soal
pilihan ganda yang termasuk soal sukar berjumlah 3 butir (3%), soal yang
sedang berjumlah 13 butir (37%), dan soal yang
mudah berjumlah 21 butir (60%). Jadi
berdasarkan pada presentase tingkat kesukaran yang berimbang yaitu 25 % mudah,
50 % sedang, dan 25 % sukar, diperoleh hasil bahwa butir soal tersebut memiliki
yang tingkat kesukaran yang tidak berimbang.
2.
Hasil uji daya beda, pada bentuk soal pilihan
ganda yang termasuk soal dengan daya bedanya jelek terdiri dari 11 butir soal (31%), soal dengan daya beda cukup berjumlah 8 butir soal (23%), soal dengan daya beda baik berjumlah 13 butir soal (37%), dan soal dengan daya beda baik sekali berjumlah 3 butir soal
(9%). Memperoleh hasil bahwa
soal tersebut memiliki kualitas daya beda soal yang kurang baik.
3. Hasil uji validitas yang didapatkan dari 35 butir
soal, ada 23 soal yang valid dan 12 soal yang tidak valid.
4. Hasil uji reliabilitas, pada bentuk soal pilihan ganda menunjukkan
indeks reliabilitas pada angka 0,9101 dengan kategori sangat tinggi. Hasil tersebut menunjukkan bahwa bentuk soal
termasuk dalam kategori reliabel karena nilai
0,70.
Daftar Pustaka
Anida Rahmaini, A. N. (2018).
Analisis Butir Soal Pendidikan Agama Islam di SMKN 1 Sedayu Tahun Ajaran
2017/2018. Jurnal MUDARRISUNA, 8 (1), Januari-Juni , 1-24.
Arifin, Z. (2013). Evaluasi Pembelajaran. Bandung: Remaja
Rosdakarya.
Arikunto, S. (2016). Dasar-dasar Evaluasi Pendidikan. Jakarta:
Bumi Aksara.
Asrul, R. A. (2015). Evaluasi Pembelajaran. Bandung: Cita Pustaka
Media.
Azwar, S. (2006). Tes Prestasi. Yogyakarta: Pustaka Belajar.
Elviana. (2020). Analisis Butir Soal Evaluasi Pembelajaran Pendidikan
Agama Islam Menggunakan Program Anates. Jurnal MUDARRISUNA, 10 (2) April-Juni , 58-74.
Fakhruddin, S. A. (2016). Pelaksanaan Standar Penilaian oleh Guru
Pendidikan Agama Islam di Sekolah (Studi Evaluatif terhadap Guru PAI di SMP dan SMA di
Bandung). Jurnal Pendidikan Agama Islam - Ta'lim, 146-147.
Hanifah, H. (2014). Perbandingan Tingkat Kesukaran, Daya Pembeda Butir
Soal Dan Reliabilitas Tes Bentuk Pilihan Ganda Biasa Dan Pilihan Ganda
Asosiasi Mata Pelajaran Ekonomi. SOSIO e-KONS, 6 (1) , 41-55.
Ihwan Mahmudi, R. R. (2020). Item Analysis of Islamic Education For
Class VIII at Junior High Scholl 1 Jetis Ponorogo. Educan:Jurnal
Pendidikan Islam, 4 (1), Februari, 119-135.
Naga, D. S. (2002). Pengantar Teori Skor pada Pengukuran Pendidikan.
Jakarta : Gunadarma.
Purwanto. (2016). Evaluasi Hasil Belajar. Yogyakarta: Pustaka
Pelajar.
Sudjana, N. (1984:8). Dasar-Dasar Peralatan Ilmu Belajar.
Jakarta: Serajaya.
Sudjana, N. (2014). Penilaian Hasil Proses Belajar Mengajar.
Bandung: PT Remaja Rosdakarya.
Suparnanto, K. (2012). Pengukuran dan Penilaian Pendidikan.
Yogyakarta: Graha Ilmu.
Tidak ada komentar:
Posting Komentar