Pengujian Reliabilitas Tes
PENDAHULUAN
Sebuah tes sanggup dikatakan mempunyai tingkat doktrin yang tinggi kalau tes tersebut sanggup memperlihatkan hasil yang tetap apabila diujikan berulang kali. Sehingga sanggup dikatakan bahwa reliabilitas berkaitan dengan ketetapan hasil tes. Seandainya karenanya berubah, perubahan yang terjadi sanggup dikatan tidak berarti.
Dalam penilaian pendidikan, yang disebut “ajeg” atau “tetap” tidak selalu harus sama, tetapi mengikuti perubahan secara tetap. Sebagai contoh, kalau keadaan si A mula-mula berada lebih tinggi dari pada si B, maka kalau dilakukan pengukuran ulang, si A juga berada lebih tinggi dari B. Itulah yang disebut ajeg atau tetap, yaitu mempunyai kedudukan yang sama. Tentunya tidak dituntut semuanya tetap. Besarnya ketetapan itulah memperlihatkan tingginya reabilitas instrumen.
Cara-cara mencari besarnya reliabilitas
1. Metode bentuk paralel (Equivalent)[1]
Tes paralel atau tes ekuivalen yakni dua buah tes yang mempuyai kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir-butir soalnya berbeda.
Dua buah tes yang paralel, contohnya Bahasa Inggris seri A yang akan dicari realibilitasnya dan tes seri B diteskan kepada sekelompok siswa yang sama. Setelah itu, hasil keduanya dikorelasikan. Koefisien hubungan dari kedua hasil tes inilah yang memperlihatkan koefisien reabilitas tes seri A. Jika koefisiennya tinggi maka tes tersebut sanggup dikatakan reliabel.
2. Metode tes ulang (Test-retest Method)
Dalam memakai metode ini, pengetes hanya mempunyai satu seri tes, tetapi dicobakan dua kali. Kemudian hasil dari kedua kali tes tersebut dihitung korelasinya.
Pada umumnya hasil tes kedua cenderung lebih baik dari pada hasil tes pertama. Hal ini tidak jadi persoalan alasannya pengetes harus menyadari akan adanya practice effect dan carry over effect. Yang penting adanya kesejajaran hasil. Sebagai contoh:
Siswa | Tes Pertama | Tes Kedua | ||
Skor | Ranking | Skor | Ranking | |
A | 75 | 3 | 80 | 3 |
B | 60 | 5 | 65 | 5 |
C | 80 | 2 | 85 | 2 |
D | 88 | 1 | 95 | 1 |
E | 65 | 4 | 72 | 4 |
Walaupun tampak skornya naik, namun kenaikannya dialami semua siswa.
Metode ini juga dikenal sebagai hubungan diri sendiri (self-correlation method) karena mengkorelasikan hasil dari tes yang sama.
3. Metode belah dua (Split-half Method)
Berbeda dengan metode bentuk paralel dan tes ulang, metode belah dua hanya memakai sebuah tes dan dicobakan satu kali. Metode ini disebut juga single-test-trial-method.
Ada dua cara membelah butir soal, yaitu:
a. Membelah item-item genap dan item-item ganjil yang selanjutnya disebut penggalan ganjil-genap.
b. Membelah item-item awal dan item-item final yaitu separuh jumlah pada nomor-nomor awal dan separuh jumlah nomor-nomor akhir.
Contoh
No | Nama | Nomor Item | Skor Total | 1,3,5,7 | 2,4,6,8 | 1,2,3,4 | 5,6,7,8 | |||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | Ganjil | Genap | Awal | Akhir | |||
1 | Fatih | 1 | 1 | 0 | 1 | 0 | 0 | 1 | 1 | 5 | 2 | 3 | 3 | 2 |
2 | Aditya | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 7 | 4 | 3 | 4 | 3 |
3 | Zahra | 1 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 4 | 3 | 1 | 2 | 2 |
4 | Abbas | 1 | 0 | 0 | 1 | 1 | 0 | 1 | 1 | 5 | 3 | 2 | 2 | 3 |
5 | Adela | 1 | 1 | 1 | 0 | 1 | 1 | 1 | 0 | 6 | 4 | 2 | 3 | 3 |
Pembelahannya hanya menentukan salah satu saja, kemudian dihitung dengan hubungan product moment.
a. Pembelahan ganjil-genap.
No | Nama | 1,3,5,7 | 2,4,6,8 | Ʃxy | 1,3,5,7 | 2,4,6,8 |
Ganjil (x) | Genap (y) | Ganjil (x2) | Genap (y2) | |||
1 | Fatih | 2 | 3 | 6 | 4 | 9 |
2 | Aditya | 4 | 3 | 12 | 16 | 9 |
3 | Zahra | 3 | 1 | 3 | 9 | 1 |
4 | Abbas | 3 | 2 | 6 | 9 | 4 |
5 | Adela | 4 | 2 | 8 | 16 | 4 |
Ʃ | 16 | 11 | 35 | 53 | 27 |
Selanjutnya dihitung dengan rumus hubungan product moment.[2]
Setelah dihitung dengan rumus hubungan product moment dengan angka berangasan diketahui bahwa rxy = -0,479. Nilai tersebut gres memperlihatkan reliabilitas separuh tes. Oleh alasannya itu, kemudian dihitung reliabilitas instrumen dengan rumus Spearman-Brown.[3]
r11 = 2 rxy
1+ rxy
r11 = 2 (-0,479) -0,958
1 – (-0,479) 1,479
= 0,676
b. Pembelahan awal-akhir.
Menggunakan rumus Flanagan
Sebelum memakai rumus Flanagan, kita harus menganalisis butir dengan teknik belah dua.[4]
r11 = 2 (1- V1 – V2)
Vt
r11 = reliabilitas instrumen
V1 = varians penggalan pertama
V2 = varians penggalan kedua
Vt = varians skor total
Untuk semua varians rumusnya adalah:
(ƩX)2
= ƩX2 - N
N
Dengan memakai tabel analisis butir yang disajikan untuk perhitungan dengan rumus Spearman-Brown diketahui harga:
V1 = 3,6399
V2 = 4,8099
V3 = 7, 4899
Maka data tersebut dimasukkan ke rumus
r11 = 2 (1 - 3,6399 - 4,8099)
7, 4899
= 2 (1 - -1,1109 = 2 (1 – (-0,1483)
7, 4899
= 2 x 1,1483
= 0,2966
Apabilah harga r11 ini dikonsultasikan dengan tabel product moment ternyata karenanya lebih kecil dari harga rt yang diharapkan, maka sanggup disimpulkan bahwa instrumen tersebut tidak reliabel.
KESIMPULAN
Ada dua cara untuk menguji realibilitas eksternal suatu instrumen yaitu dengan teknik paralel dan teknik ulang.
Kalau realibilitas eksternal diperoleh dengan cara mengolah hasil pengetesan yang berbeda, reliabilitas internal diperoleh dengan cara menganalis data dari satu kali hasil pengetesan. Ada beberapa macam cara mengetahui realibilitas internal, contohnya dengan memakai rumus Spearman-Brown dan Flanagan.
DAFTAR PUSTAKA
Arikunto, Suharsimi, Dasar-dasar Evaluasi Pendidikan Ed. 2, Jakarta: Bumi Aksara, 2012
-------------------------, Prosedur Penelitian Edisi Revisi 2010, Jakarta: Rieneka Cipta, 2010