Senin, 22 Oktober 2012

Menggunakan Model DINA Dalam Pengembangan Tes Diagnostik Untuk Mendeteksi Salah Konsepsi


Ketika anak memasuki bangku kelas VII SMP, mereka dihadapkan pada rumpun matematika baru, yaitu aljabar. Materi ini sebagai pengembangan dari aritmetika yang dipelajarinya sewaktu di sekolah dasar. Menurut Rakes (2010:44-45), anak yang awal dalam belajar aljabar akan menghadapi berbagai kendala, paling tidak berasal dari dua sumber.
Pertama, mempelajari aljabar menuntut anak mempelajari bahasa simbol matematika yang benar-benar asing dengan pengalaman sebelumnya. Pada aritmetika, anak banyak menghadapi dan memanipulasi simbol berupa angka. Dengan angka, anak dapat segera membayangkan seberapa besar yang disimbolkan.   Namun, aljabar tidak hanya menggunakan simbol angka, melainkan juga huruf ataupun kombinasi angka dan huruf. Berbagai cara simbol aljabar digunakan dan dideskripsikan oleh guru selama pembelajaran, sehingga sering kali menyebabkan anak kesulitan mengaitkan simbol aljabar dengan makna simbol yang dimaksud.
Kedua, aljabar merupakan pelajaran yang menuntut anak mengembangkan penalaran abstrak dan pemecahan masalah. Sifat aljabar yang demikian membuat aljabar lebih sulit bagi anak SMP dibandingkan aritmetika. Kenyataan ini mempengaruhi kemampuan anak mengkonstruk berbagai representasi objek aljabar, sehingga berdampak pada banyak konsep aljabar dipahaminya secara salah.
  Chi (2008:16) mengaitkan kendala yang dihadapi anak di atas dengan kemampuan awal (berupa aritmetika yang telah  dimiliki) dan mengklasifikasikan mereka dalam tiga kelompok.  Pertama, anak yang tidak memiliki pengetahuan awal  tentang aljabar. Walaupun mereka memiliki beberapa pengetahuan relevan yang dipelajarinya di aritmetika, namun pengetahuan itu tidak hadir (missing). Hal itu disebabkan objek yang dipelajari di aritmetika berbeda dengan objek aljabar. Dalam konteks demikian, belajar aljabar merupakan kegiatan menambah pengetahuan baru. Kedua, anak mungkin memiliki beberapa pengetahuan awal yang cukup tentang konsep aljabar yang dipelajari, namun pengetahuan awal itu tidak lengkap (incomplete). Dalam kondisi demikian, belajar aljabar dianggap sebagai proses pengisian celah (gap) terhadap konsep yang ada. Ketiga, anak memiliki bekal pengetahuan awal yang memadai terkait dengan aritmetika, namun pengetahuan awal itu berbeda dengan konsep yang sedang dipelajari. Dalam kondisi seperti ini, sangat mungkin terjadi perubahan konsep (conceptual change) yang telah dimilikinya, namun juga sangat mungkin terjadi salah konsepsi akibat adanya konflik antara konsep lama dengan konsep baru.



 Salah konsepsi terjadi apabila anak gagal menghubungkan pengetahuan baru dengan pengetahuan sebelumnya (Russel & O’dwyer, 2009:414). Salah konsepsi muncul ketika anak secara salah menerapkan strategi pengetahuan yang dipelajari sebelumnya guna menyelesaikan permasalahan baru. Salah konsepsi mempengaruhi secara mendasar bagaimana anak memahami konsep tertentu, sehingga menyebabkan terjadinya bentuk kesalahan lainnya. Dengan demikian, salah konsepsi pada anak harus dicegah, dieliminir dan bila perlu dihilangkan. Untuk mencegah atau mendeteksi terjadinya salah konsepsi, Booth (Xiabao Li, 2006) menyarankan agar diidentifikasi jenis kesalahan yang dilakukan anak serta dilakukan investigasi alasan-alasan munculnya kesalahan tersebut. Dalam kaitan inilah pentingnya dilakukan kegiatan diagnosis.
Kegiatan diagnosis bagi anak yang mengalami masalah belajar berbasis pada teori tes klasik (Classical Test Theory, CTT) dan teori respon butir (Item Response Theory, IRT) telah banyak dilakukan. Sejumlah penelitian  diagnosis berbasis keduanya telah dilakukan, seperti penelitian Sugiharto (2003), Fauzan  (2010), Waskito (2010), Suwarto (2011) dan Awal Isgiyanto (2011). Penelitian ini biasanya dilakukan melalui dua tahapan, yakni: (a) menetapkan skor masing-masing anak dan (b) menetapkan cut-off score (skor batas) yang tepat. Skor yang diperoleh masing-masing anak, selanjutnya dibandingkan dengan cut-off score yang telah ditetapkan. Kedua prosedur di atas, menurut Templin (2011) rawan muncul kesalahan sehingga mempengaruhi hasil yang didapat. Sumber kesalahan umumnya terletak pada penetapan cut-off score, karena hanya didasarkan pada estimasi semata.
Sebaliknya, penelitian diagnosis berbasis latent class belum banyak dilaku-kan. Prinsip dasar yang digunakan model ini adalah menempatkan peserta tes ke dalam satu dari dua kelompok, yakni kelompok menguasai (mastery) atau kelompok tidak menguasai (non-mastery). Hal ini menurut Templin (2011:43) lebih mudah dilakukan dibandingkan dengan menempatkan peserta tes pada sebuah skala. Salah satu model diagnosis berbasis latent class yang saat ini sedang berkembang dan banyak menarik kalangan peneliti di Amerika Serikat dan Eropa adalah model DINA.
DINA berasal dari kata “deterministic input, noisy, dan “AND” gate.” Komponen “deterministic inputmenggambarkan kemampuan seorang anak dalam menjawab suatu item (benar atau salah) didasarkan pada penguasaan mereka terhadap atribut yang diukur (Rupp et al., 2010:319). Atribut merupakan kemampuan atau kompetensi yang harus dimiliki anak agar mampu menyelesaikan suatu item (Kusaeri, 2012:17). Penguasaan terhadap atribut tersebut direpresentasi-kan dalam sebuah matriks Q, yaitu matriks dengan M baris dan N kolom yang unsur-unsur di dalamnya terdiri atas bilangan 0 dan 1. Unsur pada  matriks Q akan bernilai 1 apabila seorang anak menguasai semua atribut yang diperlukan menyelesaikan item tertentu. Sebaliknya,  bernilai 0 bila anak tidak menguasai salah satu atribut yang dipersyaratkan (Ying Liu et al., 2009:58; de la Torre et al., 2010:229).
 Komponen “noisy” berkaitan dengan parameter slip dan guessing. Artinya, seorang anak yang menguasai seluruh atribut pada item tertentu dapat slip dan menjawab salah. Sebaliknya, anak yang tidak menguasai atribut dapat menebak (guessing), dan menjawab item secara benar dengan probablilitas yang tidak nol (de la Torre, 2008:117; de la Torre & Karelitz, 2009:453).
Komponen terakhir adalah “AND gate,” merujuk pada proses konjungtif dalam menentukan jawaban benar pada suatu item memerlukan seluruh kemampuan yang dipersyaratkan item itu (de la Torre, 2008:117). Artinya, agar anak dapat menjawab benar suatu item, maka mereka harus menguasai seluruh atribut.
Berdasarkan uraian dan karakteristik yang dimiliki Model DINA tersebut,  menarik untuk mengembangkan tes diagnostik dengan menggunakan model DINA. Oleh karena itu, fokus tulisan ini adalah: (a) menguraikan tahap pengembangan tes diagnostik dengan model DINA; dan (b) mengidentifikasi karakteristik tes diagnos-tik yang baik yang dikembangkan dengan model DINA.

Metode Penelitian
Jenis penelitian ini adalah penelitian pengembangan, yakni mengembangkan tes diagnostik. Dalam prosesnya, dilakukan penelitian empirik. Penelitian empirik yang digunakan adalah penelitian deskriptif eksploratori. Penelitian deskriptif digunakan untuk menguraikan tahapan-tahapan pengembangan tes diagnostik. Eksploratori digunakan untuk mencari informasi berupa karakteristik item, meliputi item yang fit dengan model, tingkat kesukaran dan indeks daya beda item. 
Tes diagnostik dikembangkan melalui tujuh tahapan. Ketujuh tahapan itu dimulai dengan mengidentifikasi kompetensi dasar (KD) dan merumuskan indikator, menyusun learning continuum, menyusun hierarki materi, merumuskan atribut, mengonstruk soal, validasi ahli dan uji empirik. Langkah keempat yaitu merumuskan atribut merupakan langkah penting dalam proses pengembangan tes diagnostik berbasis model DINA. Langkah ini sebagai dasar dan acuan dalam mengembangkan item maupun membangun matriks Q. Sementara itu, langkah pertama hingga ketiga merupakan tahapan  awal yang harus dilakukan untuk mendapatkan atribut yang diperlukan.
Uji coba  dilakukan pada siswa kelas VIII SMP di 3 sekolah, yakni SMPN 1 Yogyakarta, SMPN 1 Sanden Bantul dan SMPN 1 Panjatan Kulon Progo. Pada uji coba ini diikuti 180 siswa, sehingga dapat dijaring 180 data berupa respon siswa. Tes diagnostik yang diuji cobakan berbentuk pilihan ganda dengan 4 pilihan jawab (option), 1 kunci jawab dan 3 pengecoh.
Data hasil uji coba dianalisis dengan menggunakan dua software komputer, yakni  program Mplus dan R.  Program Mplus yang digunakan adalah Mplus versi 6 dari Muthen & Muthen (2010) untuk uji fit model. Dalam pelaksanaanya, untuk membangkitkan syntax Mplus perlu dukungan program CDM (Cognitive Diagnostic Model) yang dikembangkan oleh Templin (2008). Sementara itu, program R versi 2.14.1 dari Venables & Smith (2011) digunakan untuk mengestimasi parameter item (berupa guessing dan slip).
Level parameter guessing dan slip yang digunakan dalam penelitian ini dimodifikasi de la Torre et al. (2010:234) yakni: (a) rendah, bila terletak pada interval 0,00 – 0,15; (b) sedang, bila terletak pada interval 0,16 – 0,25; (c) tinggi, bila terletak pada interval 0,26 – 0,40 dan (d) sangat tinggi, bila terletak pada interval 0,41 – 1. Level parameter slip dan guessing (rendah, sedang, tinggi, dan sangat tinggi) selanjutnya digunakan untuk menentukan tingkat kesukaran item, dengan  mengacu pada pendapat Zhang (2006:108). Menurut Zhang (2006) sebuah item memiliki tingkat kesukaran mudah apabila item itu memiliki parameter guessing tinggi/sangat tinggi dan slip rendah. Item yang sulit memiliki  parameter guessing rendah dan slip tinggi/sangat tinggi. Item dengan tingkat kesukaran sedang, memiliki parameter slip dan guessing rendah.
Hasil estimasi parameter guessing dan slip digunakan pula untuk menentukan indeks daya beda item (δi), dihitung dengan menggunakan formula: δi =  (1 – si) – gi. Simbol si menunjukan parameter slip dan gi parameter guessing. Indeks daya beda memberikan gambaran tentang kualitas item. Kriteria yang digunakan untuk menentukan kualitas item, mengikuti  pendapat Crocker & Algina (1986:315), yakni suatu item bila memiliki indeks daya beda: (a) baik, bila nilainya lebih dari sama dengan 0,40, (b) cukup bila nilainya terletak di antara 0,30 sampai dengan 0,39, (c) kurang, bila nilainya di antara 0,20 sampai dengan 0,29, dan (d) jelek, bila nilainya kurang dari sama dengan 0,19.
Hasil-hasil Pembahasan
A.     Hasil Pengembangan Tes Diagnostik
1.      Hasil Identifikasi KD dan Perumusan Indikator
Tahapan ini dimulai dengan mengkaji Standar Isi (SI) mata pelajaran matematika SMP Edisi 2006 (Depdiknas, 2006). Identifikasi dilakukan pada semua kompetensi aljabar di kelas VII. Hasil identifikasi itu digunakan untuk menyusun buram (draft) KD beserta indikatornya. Buram KD beserta indikator yang telah tersusun, selanjutnya dilakukan penelaahan melalui dua tahap kegiatan: teknik Delphi dan focus group discussion (FGD). 
Teknik Delphi digunakan untuk menjaring  saran  terkait dengan draft yang telah dirumuskan.  Teknik ini dilakukan dengan cara mengirimkan draft kepada 8 orang guru matematika dan 2 orang praktisi. Setelah dilakukan pemilahan, didapatkan saran dan dapat diklasifikasikan dalam tiga kelompok, yaitu agar: (a) melengkapi indikator yang telah ada; (b) menata ulang urutan antar indikator; dan (c) mengganti beberapa indikator agar lebih selaras dengan KD.
Untuk mendapatkan gambaran tentang perubahan yang dilakukan terkait dengan saran di atas, diambil contoh pada KD pertama. KD ini berbunyi: “Mengenali bentuk aljabar dan unsur-unsurnya,” dan semula dirumuskan empat indikator. Setelah dilakukan perbaikan dengan mempertim-bangkan berbagai saran, maka: (a) ada penambahan dua indikator baru, yakni: menjelaskan pengertian bentuk aljabar dan menjelaskan pemfaktoran bentuk aljabar; (b) dilakukan perbaikan pada rumusan indikator nomor 4. Indikator ini semula berbunyi: “Menuliskan bentuk aljabar dari suatu ungkapan,” diubah menjadi: “Menuliskan bentuk aljabar (model matematika) dari suatu ungkapan verbal/kehidupan sehari-hari;” (c) ada usulan untuk menukar urutan indikator dengan nomor urut 1 agar ditempatkan pada urutan 3.  Sebaliknya indikator nomor urut 2 dipindah ke posisi  1, sedangkan urutan nomor 2 ditempati dengan indikator baru: “Menjelaskan pengertian bentuk aljabar.”
Keseluruhan itu dilakukan agar diperoleh rumusan indikator yang rinci, urut dan lengkap sehingga memudahkan dalam menyusun learning continuum. Hasil perubahan yang dilakukan pada tahapan ini memberikan dampak banyaknya indikator bertambah dari 55 menjadi 63.
Selanjutnya dilakukan FGD. Forum FGD I dilakukan pada 27 Juni 2011 berhasil menyelesaikan dua tugas, yakni menulis KD beserta indikator untuk kelas VI dan VIII dan menulis materi prasyarat. Data yang diperoleh dari kegiatan ini berupa: (a) data hasil penulisan KD beserta indikator untuk kelas VI dan VIII; dan (b) data hasil penulisan materi prasyarat. Untuk kelas VI,  berhasil dirumuskan 8 KD dan 46 indikator. Kesemuanya diturunkan dari 2 standar kompetensi (SK). Untuk kelas VIII juga berhasil  dirumuskan 55 indikator yang mengacu pada 2 SK dan 10 KD.
Berkaitan dengan penulisan materi prasyarat, masing-masing indikator diidentifikasi materi yang terkait dan bersifat mendasarinya. Materi-materi  itu dipetakan dari kelas VI atau dari materi di kelas VII yang memiliki tingkat kesulitan lebih rendah. Aspek yang diperhatikan dalam penetapan materi prasyarat adalah urutan materi yang tercermin dari rumusan indikator yang diselesaikan pada teknik Delphi. Dari kegiatan ini berhasil diidentifikasi 2 hingga 15 materi prasyarat untuk masing-masing indikator kompetensi.
2.   Hasil Perumusan Learning Continuum
Dasar perumusan learning continuum adalah indikator-indikator kompetensi yang telah disepakati dan ditulis bersama dalam kegiatan FGD I. Dengan demikian, semua indikator yang dihasilkan dari forum FGD I langsung dipindahkan secara berurutan mulai dari kelas  VI hingga kelas VIII.  Dari langkah ini didapatkan 166 rumusan indikator yang dijadikan sebagai  learning  continuum. Namun setelah dibahas lebih lanjut, diperoleh  usulan agar menambahkan  beberapa butir indikator agar rumusan learning continuum menjadi lebih  baik.
Misalkan, pada rumusan awal tidak dijumpai: “Pengertian lawan penjumlahan (invers additive) suatu bilangan,” dan “Pengertian lawan perkalian (invers multiplikative) suatu bilangan.” Kedua rumusan ini dianggap penting, karena sebagai dasar dalam menyelesaikan persamaan atau pertidaksamaan linier satu variabel. Dengan mengakomodir berbagai usulan, dihasilkan learning continuum baru dengan 184 pernyataan dari semula 166.
Hasil telaah praktisi, masih ditemukan adanya tumpang tindih pada rumusan learning continuum.  Demikian pula, dijumpai beberapa rumusan indikator yang muncul pada nomor tertentu di awal, muncul kembali pada nomor berikutnya. Artinya, ada beberapa indikator yang muncul secara berulang atau memiliki rumusan berbeda namun memiliki makna hampir sama.  Sebagai contoh, pada rumusan learning continuum nomor 30 sampai dengan 34 ditemukan pernyataan-pernyataan: ”(30) Menjumlahkan pecahan biasa, cam-puran dan desimal; (31) mengurangkan pecahan biasa, campuran dan desimal; (32) mengalikan pecahan biasa, campuran dan desimal; (33) membagi pecahan biasa, campuran dan desimal, dan (34) melakukan operasi hitung campuran yang melibatkan pecahan biasa dan pecahan campuran.”
Pernyataan hampir sama ditemukan pada rumusan learning continuum nomor 47 dan 48: “(47) Menyelesaikan operasi hitung: tambah, kurang, kali dan bagi yang melibatkan pecahan biasa; dan (48) menyelesaikan operasi hitung: tambah, kurang, kali dan bagi yang melibatkan pecahan desimal.” Kedua kelompok pernyataan di atas, memiliki makna yang tidak jauh berbeda. Oleh karena itu, menurut saran mereka harus ada yang dihilangkan. Kasus serupa ditemukan pada komponen learning continuum untuk rumusan lainnya.
Berdasarkan temuan di atas, selanjutnya dijadikan dasar melakukan perbaikan. Dalam melakukan perbaikan diupayakan menghindari penggunaan istilah yang kurang tepat (seperti masih ditemukan banyaknya penggunaan kata “dan” sebagai kata sambung antara dua kalimat, padahal seharusnya menggunakan kata “atau”), dan menghilangkan pernyataan-pernyataan yang memiliki makna sama. Perbaikan ini menghasilkan rumusan learning continuum baru yang terdiri atas 182 butir pernyataan.

3.      Hasil Penyusunan Hierarki Materi
Kegiatan penyusunan  hierarki materi, diawali dengan pemetaan terhadap sejumlah kompetensi pada learning continuum. Pemetaan difokuskan pada kompetensi-kompetensi yang memiliki potensi  diukur oleh soal. Pada masing-masing kompetensi yang hendak diukur, diidentifikasi sejumlah kompetensi yang harus dikuasai anak terlebih dahulu. Kompetensi yang harus dikuasai merupakan kompetensi atau kemampuan prasyarat.
Dari langkah tersebut, dibuat hubungan antar kompetensi satu dengan lainnya yang hendak diukur atau antar materi satu dengan lainya. Dengan demikian, tersusunlah hierarki materi. Hierarki ini menunjukkan prasyarat ketergantungan langsung antar materi yang teridentifikasi.
Pada tahap awal, hasil identifikasi peserta FGD I terhadap semua materi prasyarat untuk masing-masing indikator, langsung dibuat menjadi sebuah urutan dalam bentuk diagram. Sebagai contoh, agar anak mampu menyederhanakan bentuk aljabar yang memiliki suku-suku sejenis, maka materi prasyarat yang mendasarinya adalah: (1) operasi hitung bilangan bulat dan pecahan, (2) pengertian variabel, (3) pengertian koefisien, (4) pengertian bentuk aljabar, (5) suku sejenis dan tidak sejenis, (6) penjumlahan suku-suku sejenis pada bentuk aljabar, dan (7) pengurangan suku-suku sejenis pada bentuk aljabar. Ketujuh materi prasyarat itu, selanjutnya disusun dalam bentuk hierarki berikut.
 






Menurut praktisi, untuk mencapai kompetensi di atas diperlukan satu materi prasyarat lagi yakni pengertian konstanta. Pengertian bentuk aljabar tidak menjadi prasyarat  dalam memahami suku-suku sejenis dan tidak sejenis. Sementara itu, pemahaman tentang suku sejenis dan tidak sejenis tidak hanya mendasari  materi pengurangan suku-suku sejenis pada bentuk aljabar, namun juga diperlukan dalam melakukan penjumlahan suku-suku sejenis pada bentuk aljabar. Dengan memperhatikan pendapat di atas, akhirnya dilakukan beberapa perubahan sehingga mempengaruhi bentuk diagram hierarki materi, dan diagram hierarki materi berubah menjadi:
Hasil perbaikan berdasarkan saran praktisi, selanjutnya dikonsultasikan dengan promotor. Menurut promotor, ada yang kurang tepat dalam penempatan nomor urut pada diagram. Seharusnya, nomor urut di puncak diagram diawali dari yang terkecil, berlanjut ke nomor urut yang lebih besar. Artinya, materi atau konsep yang lebih sederhana diberi nomor urut kecil, sedangkan materi atau konsep yang lebih kompleks diberi nomor urut lebih besar. Dengan demikian, urutan materi  perlu ditata ulang agar memenuhi kaidah itu.
Atas dasar itulah, dilakukan penataan ulang terhadap materi atau konsep yang telah dirumuskan. Oleh karena itu, urutan kedelapan materi menjadi: (1) pengertian variabel; (2) pengertian koefisien; (3) pengertian konstanta; (4) pengertian bentuk aljabar; (5) operasi hitung bilangan  bulat dan pecahan; (6) penjumlahan  suku-suku sejenis pada bentuk aljabar; (7) suku sejenis dan tidak sejenis; dan (8) pengurangan suku-suku sejenis pada bentuk aljabar. Langkah yang sama dilakukan pada diagram lainnya. Diagram urutan kedelapan materi tersebut tampak seperti berikut.
 







Hasil perubahan ini selanjutnya dikonsultasikan pula ke kopromotor, dan  ada yang kurang tepat dengan sistem penomoran pada diagram. Artinya, tidak semua diagram diawali dengan nomor urut 1. Nomor pada diagram seharusnya mengacu pada nomor urut yang ada pada learning continuum. Berdasarkan saran ini, dilakukan penyesuaian nomor urut dengan mengacu nomor urut pada learning continuum. Dengan demikian, nomor urut pada diagram menjadi: (6) sifat distributif perkalian terhadap pengurangan; (41) operasi hitung campuran pada bilangan bulat; (53) suku-suku sejenis pada bentuk aljabar; (55) operasi hitung penjumlahan, pengurangan, perkalian, atau pembagian bentuk aljabar; dan (56) menyederhanakan bentuk aljabar yang memiliki suku-suku sejenis. Dengan demikian, diagramnya  berubah menjadi:
 



4.   Hasil Penyusunan Atribut
Rumusan learning continuum dan hierarki materi telah memberi panduan dalam proses penyusunan atribut. Atribut-atribut ini selajutnya menjadi dasar dalam menyusun matriks Q. Mengingat pentingnya peranan atribut dalam penyusunan matriks Q, maka penentuan atribut ini dilakukan secara hati-hati.
Penentuan atribut juga terkait dengan item yang dikonstruk, karena keduanya akan diletakkan secara bersama-sama dalam matriks Q. Memperhatikan kondisi demikian, keseluruhan hirarki materi yang telah terbentuk dicari kedekatan materi prasyaratnya. Hal ini untuk menghindari banyaknya atribut dalam matriks Q lebih banyak dibandingkan banyaknya item. Berdasarkan hal tersebut, berhasil disusun 62 atribut. Setiap atribut diberi kode tertentu, dengan tujuan memudahkan dalam proses penyusunan matriks-Q. Dalam konteks ini diberi kode Ai, dengan i = 1, 2, 3,… 62. 
5.      Hasil Konstruksi Soal
Tahap membangun soal juga dilakukan melalui dua rangkaian kegiatan,  yaitu teknik Delphi dan FGD. Berdasarkan teknik Delphi diperoleh 48 item yang ditulis oleh 8 orang guru. Komposisi ke-48 item itu adalah: 5 item untuk materi bentuk aljabar; 19 item materi persamaan dan pertidaksamaan linier satu variabel; 6 item materi aritmetika sosial; 3 item materi perbandingan dan 14 item materi himpunan.
Item-item itu  berbetuk pilihan ganda, dilengkapi dengan empat pilihan jawab (option). Keempat pilihan jawaban terdiri atas 1 kunci jawab dan 3 pengecoh. Pada kunci jawab juga disertai dengan uraian tentang cara mendapatkan jawaban. Pada masing-masing pengecoh juga diberikan uraian langkah kemungkinan salah konsepsi yang terjadi pada anak sehingga  menyebabkan  anak terjebak dan memilih pengecoh itu.
Hasil penulisan item, selanjutnya dibawa dan dibahas dalam forum FGD II yang dilaksanakan pada 27 Juli 2011. Pembahasan diawali dengan paparan hasil telaah terhadap item yang ditulis para guru. Dari paparan itu ditemukan hal-hal berikut: (1) beberapa item dirumuskan secara monoton, sehingga kurang menarik. Misalkan, ada 6 item yang dirumuskan secara mirip karena rumusannya diulang-ulang seperti: ”Penyelesaian dari persamaan… adalah…” Kelompok item seperti ini, disarankan untuk dimodifikasi atau diganti; (2) pada item untuk menguji materi aritmetika sosial, ditemukan aspek aljabarnya yang belum tampak. Item-item yang digunakan untuk menguji topik ini lebih cenderung ke aspek aritmetika.  Padahal kompetensi yang diinginkan untuk topik ini kesemuanya berbunyi “Menggunakan konsep aljabar untuk menghitung…;“ (3) beberapa item terlalu sulit bila diujikan pada siswa SMP. Item seperti ini juga dipandang kurang tepat untuk tes diagnostik.
Berdasarkan temuan yang disampaikan oleh praktisi,  selanjutnya dijadikan dasar oleh penulis item dalam melakukan revisi. Hasil revisi dirangkum oleh peneliti dan jumlah item mengalami perubahan menjadi 42 item. Berkurangnya jumlah item disebabkan karena ada penghilangan beberapa item yang memiliki kesamaan. Distribusi ke-42 item hasil revisi juga mengalami perubahan, yakni: 9 item untuk bentuk aljabar, 10 item untuk persamaan dan pertidaksamaan linier satu variabel, 6 item untuk aritmetika sosial, 3 item untuk materi perbandingan, dan 14 item untuk himpunan. Ke-42 item ini selanjutnya dilakukan penelaahan ahli. 
6.   Hasil Validasi Ahli
Validasi dilakukan terhadap semua perangkat instrumen yang dikembang-kan, mencakup rumusan SK, KD dan indikator, rumusan learning continuum, susunan hierarki materi, item tes diagnostik, dan analisis pengecoh.  Jadi, validasi tidak semata-mata fokus pada item tes yang berhasil dikonstruk. Hasil validasi ahli dalam bentuk saran tertulis, dan saran itu dapat dikelompokkan ke dalam empat kategori, yakni terkait dengan: (a) teknik penulisan, (b)  kelengkapan suatu materi, (c) urutan materi, dan (d) subtansi isi.
Teknik penulisan mencakup: konsistensi dalam menggunakan istilah tertentu, misalnya dalam penulisan lambang atau simbol matematika seperti tanda  kurang (–) atau kali (×). Dalam hal kelengkapan suatu materi, perlu dipastikan tidak adanya materi yang tertinggal, padahal materi itu mendasari materi berikutnya. Urutan materi juga perlu dipastikan agar materi tersusun secara hierarkis, ditandai dengan materi yang lebih mudah ke materi yang kompleks. Selain itu, tidak terjadi tumpang tindih antar materi.  Subtansi isi mencakup ketepatan suatu soal dalam mengukur indikator tententu.

7.      Hasil Hasil Uji Empirik
Hasil uji coba empirik yang dilakukan di SMPN 16 Yogyakarta, menunjukan bahwa ada satu item yang sangat jelek.  Dikatakan jelek karena  tidak banyak anak yang memilih pengecoh yang disediakan. Hasil analisis dengan Program ITEMAN, dari 102 anak yang mengikuti tes, 94 anak (92%) dapat menjawab benar (memilih kunci C). Pengecoh A hanya dipilih seorang anak (1%), pengecoh B dipilih 4 anak, dan pengecoh D hanya dipilih 3 anak (3%). Atas pertimbangan ini, item nomor 1 dihilangkan dari paket tes. Dengan dihapusnya item nomor 1, keseluruhan item tes menjadi 37.
Ke-37 item di atas, selanjutnya diujicobakan pada siswa SMPN 1 Panjatan Kulon Progo dilakukan dengan maksud untuk melengkapi data kerangka pikir pada pengecoh yang belum didapat pada waktu uji coba di SMPN 16 Yogyakarta. Hasil uji coba dari sekolah ini, selanjutnya dipadukan.
Uji coba pada dua sekolah (SMPN 16 Yogyakarta dan SMPN 1 Panjatan Kulon Progo) melibatkan 166 anak dan mendapatkan beberapa temuan menarik. Temuan itu dapat dipilah menjadi 3 kelompok, yakni: (a) perlu dilakukan modifikasi terhadap beberapa pilihan jawaban, (b) perlu dilakukan perubahan pada beberapa kerangka pikir pengecoh, dan (c) didapatkannya alur pikir terjadinya salah konsepsi pada item-item baru, sehingga menjadi dasar dalam menyusun pengecoh.
Untuk kelompok pertama, ada empat item yang memenuhi kriteria itu yakni item nomor 10, 24, 29 dan 30. Perubahan pada keempat item itu, selain mempertimbangkan jawaban anak juga memperhatikan homogenitas pengecoh. Dengan disediakannya pengecoh yang semakin homogen, diharapkan akan benar-benar menguji pemahaman konsep anak.
Beberapa pengecoh yang dirumuskan oleh para guru, ternyata juga berbeda dengan yang dipikirkan oleh kebanyakan anak. Kondisi ini mendorong dilakukannya perubahan terhadap logika berpikir yang digunakan pada pengecoh itu. Dengan demikian, logika berpikir pada pengecoh yang digunakan dalam penelitian ini, diharapkan mampu mencerminkan salah konsepsi yang umumnya dilakukan anak.
 Sementara itu, item baru yang digunakan untuk mengganti item sebelumnya, belum ada kerangka pikir terhadap pengecoh yang digunakan. Ada 3 item baru yang termasuk dalam kelompok ini. Oleh karena itu, dari uji coba ini diperoleh kerangka pikir sebagai dasar menyusun analisis pengecoh.
Hasil uji coba empirik yang dilakukan di SMPN 16 Yogyakarta dan SMPN 1 Panjatan Kulon Progo, diperoleh 37 item tes diagnostik. Ke-37 item itu selanjutnya diujikan pada siswa kelas VIII SMPN 1 Yogyakarta, SMPN 1 Sanden Bantul, dan SMPN 1 Panjatan Kulon Progo.   
B.     Karakterisktik Item
Beberapa hal yang menjadi perhatian pada karakteristik item tes diagnostik di antaranya aspek item yang fit, tingkat kesukaran item dan indeks daya beda item. Data yang dijadikan dasar untuk menganalisis ketiga karakteristik tersebut berasal dari data hasil uji coba yang melibatkan 180 anak berasal dari  SMPN 1 Yogyakarta, SMPN 1 Sanden Bantul, dan SMPN 1 Panjatan Kulon Progo.   
1.      Uji Kecocokan (Fit)
Tabel 1 menyajikan nilai entropy untuk setiap kelompok item. Kelompok item 1 dan 2 menguji materi bentuk aljabar; kelompok item 3 sampai 5 menguji materi persamaan dan pertidaksamaan linier satu variabel; kelompok item 6 menguji materi aritmetika sosial; kelompok item 7 menguji materi perbandingan; dan kelompok item 8 sampai 10 menguji materi himpunan. Dengan demikian ada 10 kelompok item yang memuat 37 item tes diagnostik.
Sejauh ini belum ada referensi yang secara khusus membahas tentang  garis batas (tinggi-rendah) nilai entropy. Untuk itu, dalam tulisan ini digunakan garis batas 0,75 sebagai batas tinggi-rendahnya entropy. Artinya, bila sekelompok item memiliki nilai entropy  lebih dari sama dengan 0,75 maka dikategorikan tinggi, sebaliknya bila sekelompok item memiliki nilai entropy  kurang dari 0,75 maka dikategorikan rendah. Bila garis batas itu digunakan,  maka dari Tabel 1 diperoleh kelompok item 1, 2, 3, 4, dan 9 memiliki nilai entropy rendah.   
Tabel 1
Rangkuman Nilai Entropy Masing-masing Kelompok Item

Item
No. Item
Nilai
Entropy
Kelompok
Item
No. Item
Nilai
Entropy
1.
1-3
0,685
6.
16-19
0,837
2.
4-5
0,518
7.
20–23
0,718
3.
6-8
0,594
8.
24-27
0,880
4.
9-12
0,615
9.
28-30
0,561
5.
13-15
0,772
10.
31-37
0,894


Pada kelompok item yang memiliki nilai entropy rendah, selanjutnya ditelusuri nilai bivariate model fit information.  Hasil penelusuran pada kelompok item 1 ditemukan bahwa terdapat sepasang item yang diduga memberikan sumbangan terhadap rendahnya nilai entropy. Pasangan item itu adalah item nomor 2 dan 3, karena terdapat selisih antara nilai pada  H1 (data hasil observasi atau observed data) dengan H0 (data yang diprediksi model atau model-predicted data).
Pada kelompok item 2, hanya memuat dua item yakni item nomor 4 dan 5. Rendahnya nilai entrophy pada kelompok ini, tentu saja dipengaruhi oleh pasangan item ini. Pada kelompok item 3 memuat item nomor 6 sampai 8, dan penelusuran nilai bivariate model fit information tidak ditemukan pasangan item yang memiliki selisih antara H1 dengan H0 berbeda. Dengan demikian, pasangan item mana yang memiliki kontribusi terhadap rendahnya nilai entrophy, tidak dapat dideteksi.
Pada kelompok item 4, terdapat sepasang item yakni item nomor 9 dan 11 yang memiliki nilai H1 dan H0 berbeda. Sepasang item ini diduga memberikan konstribusi terhadap rendahnya nilai entrophy kelompok item ini. Pada kelompok item 9, yang memuat item nomor 28 hingga 30, juga ditemukan  sepasang item yang memiliki nilai H1 dan H0 berbeda. Pasangan item itu adalah item bernomor 28 dan 30. Dengan demikian, pasangan item ini diduga memiliki sumbangan terhadap rendahnya nilai entrophy kelompok item ini.
 Terkait rendahnya nilai entropy pada kelima kelompok item ini, menurut de la Torre (2008:360) disebabkan karena kurang tepatnya ukuran matriks Q.  Ketepatan yang dimaksud dilihat dari dua aspek, yaitu ukuran matriks Q dan kesesuaian matriks Q dengan struktur kelas laten. Ketepatan matriks Q merupakan bagian penting dari model DINA, yang sering diabaikan dalam analisis fit model.
Dari aspek ukuran, de la Torre menyarankan agar banyaknya item di dalam matriks Q lebih dari banyaknya atribut. Hasil simulasi menunjukkan bila banyaknya item kurang dari atau sama dengan banyaknya atribut, maka Mplus tidak memberikan informasi apapun tentang struktur kelas laten yang dicari. Mplus hanya memberikan out put berupa pernyataan : “INPUT READING TERMINATED NORMALLY; Monte-Carlo Simulation for DINA Model.” Pernyataan ini mengisyaratkan bahwa hasil analisis akan tidak fit bila dipaksakan dengan ukuran matriks seperti ini. Rupp & Templin (2008:83) mengungkapkan bahwa setiap penambahan sejumlah atribut pada matriks Q, seharusnya panjang tes juga ditambah agar dapat memberikan informasi yang reliabel tentang semua varibel laten.
Dari aspek kesesuaian, idealnya dalam mendesain matriks Q harus berkorespondensi dengan struktur kelas laten (de la Torre et al., 2010:233).  Hal ini dapat dilakukan bila atribut pada matriks Q dijadikan sebagai kisi-kisi selama proses penyusunan item. Artinya, atribut pada matriks Q dikonstruk dan ditetapkan terlebih dahulu dan item tes dibangun yang mengacu pada sejumlah atribut. Padahal dalam penelitian ini, matriks Q dikembangkan atas dasar item dan hierarki materi yang telah dibangun sebelumnya. Item tes tidak dibangun berdasarkan matriks Q. Oleh karena itu, wajar bila  kesesuaian antara matriks Q dengan struktur kelas laten kurang, sehingga kemungkinan rendahnya nilai entropy kelompok item ini juga dipengaruhi oleh aspek ini.
Penelusuran terhadap ke-15 item yang memiliki nilai entropy rendah, juga dilakukan pada parameter guessing dan slip-nya. Langkah ini dilakukan mengacu pendapat Rupp & Templin (2008:81). Menurut Rupp & Templin, bila model dapat menggambarkan data dengan baik atau fit, maka kedua parameter item pada model DINA (guessing dan slip) harus kecil. Sebaliknya, jika salah satu dari kedua parameter itu tinggi, menunjukkan item yang bersangkutan dikatakan tidak fit.
Data penelitian menunjukkan bahwa dari 15 item yang memiliki nilai entropy rendah,  ditemukan 10 item yang memiliki parameter guessing tinggi yakni item nomor 1, 2, 3, 4, 6, 8, 9, 10, 11 dan 30. Hasil ini melengkapi out put dari Mplus berupa bivariate model fit information. Berdasarkan tiga bukti di atas, yakni rendahnya nilai entropy, tingginya parameter guessing, dan bivariate model fit information maka kesepuluh item (nomor 1, 2, 3, 4, 6, 8, 9, 10, 11 dan 30) yang digunakan dalam tes diagnostik ini tidak fit.
2.      Tingkat Kesukaran
Level parameter slip dan guessing  selanjutnya digunakan untuk menentukan tingkat kesukaran item.  Oleh karena itu, pengelompokkan item yang mengacu pada parameter slip dan guessing perlu dibuat lebih rinci. Tabel 2 menyajikan distribusi item berdasarkan level parameter slip dan guessing yang dimilikinya.
Tabel 2
Distribusi Item Berdasarkan Parameter Guessing dan Slip
No.
Kategori/Level
Nomor Item
Guessing
Slip
1.
Rendah
12, 16, 31, 32, 36, 37
1, 2, 3, 4, 6, 7, 8, 9, 11, 12, 16, 25, 27, 30, 33, 36, 37
2.
Sedang
5, 13, 19, 20, 23, 27, 28, 29
5, 19, 21, 22, 28, 29
3.
Tinggi
9, 17, 21, 24, 25, 26, 34, 35
10, 14, 18, 20, 24, 34, 35
4.
Sangat Tinggi
1, 2, 3, 4, 6, 7, 8, 10, 11, 14, 15, 18, 22, 30, 33
13, 15, 17, 23, 26, 31, 32
Selanjutnya, hasil pengklasifikasian item berdasarkan tingkat kesukarannya sangat membantu dalam memetakan profil item pada tingkat materi/topik yang diujikan. Dengan demikian, dapat dipotret materi-materi tertentu yang memiliki tingkat kesukaran mudah, sedang dan sulit. Tabel 3 merangkum tingkat kesukaran item yang dikorespondensikan dengan materi/topik  yang diuji oleh item tersebut.
Tabel 3
Distribusi Tingkat Kesukaran Item pada Setiap Materi
No.
Topik/Materi
Tingkat Kesukaran
Mudah
Sedang
Sulit
1.
Bentuk aljabar
1, 2, 3, 4
5
-
2.
Persamaan dan pertidaksamaan linier satu variabel
6, 7, 8, 9
14
10, 11, 12, 13, 15
3.
Aritmetika sosial
-
16 dan 18
17 dan 19
4.
Perbandingan
21 dan 22
-
20 dan 23
5.
Himpunan
25, 30, 33
27, 28, 29, 36, 37
24, 26, 31, 32, 34, 35
Berdasarkan Tabel 3, terlihat bahwa kelompok item yang menguji materi bentuk aljabar, sebagian besar memiliki tingkat kesukaran item mudah. Sebaliknya, pada materi aritmetika sosial memiliki tingkat kesukaran item sedang dan sulit. Item-item yang menguji bentuk aljabar dirancang  untuk menguji kemampuan prosedural anak, sedangkan pada aritmetika sosial lebih menekankan pada pengujian aspek  konsep. 
Pesan yang dapat ditangkap dari kasus ini, umumnya anak akan mengalami kesulitan pada item yang menggali aspek konsep. Mengapa demikian? Item nomor 16 sampai 19 memaksa anak harus memahami konsepnya terlebih dahulu, seperti mengidentifikasi variabel yang terlibat pada soal dan memodelkannya sebelum dapat menyelesaikan. Hal itu berbeda dengan item 1 sampai dengan 5 yang hanya menguji kemampuan prosedural anak dan hanya menuntut aspek keterampilan rutin yang dapat dilatihkan.
3.      Indeks Daya Beda
Hasil estimasi parameter slip dan guessing digunakan pula untuk menentukan indeks daya beda item. Tabel 4 menyajikan rangkuman  distribusi item berdasarkan indeks daya beda item. Dari Tabel 4, ada enam item yang memiliki indeks daya beda jelek. Item yang jelek memiliki arti bahwa item yang bersangkutan tidak mampu membedakan anak yang telah menguasai seluruh atribut (= 1) dan anak yang belum menguasai  atribut (= 0).  Item yang memiliki sifat demikian, kemungkinan disebabkan oleh: (a) materi yang ditanyakan terlalu sulit, sehingga banyak anak yang menebak; (b) pengecoh kurang berfungsi; dan (c) sebagian besar anak walaupun telah memahami materi, mereka beranggapan ada informasi yang salah pada item itu (Kusaeri & Suprananto, 2012:176).
Tabel 4
Distribusi Item Berdasarkan Kualitas Item
No.
Kualitas Item
Nomor Item
1.
Jelek
10, 15, 17, 23, 26, 33
2.
Kurang
2, 4, 7, 13, 14, 18, 22, 30, 32
3.
Cukup
1, 31, 35
4.
Baik
3, 5, 6, 8, 9, 11, 12, 16, 19, 20, 21, 24, 25, 27, 28, 29, 34, 36, 37

Dari kelima item yang memiliki indeks daya beda jelek, empat di antaranya memiliki tingkat kesukaran item sulit, yakni item nomor 10, 15, 17, 23 dan 26, sedangkan item nomor 33 memiliki tingkat kesukaran mudah. Untuk lima item yang disebutkan pertama, hasil penelusuran respon 180 anak melalui program ITEMAN ditemukan kelimanya memiliki nilai biserial yang rendah. Item yang memiliki nilai biserial seperti ini menurut Crocker & Algina (1986:315), termasuk dalam kategori item yang jelek. 
Selanjutnya, rendahnya indeks daya beda item nomor 33 disebabkan karena kurang berfungsinya pengecoh. Hasil analisis yang dilakukan melalui program ITEMAN diperoleh sebagian besar (84% atau 151 dari 180 anak) memilih kunci jawaban. Selebihnya terdistribusi secara proporsional pada pengecoh yang disediakan, yakni 8,3% memilih pengecoh A, hanya 2,8% memilih pengecoh C, dan 3,9% memilih pengecoh D. Deskripsi ini menggambarkan bahwa ada dua pengecoh yang kurang diminati oleh anak, karena dipilih kurang dari 5%. Dengan kata lain, dua pengecoh tersebut kurang berfungsi.
Dengan demikian keenam item yang memiliki indeks daya beda jelek harus dihilangkan dari paket tes. Hal itu disebabkan karena indeks daya beda berkaitan dengan kualitas item. Bila indeks daya bedanya jelek maka kualitas item yang bersangkutan juga jelek.
Simpulan
Penelitian ini telah menghasilkan instrumen tes diagnostik yang dikembangkan dengan menggunakan model DINA. Selanjutnya, berdasarkan hasil penelitian dan pembahasan dapat dikemukakan simpulan penelitian sebagai berikut: (a) Tahapan pengembangan tes yang digunakan dalam penelitian ini meliputi: identifikasi kompetensi dasar (KD) dan merumuskan indikator, menyusun learning continuum, menyusun hierarki materi, merumuskan atribut, mengonstruk soal, validasi ahli dan uji empirik. Setelah melalui tujuh tahapan tersebut, berhasil dikembangkan 37 item tes diagnostik; dan (b) Dari 37 item tes diagnostik yang dikembangkan, 15 item di antaranya harus dihilangkan/dihapus dari paket tes. Item-item yang dihilangkan/dihapus disebabkan karena tidak fit dan memiliki kualitas item jelek (indeks daya beda kurang dari 0,2).
Namun, penelitian ini memiliki beberapa keterbatasan karena pengembangan tes diagnostik berbasis pada latent class  (model DINA) merupakan hal baru dalam dunia pengujian pendidikan di Indonesia. Beberapa kelemahan dalam penelitan ini di antaranya: (i) Penyusunan item tes dilakukan dengan mengacu pada kisi-kisi tes seperti lazimnya pada proses pengembangan tes prestasi. Hal itu berbeda dengan langkah yang seharusnya digunakan pada model DINA, yaitu item tes dibangun dan diturunkan berdasarkan sejumlah atribut; (ii) Cakupan materi pada tes diagnostik ini terlalu luas, yakni semua materi aljabar yang diajarkan di kelas VII SMP (ada 5 materi).  Luasnya cakupan materi tes berdampak pada kompleksnya atribut yang mendasari setiap item.  Akibatnya, matriks Q yang terbentuk  memiliki atribut lebih banyak, dibandingkan jumlah item; dan (iii) Pelaksanaan uji coba penelitian ini baru dikenakan pada sejumlah  siswa kelas VIII SMP negeri, dan dilakukan  di akhir semester gasal. Kondisi ini tentunya akan  berbeda bila uji coba juga melibatkan siswa SMP swasta, dan dikenakan  pada siswa kelas VIII yang sedang berada di awal semester gasal  atau siswa kelas VII di akhir semester genap. Dengan demikian, dari aspek validitas internal masih mengandung beberapa keterbatasan, baik menyangkut karakteristik subjek penelitian, waktu dan tempat penelitianya.
Daftar Pustaka
Awal Isgiyanto. (2011). Analisis untuk menemukan informasi diagnostik data ujian nasional matematika. Disertasi doktor, tidak diterbitkan, Universitas Negeri Yogyakarta, Yogyakarta.
Chi, M.T.H. (2008). Three types of conceptual change: Belief revision, mental model transformation, and categorical shift. Dalam S. Vosniadou (Eds),  Handbook of research on conceptual change (pp. 61-82). New Jersey: Lawrence Erlbaum Associates.
Crocker, L. & Algina, J. (1986). Introduction to classical and modern test theory. Forth Worth: Holt, Rinehart and Winston.
Depdiknas (2006). Peraturan Menteri Pendidikan Nasional Republik Indonesia Nomor 22 tahun 2006, tentang, Standar Isi untuk Satuan Pendidikan Dasar dan Menengah.
de la Torre, J. (2008). DINA model and parameter estimation: A didactic. Journal of Educational and Behavioral Statistics, 39 (1): 115-130.
de la Torre, J. & Karelitz, T.M. (2009). Impact of diagnosticity on the adequacy of models for cognitive diagnosis under a linear attribute structure: A simulation study. Journal of Educational Measurement. 46 (4): 450-469.
de la Torre, J., Yuan Hong & Weiling Deng. (2010). Factors affecting the item parameter estimation and classification accuracy of the DINA Model. Journal of Educational Measurement, 47 (2): 227-249.
Fauzan. (2010). Pengembangan tes diagnostik kesulitan belajar matematika di SMA. Disertasi doktor, tidak diterbitkan, Universitas Negeri Yogyakarta, Yogyakarta.
Kusaeri. 2012. Pengembangan tes diagnostik dengan menggunakan model DINA unuk mendapatkan informasi salah konsepsi dalam aljabar. Disertasi doktor, tidak diterbitkan, Universitas Negeri Yogyakarta, Yogyakarta.
Kusaeri & Suprananto (2012). Pengukuran dan penilaian pendidikan. Yogyakarta: Graha Ilmu.
Muthen, L.K. & Muthen, B. O. (2010). Mplus user’s guide (6th ed). Los Angeles, CA: Muthen & Muthen.
Rakes, C.R. (2010). Misconception in rational numbers, probability, algebra, and geometry. Disertasi doktor, tidak diterbitkan. The University of Louisville.
Rupp, A.A., Templin, J. & Henson, R.A. (2010). Diagnostic measurement: Theory, methods and applications. New York: The Guilford Press.
Russel, M. & O’dwyer, L.M. (2009). Diagnosing students’misconceptions in algebra: Results from an experimental pilot study. Behavior Research Methods, 41, 414-424.
Sugiharto. (2003). Diagnosis kesulitan siswa SMU dalam menyelesaikan soal matematika. Tesis magister, tidak diterbitkan, Universitas Negeri Yogyakarta, Yogyakarta.
Suwarto. (2011). Pengembangan tes diagnostik  untuk mengungkap kesulitan siswa dalam memahami reproduksi sel. Disertasi doktor, tidak diterbitkan, Universitas Negeri Yogyakarta, Yogyakarta.
Templin, J. (2008). Cognitive diagnosis modeling with Mplus (User guide). Diambil pada tanggal 19 Desember 2011 dari http://jtemplin.coe.uga. edu/teaching/ dcm08 ncme/cdmuserguide.html
Templin, J. (2011). Diagnostic measurement: Theory, methods and application. Diambil pada tanggal 8 Desember 2011 dari http://jtemplin.coe.uga. edu/workshops/dcm/uga_dcm1.html.
Venables, W. R. & Smith, D.M. (2011). An introduction to R: A programming environment for data analysis and graphics version 2.14.1. Diambil pada tanggal 17 Januari 2012 dari http://cran.r-project.org/mirrors.html.
Waskito (2010). Pengembangan model analisis prestasi belajar untuk mengidentifikasi kesulitan belajar peserta didik. Disertasi doktor, tidak diterbitkan. Universitas Negeri Padang, Padang.
Xiaobao Li (2006). Cognitive analysis of student’s errors and misconceptions in variables, equations, and functions. Disertasi doktor, tidak diterbitkan, A & M University, Texas.
Ying Liu, Douglas, J.A., & Henson, R.A. (2009). Testing person fit in cognitive diagnosis. Applied Psychological Measurement, 33 (8): 579-598.  
Zhang, W. (2006). Detecting differential item functioning using the DINA model. Disertasi doktor, tidak diterbitkan. The University of North Carolina, Greensboro.

Title Post: Menggunakan Model DINA Dalam Pengembangan Tes Diagnostik Untuk Mendeteksi Salah Konsepsi
Rating: 100% based on 99998 ratings. 5 user reviews.
Author: Unknown

Terimakasih sudah berkunjung di blog-kusaeri, Jika ada kritik dan saran silahkan tinggalkan komentar

0 komentar:

Posting Komentar