1-B-Pengukuran Dan Tes
1-B-Pengukuran Dan Tes
1-B-Pengukuran Dan Tes
DOSEN PENGAMPU :
Nellia Afiyeni, S.Psi., MA
Poppy Ramadhani, S.Psi., M.Psi, T
KELOMPOK 1 :
Monic Elisa Fitri ( 1810321004)
Faulina Adma ( 1810322020)
Ade Aulia Rahmi ( 1810322034)
Aziztia Ratiwi Subarta (1810322035)
Ivan Favian Kamil ( 1810322036)
Della Ria S R (1810322040)
Afra Nada Syafira (1810323006)
Puji dan syukur kita haturkan kehadirat Tuhan Yang Maha Esa atas berkat dan
karunia-Nya, sehingga kami dapat menyelesaikan tugas makalah Psikometri tentang
“Pengukuran dan Tes” ini, tanpa pertolongannya kami tidak mungkin dapat menyelesaikan
tugas ini tepat waktu. Kami juga berterima kasih kepada dosen pengampu kami yang telah
membimbing kami dalam pengerjaan tugas ini. Tidak lupa juga kami ucapkan terima kasih
kepada rekan-rekan yang sudah ikut membantu mencurahkan pikiran dan tenaganya selama
proses pembuatan makalah ini.
Makalah ini berisi tentang bagamaina pengukuran dan tes psikologi dilakukan. Selain
itu pengertian pengukuran, taraf-taraf dan teori-teori yang digunakan dalam pengukuran
psikologi akan kami paparkan dalam makalah ini. Kami juga akan membahas hal-hal yang
bersangkutan dengan pengukuran dan tes selain dari yang disebutkan di atas.
Penulis tentu menyadari bahwa terdapat kekurangan dalam penyusunan makalah ini.
Oleh karena itu, kami mengaharapkan kritik dan saran yang membangun agar kami dapat
membuat makalah ini lenbih baik lagi. Semoga makalah ini bermaanfaat bagi para
pembacanya. Atas perhatiannya kami ucapkan terima kasih.
Penyusun
I
DAFTAR ISI
Contents
KATA PENGANTAR............................................................................................................................I
DAFTAR ISI.........................................................................................................................................II
BAB I....................................................................................................................................................1
PENDAHULUAN.................................................................................................................................1
1.1 Latar Belakang.............................................................................................................................1
1.2 Rumusan Masalah........................................................................................................................1
1.3 Tujuan Penulisan..........................................................................................................................2
BAB II PEMBAHASAN.......................................................................................................................3
2.1 Pengertian Pengukuran................................................................................................................3
2.2 Taraf-Taraf Pengukuran...............................................................................................................3
2.2.1. Pengukuran Nominal............................................................................................................4
2.2.2 Pengukuran Ordinal..............................................................................................................5
2.2.3 Pengukuran Interval..............................................................................................................5
2.2.4 Pengukuran Rasio.................................................................................................................6
2.3 Aneka Respon dalam Pengukuran Psikologi................................................................................6
2.3.1 Aneka Respon Menurut Isinya..............................................................................................6
2.3.2 Aneka Respon Menurut Caranya..........................................................................................7
2.3.3 Aneka Respon Menurut Taraf Pengukurannya......................................................................9
2.4 Teori Tes Klasik.........................................................................................................................10
2.4.1 Asumsi Teori Mengenai Skor.............................................................................................11
2.5 Tes Psikologi.............................................................................................................................11
2.5.1 Pengertian Tes Psikologi.....................................................................................................11
2.5.2 Karakteristik Dasar Tes Psikologi.......................................................................................12
2.5.3 Permasalahan dalam Pengukuran Konstruk Psikologis.......................................................12
2.6 Jenis Tes Psikologi.....................................................................................................................13
2.6.1 Penggolongan Tes Berdasarkan Tujuan..............................................................................13
2.6.2 Penggolongan Tes Berdasarkan Isi.....................................................................................21
II
2.7 Penggunaan Tes Psikologi.........................................................................................................23
2.7.1 Penggunaan Tes di Lingkungan Klinis (Psychological Testing).........................................24
2.7.2 Penggunaan Tes di Lingkungan Pendidikan Sekolah (Educational Testing)......................24
2.7.3 Penggunaan Tes untuk Pembinaan Pegawai dan Credentialing atau Pemberian.................25
Pengakuan..........................................................................................................................25
2.7.4 Penggunaan Tes dalam Evaluasi Program dan Kebijakan Publik........................................26
2.8 Syarat atau Karakteristik Tes yang Baik....................................................................................26
2.8.1 Segi Desain atau Rancangan Tes........................................................................................27
2.8.2 Segi Psikometri Tes............................................................................................................29
BAB III PENUTUP.............................................................................................................................34
3.1 KESIMPULAN..........................................................................................................................34
DAFTAR PUSTAKA..........................................................................................................................35
III
IV
BAB I
PENDAHULUAN
Pengukuran dan tes psikologis merupakan hal penting untuk diketahui para psikolog
dalam menjalankan pekerjaannya. Menurut Friedenberg (1995) pengertian pengukuran ialah
setiap prosedur yang digunakan untuk mengumpulkan informasi tentang seseorang.
Informasi-informasi ini kemudian diolah dan diinterpretasikan. Cara pengukuran dan
pengolahan yang tepat merupakan hal dasar wajib diketahui agar nantinya tidak salah dalam
menginterpretasikan variabel yang diukur dari suatu subjek. Sehingga hasil yang diberikan
tidak keliru dan menyababkan kerugian untuk berbagai pihak. Oleh karena itu, makalah ini
dibuat untuk memberikan acuan bagaimana cara mengukur dan mengolah data atau informasi
terkhususnya pengukuran psikologis. Selain dari cara mengukur dan mengolah informasi
penulis juga memaparkan penggunaan dari tes-tes psikologi itu sendiri sehinggaa hasil dari
tes-tes itu memberikan dapat memberikan manfaat .
1.2.5 Apa pengertian tes psikologis dan karakteristik dasar tes psikologis?
1
1.3 Tujuan Penulisan
Berdasarkan rumusan masalah di atas, maka tujuan dari penulisan ini adalah sebagai berikut:
1.2.2 Mampu memahami dan menjelaskan apa saja taraf-taraf/tingkat hasil pengukuran
psikologis.
psikologis.
1.2.4 Mampu menyebutkan dan menjelaskan teori-teori klasik pada pengukuran psikologis.
1.2.5 Mampu memahami pengertian tes psikologis dan karakteristik dasar tes psikologis.
psikologis.
1.2.7 Mengtahui dan memahami jenis-jenis tes psikologis.
1.2.9 Mengetahui dan memahami syarat atau karakteristik tes yang baik.
2
BAB II
PEMBAHASAN
2.1 Pengertian Pengukuran
S.S Stevens (1946): pengukuran adalah penempatan bilangan pada objek atau peristiwa
menurut aturan-aturan tertentu.
Nunnally, Jr. (1970): pengukuran terdiri atas aturan-aturan untuk menempatkan bilangan-
bilangan pada aneka objek dengan cara sedemikian rupa untuk mencerminkan kuantitas
dari berbagai atribut.
Allen & Yen (1979): pengukuran adalah penetapan bilangan-bilangan pada individu-
individu secara sistematis sebagai cara mencerminkan ciri-ciri dari individu-individu
tersebut.
Pengukuran adalah peneraan atau pelekatan bilangan pada objek (termasuk orang) atau
peristiwa menurut aturan tertentu dengan tujuan untuk melukiskan sifat-sifat objek atau perist
iwa yang bersangkutan (Lord, 1954).
Pakar yang berjasa membuat penggolongan tentang jenis skala pengukuran adalah Stev
ens (1946). Menurut Stevens (1946) ada empat macam operasi empiris dasar yang kemudian
dipakai sebagai aturan dalam pengukuran, yaitu: (1) determination of equality atau penetapan
kesetaraan atau kesamaan atau pengklasifikasian objek-objek atau kejadian-kejadian, (2) ran
3
k-ordering atau determination of greater or less atau penetapan urutan jenjang atau penetapan
mana yang lebih dan mana yang kurang di antara objek-objek atau kejadian-kejadian, (3) det
ermination of equality of intervals or differences atau penetapan kesetaraan atau kesamaan int
erval atau perbedaan di antara objek-objek atau kejadian-kejadian, dan (4) determination of e
quality of ratios atau penetapan kesetaraan atau kesamaan rasio di antara objek-objek atau kej
adian-kejadian.
Jenis informasi terkait dengan operasi empiris yang mendasari peneraan bilangan terseb
ut mencakup : (1) informasi tentang identitas, (2) informasi tentang urutan atau jenjang, (3) in
formasi tentang interval atau jarak yang sama, dan (4) informasi tentang keberadaan nilai nol
absolut atau mutlak.
Jenis skala atau taraf pengukuran beserta aneka konsekuensinya tersebut menurut Steve
ns (1946) terbagi menjadi empat, yaitu pengukuran nominal, pengukuran ordinal, pengukuran
interval, dan pengukuran rasio.
Pada taraf pengukuran ini bilangan hanya dipakai sebagai nomen (kata Latin berarti n
ama), dan tidak memiliki nilai numeric. Bilangan dikenakan pada satu atau serangkaian obj
ek atau peristiwa sekedar sebagai tanda untuk menunjukkan identitas. Jika satu bilangan dik
enakan sebagai objek, maka bilangan tersebut dipakai sebagai label. Contohnya, setiap pem
ain sepak bola ditandai dengan bilangan tertentu yang dituliskan pada bagian punggung kos
tum sepak bola yang dikenakannya sebagai nomor punggung. Label bilangan ini dikenakan
secara tetap kepada setiap pemain dan menjadi identitasnya.
Jika satu bilangan dikenakan pada lebih dari satu objek, maka bilangan tersebut dipa
kai sebagai kategori. Sebagai contoh, ada dua jenis kelamin yang secara resmi diakui dalam
pencatatan data kependudukan, yaitu lelaki dan perempuan. Untuk memudahkan pencatatan
dan pengolahan data, jenis kelamin lelaki dikenai bilangan 1 dan jenis kelamin perempuan
dikenai bilangan 2, atau sebaliknya.
Skala nominal lazim diterapkan dalam pengukuran variabel diskret, yaitu variabel yan
g hanya memiliki nilai-nilai bulat atau utuh (Yaremko, Harari, Harrison, & Lynn, 1982). St
evens (1946) menyebut skala nominal sebagai bentuk penerapan bilangan yang paling tidak
mengenal batasan (unrestricted) atau bentuk pengukuran primitive yang bahkan konon tida
k layak disebut pengukuran sebab menggunakan bilangan sekedar sebagai nama atau label t
anpa memanfaatkan nilai numeriknya.
4
2.2.2 Pengukuran Ordinal
Pada taraf pengukuran ini bilangan yang dikenakan pada suatu objek memiliki nilai
numerik. Bilangan menunjukkan kuantitas dari atribut yang diukur. Kuantitas itu bergerak s
ecara berkelanjutan dari suatu nilai rendah tak terhingga kearah suatu nilai tinggi tak terhin
gga sehingga membentuk sebuah kontinum atau bentangan. Makin besar bilangan maka ma
kin besar pula nilai numeriknya dan sebaliknya. Artinya, selain mengandung informasi tent
ang identitas seperti pada pengukuran nominal, pada pengukuran ordinal bilangan juga bisa
dipakai untuk menunjukkan rank atau urutan jenjang berdasarkan kuantitas atribut yang diu
kur.
Pengukuran ordinal hanya bisa mulai diterapkan pada variabel kontinyu, yaitu variabe
l yang bisa ada atau muncul pada nilai berapa pun tanpa batas (Yaremko, Harari, Harrison, &
Lynn, 1982).
Jenis transformasi atau perubahan skala yang diperkenankan untuk dilakukan terhada
p skala ordinal disebut transformasi monotonik, yaitu jenis transformasi yang tidak mempeng
aruhi dalam arti mengubah urutan jenjang antar nilai-nilai skala, seperti menambah masing-m
asing skala dengan bilangan konstan tertentu atau mengalikannya dengan sebuah bilanga posi
tif (Allen & Yen, 1979).
Pada taraf pengukuran ini bilangan yang dikenakan pada suatu objek sudah memiliki
nilai numerik dan memiliki satuan interval yang sama atau tetap (equal interval unit) antar bil
angan. Menurut Stevens (1946), pada taraf pengukuran interval inilah sebenarnya kita baru su
ngguh-sungguh mencapai taraf “kuantitatif” dalam arti yang sebenarnya. Maka selain menga
ndung informasi tentang identitas dan urutan jenjang, bilangan pada pengukuran interval juga
memiliki informasi tentang kesamaan jarak antar bilangan. Seperti pengukuran ordinal, pengu
kuran interval juga hanya berlaku pada variabel kontinyu.
Setiap jenis transformasi linear admissible atau diperkenankan untuk dilakukan terhad
ap skala interval. Rumus transformasi linear adalah Y = aX + b, di mana a dan b merupakan
bilangan konstan, Y adalah nilai skala baru hasil transformasi, sedangkan X adalah nilai skala
asli atau awalnya. Transformasi linear tidak mengubah rasio atau perbandingan jarak antar nil
ai skala pada skala interval, dengan syarat nilai bilangan konstan a harus lebih besar dari 0 (A
llen & Yen, 1979).
5
2.2.4 Pengukuran Rasio
Pada taraf pengukuran ini bilangan yang dikenakan pada suatu objek memiliki kualita
s informasi penuh, yaitu menunjukkan identitas, menunjukkan urutan jenjang, menunjukkan i
nterval atau jarak yang sama antar nilai atau bilangan, dan menunjukkan nol mutlak.
Judgment atau penilaian mencakup semua jenis respon yang bisa dibedakan ke dalam
kategori benar atau salah (Nunnally, Jr., 1970, h. 162). Artinya, terdapat suatu ukuran atau
kriteria objektif untuk menentukan apakah suatu penilaian benar atau salah. Dalam
pengukuran psikologis, kadang-kadang responden tidak sekadar diminta memberikan
penilaian terhadap ketepatan relatif atau ketepatan masing-masing dari suatu rangkaian objek
atau pernyataan, dengan harapan responden mampu menemukan jawaban yang paling benar.
Judgment atau penilaian merupakan jenis respon yang biasa dipakai sebagai dasar untuk
6
melakukan pengukuran terhadap maximal performance seseorang dalam memecahkan
masalah.
Respon ini mencakup semua jenis respon yang mencerminkan rasa suka atau tidak
suka, sikap, minat, preferensi atau pilihan pribadi, nilai pribadi, dan sejenisnya (Nunnally, Jr.,
1970, h. 162). Tidak tersedia ukuran atau kriteria objektif untuk menentukan apakah suatu
respon perasaan benar atau salah. Sebagai sesuatu yang bersifat subjektif, apa pun pilihan,
minat, atau sikap seseorang terhadap objek, orang lain, atau peristiwa tertentu adalah “benar”
dalam arti sah. Tentu saja itu itu bisa dinyatakan benar atau salah baik secara umum maupun
secara moral, tetapi pilihannya itu sendiri tidak bisa dinyatakan benar atau salah, dalam arti
sah. Sebagai contoh, kita tidak bisa menyatakan benar atau salah terhadap sikap atau tindakan
seseorang yang lebih menyukai buah durian dari pada mangga, termasuk ketika kemudian
terbukti bahwa kesukaannya itu membuatnya terkena serangan stroke ringan. Respon ini
merupakan respon yang didominasi oleh fungsi afeksi atau rasa dan biasa dipakai sebagai
dasar untuk melakukan pengukuran terhadap typical performance atau kecenderungan
seseorang dalam bertingkah laku secara khas atau kepribadiannya.
Terdapat dua segi dari respon ini yaitu, dari segi proses psikis yang ditempuh dan dari
segi modalitas perilaku atau media yang dipakai dalam merespon.
b. Respon Komparatif
7
Subjek diminta menyatakan penilaian atau perasaannya dengan cara memilih salah
satu dari antara beberapa alternatif respon yang telah disediakan atau dengan mendasarkan
pada suatu ukuran atau patokan sebagai pembanding. Contohnya adalah mengerjakan item
pengukuran psikologis berformat pilihan wajib, pilihan ganda, atau menjodohkan. Dalam
item berformat pilihan wajib subjek harus mmemilih salah satu dari antara dua alternatif
respon, misal “Ya” atau “Tidak”, atau “Benar” atau “Salah”. Dalam item berformat pilihan
ganda subjek harus memilih salah satu dari antara lebih dari dua alternatif respon yang
disediakan. Dalam pengukuran atribut psikologi yang menuntut respon berupa penilaian,
subjek bisa dituntut untuk memilih salah satu jawaban yang benar atau yang paling benar.
Dalam item berformat menjodohkankan subjek harus menemukan pasangan-pasangan yang
tepat dari antara serangkaian alternatif objek yang bisa dipasang-pasangkan.
2. Dari Segi Modalitas Perilaku atau Media yang Dipakai dalam Merespon
a. Respon Lisan
Respon lisan merupakan salah satu jenis respon dasar dalam arti paling sering dipakai
dalam pengukuran psikologis khususunya menyangkut pengukuran penilaian atau perasaan.
Subjek diberi pernyataan atau tugas tertentu, dan harus mengerjakan tugas itu secara lisan.
Dalam pengukuran kepribadian, karena biasanya subjek diminta melaporkan keadaan
pribadinya maka respon verbalnya tersebut biasa disebut self-report. Laporan lisan tentang
keadaan diri tersebut selanjutnya dipakai sebagai data untuk melakukan inferensi tentang
atribut psikologis tertentu yang sedang menjadi sasaran pengukuran.
b. Respon Tertulis
Tertulis adalah laporan verbal yang diberikan dengan cara dituliskan pada lembar
kerja atau lembar jawab. Jenis respon ini menuntut responden mampu menulis dan dengan
sendirinya juga membaca dan respon ini merupakan self-report pula.
c. Respon Kinerja
Dalam pengukuran atribut psikologis yang kompleks dalam arti melibatkan baik
penilaian, perasaan, maupun kemampuan menjalankan peran tertentu, misal kemampuan
menjalankan peran atau tugas sebagai sekertaris, maka yang dipakai sebagai data pengukuran
biasanya adalah kinerja dala rangka menjalankan peran atau tugas yang sedang menjadi
sasaran pengukuran itu. Peran atau tugas tersebut pertama-tama harus dianalisis atau
diuraikan dulu ke dalam rangkaian tindakan tertentu dengan metode job-analysis dan
8
selanjutnya dirumuskan secara tertulis sebagai job-description. Selanjutnya, kinerja subjek
baik menyangkut ketepatan maupun kecepatan dalam melaksanakan rangkaian tindakan
tersebut secara keseluruhan dapat diamati dan dipakai sebagai data pengukuran tentang
kemampuannya menjalankan peran atau tugas sebagai sekretaris yang sedang menjadi
sasaran pengukuran.
d. Respon Termediasikan Komputer
Jenis respon ini bisa berupa laporan verbal tertulis atau kinerja tertentu yang
dilakukan pada sebuah komputer. Penggunaan komputer termasuk yang tersambung dengan
jaringan internet yang semakin lazim dalam pengukuran psikologis (Bray, 2010).
Jenis skala atau taraf pengukurannya, dikenal tiga jenis respon masing-masing
diungkap dengan satu atau lebih metode penskalaan, yaitu:
9
apakah jarak antar jenjang adalah sama baik ketika respon itu berupa perasaan maupun
penilaian.
d. Metode successive categories atau pengkategorian beruntun. Menurut Nunnally, Jr.
(1970), dalam metode ini subjek diminta memilah sejumlah besar stimuli ke dalam
sejumlah kategori terkait dengan atribut tertentu yang diurutkan mulai dari rendah sampai
tinggi.
Selain itu menurut Nunnally, Jr., ada beberapa variasi dalam melakukan kategorisasi,
tergantung dari jenis informasi yang ingin dijaring oleh peneliti. Dua variabel yang cukup
terkenal adalah teknik ordinal biasa dan teknik Q sort.
10
Teori tes klasik atau classical test theory (CTT) merupakan salah satu pendekatan
yang digunakan dalam dunia pengukuran dibidang Psikologi, dikenal juga sebagai teori skor
murni (true score theory). Teori ini dikembangkan oleh Spearman (1904) dan masih terus
digunakan hingga saat ini. CTT merupakan teori psikometri yang populer serta banyak
digunakan pada berbagai disiplin ilmu. Hasil lanjutan dari teori ini adalah yang kita kenal
sebagai Teori Respon Butir (Item Response Theory).
Dari sisi pendekatan, teori tes klasik mengadopsi pendekatan deterministik (certainty)
yaitu fokus utama analisis ada skor total individu (X). Setiap tes memiliki error (E) yang
menyertai setiap hasil pengukuran dalam mengukur sifat manusia. Skor murni (T) dan error
(E) keduanya adalah variabel laten, namun tujuan pengujian adalah untuk menarik
kesimpulan mengenai skor murni individu. Skor per item juga dapat dipastikan benar dan
salahnya yaitu misalnya jika jawaban seseorang benar maka diberi skor 1 dan salah diberi
skor 0.
Performasi subjek pada suatu skala pengukuran dinyatakan dalam angka yang disebut
skor. Skor ini merupakan skor perolehan pengukuran yang selanjutnya disebut sebagai skor
tampak atau dapat dilambangkan dengan X. Di dalam skor tampat terdapat skor murni (T)
dan error pengukuran (E) yang tidak pernah dapat diketahui besarannya. Teori tes klasik
bekerja pada tataran skor tampak dengan menggunakan model linier dalam menjelaskan
model skor. Beberapa asumsi yang mendasar skor dalam teori tes klasik di antaranya sebagai
berikut :
Asumsi 1 : X = T + E
Asumsi ini menyatakan bahwa hubungan skor tampak (X), skor murni (T), dan error
pengukuran (E) bersifat aditif. X yang diperoleh individu merupakan akumulasi dari T dan E.
Asumsi 2 : ᵋ(X) = T
Asumsi ini menyatakan bahwa skor murni merupakan nilai harapan X. Karena besar T
diasumsikan tetap dalam setiap pengukuran, maka besar varians skor tampak akan tergantung
pada variasi E.
Asumsi 3 : pet = 0
11
Korelasi antara E dan T adalah 0. Menurut asumsi ini, bagi suatu kelompok populasi subjek
yang dikenai tes distribusi E dan T adalah independen satu sama lain. Variasi eror tidak
tergantung pada variasi skor murni.
Asumsi 4 : pe1e2 = 0
Bila e1 adalah E tes pertama dan e2 adalah E tes kedua, maka asumsi ini menyatakan bahwa
distribusi E kedua tes tersebut tidak berkorelasi satu sama lain.
Asumsi 5 : pe1t2 = 0
Menyatakan bahwa E pada suatu tes tidak berkorelasi dengan T pada tes lain.
12
Tes merupakan salah satu jenis asessment yang menggunakan berbagai prosedur
untuk mendapatkan informasi dan mengonversikan informasi tersebut ke dalam
bilangan atau skor.
3. Gregory (2007): sebuah prosedur baku untuk mengambil sampel perilaku dan
mendeskripsikannya melalui kategori atau skor.
1. Prosedur Standard
Karakteristik penting dari setiap tes psikologi. Suatu tes dikatakan bersifat
standard apabila prosedur pelaksanaannya seragam antara satu penguji dengan
penguji yang lain
2. Sampel Perilaku
Merupakan subjek yang akan dilangsungkan sebuah tes
3. Skor atau Kategori
4. Norma atau Standard
5. Prediksi atas perilaku non tes.
1. Tidak ada pendekatan tunggal dalam pengukuran konstrak apapun yang dapat diterima
secara universal.Hal ini terjadi dikarenakan pengukuran konstrak psikolgis yang tidak
dapat dilakukan secara langsung melainkan harus melalui observasi terhadap fenomena
keperilakuan. Dua orang perancang tes dalam konstruk yang sama cenderung memilih
tipe sampel perilaku yang berbeda dalam definisi operasional mereka dalam konstrak
yang bersangkutan. Perbedaan inilah yang akan membawa kepada perbedaan kesimpulan
sekalipun dalam tes untuk mengungkap atribut yang sama.
2. Pengukuran psikologis pada umumnya didasarkan pada sampel perilaku yang jumlahnya
terbatas.Populasi bentuk perilaku yang merupakan indikasi kehadiran atribut psikologis
yang hendak diukur jumlahnya tidak terbatas. Tidak mungkin menghadapkan individu
pada soal-soal tes dalam jumlah yang banyak karena keterbatasan kemampuan para
penyusun tes dalam penulisan aitem dan tes yang terlalu panjang sangat tidak efisien.
Permasalahannya kemudian terletak pada pemiliha sampel perilaku yang representatif
sesuai dengan konstrak yang akan diukur.
13
3. Pengukuran selalu mungkin mengandung eror. Pada umumnya pengukuran psikologis
didasarkan pada sampel yang terbatas dan dilakukan hanya sekali. Tidak ada jaminan
bahwa hasil tes yang dilakukan berulang kali akan memiliki hasil yang konsisten
dikarenakan beberapa faktor, baik dari pihak individu yang dites maupun pihak individu
yang melakukan tes.
4. Satuan dalam skala pengukurna tidak dapat didefinisikan dengan baik. Tidak mudah
mendefinisikan satuan ukur psikologis dengan akurat dan menginterpretasikan hasilnya
dengan layak.
5. Konstrak psikologis tidak dapat didefinisikan secara operasional semata tapi harus pula
menampakkan hubungan dengan konstrak atau fenomena lain yang dapat diamati.
Pengukuran psikologis tidak banyak makna dan gunanya apabila tidak ditafsirkan sesuai
dengan konstrak teoretis yang mendasarinya. Karena Lord dan Novick (1968 dalam
Crocker & Algina, 1986) menekankan pentingnya untuk mendefinisikan konstrak yang
mendasari pengukuran psikologis dalam dua level.
Tujuan tes disini berarti apa atau siapa yang dituju atau dijadikan sasaran tes, dapat
dibedakan ke dalam tiga hal (Friedenberg, 1995): domain atau ranah atribut yang diukur,
audience atau khalayak yang akan dikenai tes, dan types of scores atau jenis skor.
Domain atau ranah adalah dimensi kepribadian atau wilayah perilaku yang menjadi
fokus atau sasaran pengetesan. Ranah atau wilayah perilaku dibedakan ke dalam tiga
kategori:
Ranah kognitif terkait dengan kemampuan olah piker atau olah cipta
Ranah afektif terkait dengan kemampuan olah rasa dan olah karsa
Ranah psikomotor terkait dengan kemampuan olah gerak
a. Maximal Performance Test
14
Maximal performance tests bertujuan mengukur aneka atribut psikologis yang
termasuk ke dalam ranah kognitif dan ranah psikomotor, dengan cara menentukan batas
maksimal atau batas atas atribut yang dimaksud dalam diri testi (Friedenberg, 1995,
dalam Supratiknya, 2014). Atribut psikologis dalam ranah kognitif yang menjadi sasaran
maximal performance tests lazim disebut abilitas atau kemampuan. Kemampuan dalam
arti abilitas menunjuk pada kemampuan seseorang melakukan tindakan tertentu kini,
bisa berupa kemampuan menjawab pertanyaan atau melaksanakan tugas tertentu. Selain
itu, abilitas dipandang bisa terbentuk akibat faktor bawaan atau hasil belajar, atau
kombinasi antara keduanya seperti akan kita lihat nanti (Chaplin, 1985; Anastasi, 1982,
dalam Supratiknya, 2014).
1) Achievement Test
Achievement test atau tes prestasi adalah maximal performance test yang
bertujuan mengukur kemampuan baru sebagai hasil kegiatan belajar yang baru
dijalani. Dengan kata lain, jenis kemampuan yang menjadi sasaran tes prestasi
memiliki asal usul spesifik yang jelas, yaitu nurture atau proses pembelajaran yang
baru dijalani tentu saja dalam batas-batas bakat yang dimiliki oleh murid atau pelajar
yang bersangkutan.
Dari segi tujuan, cakupan isi, dan waktu penyelenggaraannya, tes prestasi
dibedakan menjadi tes formatif dan tes sumatif (Friedenberg, 1995, dalam
Supratiknya, 2014). Tes formatif diselenggarakan pada titik-titik waktu tertentu
selama pelajaran atau kursus masih berlangsung dengan cakupan materi terbatas,
yaitu sebagian dari keseluruhan pelajaran atau kursus yang sudah diajarkan.
Tujuannya adalah untuk mendapatkan umpan balik tentang jalannya proses
pengajaran atau kursus baik bagi guru atau tutor maupun bagi murid atau peserta
kursus. Hasil tes formatif lazim digunakan untuk memutuskan perlu tidaknya
dilakukan remedial teaching atau pengajaran remedial untuk mengulang atau
15
memperdalam penguasaan bagian materi tertentu yang dipandang masih kurang.
Sebaliknya, tes sumatif diselenggarakan pada akhir pelajaran atau kursus, mencakup
seluruh materi yang diajarkan, dan ditujukan untuk menentukan nilai akhir sebagai
indikator umum tentang tingkat penguasaan atas pengetahuan yang baru dipelajari.
2) Aptitude Test
Aptitude tests atau tes bakat adalah maximal performance tests yang bertujuan
mengukur bakat atau potensi, yaitu potensi seseorang untuk mempelajari pengetahuan
baru. Di masa lalu, jenis kemampuan yang menjadi sasaran tes ini dipandang
memiliki asal-usul dalam nature, berupa hereditas atau pembawaan, lawan dari
prestasi sebagai jenis kemampuan yang pembentukannya dipandang lebih ditentukan
oleh nurture atau proses pembelajaran. Namun pandangan yang lebih progresif
cenderung menisbikan pembedaan antara nature dan nurture, dan memandang baik
bakat maupun prestasi sebagai hasil saling pengaruh antara faktor pembawaan dan
belajar yang berlangsung sepanjang sejarah kehidupan seseorang bahkan sejak dalam
kandungan.
Menurut pandangan baru ini, baik bakat maupun prestasi sama-sama
merupakan apa yang oleh Anastasi (1982) disebut developed abilities atau
“kemampuan yang tumbuh seiring perkembangan” hasil saling pengaruh antara faktor
pembawaan dan belajar. Berdasarkan konsep baru tentang developed abilities
sebagaimana dikemukakan Anastasi (1982, dalam Supratiknya, 2014) maka maximal
performance tests bisa dibedakan menjadi :
(1) tes prestasi yang berorientasi pada mata pelajaran tertentu,
(2) tes prestasi yang berorientasi luas,
(3) tes inteligensi dan tes bakat jenis verbal
(4) tes non bahasa dan tes kinerja
(5) tes culture fair,
16
psikomotor dan pengukurannya termasuk ke dalam maximal performance test, yang
disebut dengan skill atau keterampilan.
Dalam arti sempit, keterampilan mencakup berbagai jenis kemahiran atau
kecakapan yang cukup spesifik seperti keterampilan menjahit, memasak, merias,
menata rambut, bermain sepak bola, bermain badminton, berenang, dan sejenisnya.
Dalam arti luas, keterampilan mencakup gugus kemampuan atau pola tingkah
laku dalam rangka melaksanakan job atau tugas pekerjaan atau role atau peran
tertentu. Istilah yang kini sering dipakai adalah kompetensi. Keterampilan dalam arti
kompetensi menunjuk pada apa yang mampu dilakukan oleh seseorang dalam situasi
kehidupan nyata yang bersifat kompleks. Kompetensi mencakup serangkaian
himpunan “kemampuan” berupa keterampilan (dalam arti relatif lebih sempit),
pengetahuan, dan sikap tertentu (CEPH, 2011).
Dalam pengukuran keterampilan dalam arti sempit maupun dalam arti luas
sebagai pola tingkah laku ini, tujuannya adalah mengungkap maximal performance
yang mampu ditunjukkan oleh subjek baik dalam melakukan kecakapan tertentu
maupun dalam melaksanakan pola tingkah laku kompleks dalam rangka menjalankan
peran atau tugas pekerjaan tertentu.
Ada dua ciri penting yang melekat pada kategori typical performance tests.
Pertama, Typical performance tests bertujuan mengungkap keunikan disposisi atau
kecenderungan bertingkah laku pada masing-masing orang. Kedua, dalam typical
performance tests tidak dikenal jawaban salah (atau benar). Berbeda dengan skor pada
maximal performance test yang merupakan jawaban benar dan yang mencerminkan
kekuatan atau kuantitas atribut yang terdapat dalam diri testi, skor pada typical
performance test merupakan jawaban dengan arah isi tertentu yang mencerminkan
keunikan kecenderungan testi dalam bertingkah laku.
17
1) Tes Kepribadian Terstruktur
Tes kepribadian terstruktur adalah tes kepribadian yang materinya terdiri dari
serangkaian pertanyaan yang konvensional, terkristalkan atau terbakukan dalam
konteks budaya tertentu, di mana subjek harus memberikan respon dengan salah
satu dari sejumlah kecil cara yang sudah ditentukan secara pasti. Konsep
pembakuan dalam konteks budaya tertentu menunjuk pada kenyataan bahwa tes
kepribadian terstruktur lazimnya berupa tes verbal, dalam arti bahwa baik
pertanyaan atau tugas yang disajikan kepada subjek dan jawaban yang kemudian
harus diberikan oleh subjek dinyatakan dalam rumusan kata-kata.
Selain itu, tes kepribadian berupa tanya-jawab verbal tersebut pada dasarnya
merupakan self-ratings atau penilaian-diri (Meehl, 1945/1971). Karena dalam
rangka penilaian diri tersebut subjek pada dasarnya diminta melakukan
penyelidikan atau pemeriksaan atas dirinya sendiri berpedoman pada pertanyaan-
pertanyaan yang disajikan dalam tes, maka tes kepribadian terstruktur ini
lazimnya juga disebut self-inventory, inventori-diri, atau inventori kepribadian.
2) Tes Kepribadian Tak Terstruktur
Tes kepribadian takterstruktur identik dengan tehnik proyektif. Konsep tak-
terstruktur menunjuk pada jenis stimulus yang dipakai dalam tehnik proyektif,
yaitu ambigu atau bermakna ganda dalam arti tergantung cara subjek
mempersepsikan dan memaknainya atau subjektif.
Ciri pokok yang menjadi definisi tehnik proyektif adalah menyajikan kepada
responden sebuah stimulus ambigu, seperti sebuah gambar bercak tinta, dan
memintanya untuk menerangkan stimulus tersebut.
Tehnik proyektif lazim dikategorikan ke dalam lima tipe mengikuti taksonomi
yang pertama kali dikemukakan oleh Lindzey (1959, dalam Lilienfeld, Wood, &
Garb, 2000).
18
bagi mereka.
Hand Test (e.g., Kepada subjek ditunjukkan serangkaian gambar
Wagner, 1962). tentang tangan yang bergerak dan diminta
menebak apa kiranya yang sedang dilakukan oleh
masing-masing tangan.
Draw-A-Person Responden diminta menggambar satu sosok orang
Konstruksi Test (Machover, pada sehelai kertas kosong, kemudian diminta
1949). menggambar satu sosok orang lain berjenis
kelamin berbeda dari sosok orang pertama.
Thematic Kepada responden ditunjukkan serangkaian
Apperception gambar yang melukiskan aneka situasi sosial yang
Test (Murray & ambigu dan diminta mengisahkan sebuah cerita
Morgan, 1938). tentang tokoh-tokoh yang terdapat dalam masing-
masing gambar.
Washington Kepada responden disajikan serangkaian frase
Melengkapi University yang merupakan bagian dari sebuah kalimat yang
Sentence tidak lengkap (e.g. “Ibu saya ...) dan diminta
Completion Test melengkapinya sehingga menjadi sebuah kalimat
(Loevinger, utuh.
1976).
Rosenzweig Kepada responden disajikan serangkaian gambar
Picture kartun yang melukiskan aneka situasi yang
Frustration Study menimbulkan frustrasi (e.g. secara tidak sengaja
(Rosenzweig, terkena cipratan dari genangan air di permukaan
Fleming, & jalan yang terlindas roda mobil yang melintas) dan
Clark, 1947). diminta mengungkapkan responnya secara verbal
terhadap masing-masing situasi.
Menyusun/ Kepada responden disajikan serangkaian foto
Memilih Szondi Test penderita aneka gangguan psikiatrik, dan diminta
memilih pasien- pasien mana yang paling mereka
sukai dan yang paling
(Szondi, 1947).
19
Scott, 1969). paling kurang disukai sampai dengan yang paling
disukai.
Projective Subjek anak-anak diminta memainkan peran
Eskpresi puppet play orang lain (e.g. ayah, ibu) atau dirinya sendiri
(e.g. menggunakan serangkaian boneka yang
disediakan.
Woltmann, 1960).
Handwriting Subjek diminta memberikan secara spontan
analysis (lihat serangkaian contoh tulisan tangannya.
hasil review
Beyerstein &
Beyerstein,
1992).
Sumber: Lilienfeld, Wood, dan Garb (2000), The scientific status of projective techniques,
Psychological Science in the Public Interest, 1(2), November, h. 30, dalam Supratiknya,
2014
2. Penggolongan Tes Berdasarkan Audience atau Khalayak yang Akan Dikenai Tes
Khalayak adalah kelompok subjek yang dituju sebagai sasaran penerapan tes.
Identifikasi khalayak sasaran ini merupakan salah satu pilar validitas sebuah tes. Maksudnya,
setiap tes hanya akan menghasilkan pengukuran yang valid jika diterapkan pada kelompok
subjek yang menjadi sasaran yang dituju. Sebagai contoh, Wechsler Adult Intelligence Scale
(WAIS) adalah tes inteligensi yang ditujukan bagi kelompok subjek dewasa. Versi ketiga dari
tes ini (WAIS-III) ditujukan bagi kelompok subjek dewasa dalam rentang usia mulai 16 tahun
sampai dengan 89 tahun (Gregory, 2007). Tes ini kiranya tidak akan menghasilkan
pengukuran yang valid jika diterapkan pada kelompok subjek anak berusia kurang dari 16
tahun.
Penetapan khalayak sasaran tes psikologis lazimnya memang didasarkan pada
pembagian kelompok umur untuk populasi subjek normal, khususnya tes untuk khalayak
sasaran subjek dewasa dan subjek anak. Di luar itu ada kategori khalayak ketiga, yaitu
populasi subjek khusus meliputi subjek bayi dan anak usia dini serta subjek dewasa maupun
20
anak namun dengan kebutuhan khusus atau kemampuan yang berbeda dari populasi subjek
dewasa dan anak pada umumnya.
21
Skor ipsatif pada dasarnya bertujuan mengurutkan kekuatan serangkaian atribut
psikologis, bisa berupa kebutuhan, rasa suka, atau kecenderungan bertingkah laku dalam
perbandingannya satu dengan yang lain dalam diri seseorang (Friedenberg, 1995, dalam
Supratiknya, 2014). Dalam tes yang mengukur serangkaian atribut dengan skor ipsatif,
seorang testi tidak mungkin mencapai skor tinggi pada semua atribut, atau sebaliknya
mencapai skor rendah pada semua atribut, atau mencapai skor dengan pola tinggi-rendah
sembarang, melainkan akan mencapai pola skor yang mencerminkan jenjang urutan kekuatan
dari masing-masing atribut (Friedenberg, 1995, dalam Supratiknya, 2014). Karena bertujuan
membandingkan kekuatan relatif serangkaian atribut, item-item tes dengan skor ipsatif lazim
menggunakan format yang menuntut testi membandingkan atribut yang satu dengan atribut
yang lain, lazimnya dengan item berformat forced-choice (Friedenberg, 1995).
Dengan item berformat forced-choice testi diminta memilih salah satu pernyataan
yang dirasakan sesuai dengan keadaan dirinya pada setiap item. Hasilnya akan berupa profil
skor yang menunjukkan kekuatan relatif dari masing-masing kebutuhan dibandingkan aneka
kebutuhan lainnya. Secara terstruktur, jika seseorang mencapai skor tinggi pada kebutuhan
tertentu pastilah akan mencapai skor rendah pada kebutuhan lain, sehingga terbentuk profil
kebutuhan yang mencerminkan keunikan atau kekahasan kecenderungannya dalam
bertingkah laku.
22
2.6.2 Penggolongan Tes Berdasarkan Isi
Content atau isi tes psikologis menunjuk pada jenis kemampuan atau jenis atribut
psikologis yang terletak dalam masing-masing ranah, dimensi kepribadian atau wilayah
tingkah laku tersebut dan yang menjadi sasaran atau objek pengukuran. Dalam arti
kemampuan dalam ranah mana yang lebih mendominasi itulah kita bisa membedakan jenis-
jenis kemampuan yang menjadi content atau isi tes psikologis.
Di sini bisa ditemukan aneka tes mata pelajaran mulai jenjang pendidikan dasar
sampai jenjang pendidikan tinggi. Semua tes mata pelajaran tersebut lazimnya bisa
dibedakan menjadi dua, yaitu: (1) subject-matter standardized tests atau tes mata
pelajaran yang dibakukan, dan (2) subject matter teacher made tests atau tes mata
pelajaran yang dibuat sendiri oleh guru.
Berdasarkan jenis proses berpikir yang diukur, tes psikologis dapat dibedakan
menjadi: tes pengetahuan, tes pemahaman, tes kreativitas, dan sebagainya.
Berdasarkan jenis pengetahuan yang diukur , maka tes psikologis dapat digolongkan
menjadi: tes pengetahuan faktual, tes pengetahuan konseptual, tes pengetahuan
prosedural, dan sebagainya.
23
Dalam pengukuran kepribadian, ciri pembeda seseorang dari setiap orang lain yang
menjadi objek perhatiannya adalah disposisi kepribadian atau kecenderungan bertingkah laku
secara khas dan yang didominasi oleh fungsi afektif.
Social traits atau sifat sosial adalah cara khas seseorang bertingkah laku dalam
situasi sosial atau yang melibatkan kehadiran orang lain. Beberapa contoh sifat sosial
yang sudah diteliti dan dikembangkan alat ukurnya meliputi antara lain internal vs
external locus of control, individualisme-kolektivisme, sifat asertif, kepribadian tipe
A dan tipe B.
Motives, needs, atau drives yang dalam bahasa Indonesia disebut dorongan
atau kebutuhan adalah kekuatan dari dalam yang menggerakkan sekaligus
mengarahkan tingkah laku kita. Dalam pengukuran typical performance yang lazim
dijadikan fokus adalah jenis-jenis dorongan atau kebutuhan non-biologis atau sosial,
yaitu jenis-jenis dorongan atau kebutuhan yang terbentuk akibat proses belajar dalam
lingkungan sosial.
Personal conceptions atau konsepsi pribadi adalah cara orang berpikir atau
memandang dirinya dan cara orang memandang dunia atau pandangan hidupnya.
Beberapa contoh konsepsi pribadi yang sudah diteliti dan dikembangkan alat
ukurnya mencakup antara lain konsep diri, harga-diri, nilai, dan sikap terhadap aneka
objek.
24
relasinya dengan orang lain sehingga pada akhirnya juga mengganggu kesejahteraan
pribadinya. Contoh bentuk-bentuk penyesuaian diri yang baik dan yang bermasalah
yang sudah diteliti dan dikembangkan alat ukurnya meliputi antara lain subjective
well-being, depresi, dan kecemasan.
25
2.7.1 Penggunaan Tes di Lingkungan Klinis (Psychological Testing)
1. Diagnosis
Diagnosis adalah proses meliputi pengumpulan dan pengintegrasian hasil-hasil tes
dengan informasi lain yang diperoleh sebelumnya maupun kini tentang seseorang berikut
aneka keadaan kontekstualnya yang relevan dalam rangka menemukan tanda-tanda apakah
yang bersangkutan dalam keadaan sehat secara psikologis atau sebaliknya mengalami
gangguan. Tes sangat membantu dalam membuat diagnosis psikologis terhadap seseorang.
2. Perencanaan Intervensi dan Evaluasi Hasilnya
Hasil tes juga sangat membantu dalam merencanakan, melaksanakan, dan
mengevaluasi intervensi psikologis. Intervensi semacam ini bisa ditujukan untuk mencegah
terjadinya satu atau lebih simptom, gangguan psikologis, menstabilkan atau bahkan
mengatasi simptom, mengurangi dampak merusaknya, serta memenuhi berbagai kebutuhan
fisik, psikologis, dan sosial seseorang.
3. Pengambilan Keputusan Hukum dan Kebijakan Pemerintah
Hasil tes juga bisa sangat membantu dalam pengambilan keputusan dibidang hukum
pengadilan maupun urusan pemerintahan lainnya. Hasil tes bisa digunakan untuk
memberikan informasi penting kepada pihak ketiga, penasehat hukum klien di pengadilan,
penasehat hukum pihak lain yang berperkara dengan klien, hakim, atau panitera tentang
kondisi psikologis klien yang terkait dengan perkara hukum yang sedang dihadapinya.hasil
tes juga bisa digunakan sebagai dasar untuk memutuskan penerimaan dan penempatan
pegawai yang menyandang kebutuhan khusus tertentu atau membuat berbagai jenis
keputusan administratif seperti pembatan lisensi, pemberian kompensasi, dan sebagainya.
4. Pemahaman Diri, Pertumbuhan, dan Pengambilan Keputusan Pribadi
Tes juga lazim digunakan untuk memberikan informasi dalam rangka membantu
seseorang lebih memahami dirinya, menemukan aneka kekuatan dan kekurangannya, serta
memperjelas dalam arti menjadi paham tentang berbagai hal terkait diri mereka yang penting
agar mampu membuat keputusan yang tepat dan mengalami perkembangan pribadi.
26
a. Mengevaluasi prestasi dan kemajuan belajar masing-masing murid terkait ranah isi atau
mata pelajaran tertentu
b. Mendiagnosis kekuatan dan kelemahan masing-masing murid dalam setiap maupun
antar mata pelajaran
c. Merancang aneka bentuk intervensi dan menyusun rencana pengajaran yang disesuaikan
dengan kebutuhan masing-masing murid
d. Menempatkan murid ke dalam program pendidikan yang sesuai
e. Menyeleksi calon untuk diterima mengikuti program dengan daya tampung yang terbatas
f. Memberikan sertifikasi terhadap pencapaian prestasi atau perolehan aneka kualifikasi
tertentu
2. Penggunaan Tes untuk Menilai Kinerja Kelompok
Informasi tentang status atau keadaan, kemajuan, dan pencapaian kelompok satuan
kerja pendidikan seperti sekolah, dinas pendidikan kota/kabupaten, atau dinas
pendidikan propinsi dapat digunakan untuk tujuan seperti :
a. Menilai dan memonitor kualitas aneka program pendidikan yang ditujukan bagi
seluruh murid atau bagi kelompok-kelompok murid tertentu
b. Menentukan keberhasilan aneka kebijakan dan intervensi yang telah dipilih untuk
dievaluasi
2.7.3 Penggunaan Tes untuk Pembinaan Pegawai dan Credentialing atau Pemberian
Pengakuan
1. Penggunaan Pegawai
a. Seleksi yaitu pengambilan keputusan tentang calon-calon pegawai mana yang
akan diterima bekerja dilingkungan sebuah organisasi atau perusahaan
b. Placement atau penempatan yaitu Pengambilan keputusan tentang penugasan
para pegawai yang sudah diterima ke berbagai pos dalam sebuah organisasi
atau perusahaan
c. Promosi yaitu pengambilan keputusan tentang para pegawai yang akan
ditempatkan dalam pos atau jabatan yang lebih tinggi
Semua kegiatan itu didasarkan pada prediksi dalam arti penilaian tentang kemampuan
kerja para pegawai di masa mendatang demi mengoptimalkan kinerja organisasi atau
27
perusahaan dalam bentuk peningkatan efisiensi, pertumbuhan, produktivitas, serta
motivasi dan kepuasan pegawai.
Tes juga banyak digunakan dalam kegiatan evaluasi program dan dalam pengambilan
kepuasan terkait kebijakan publik. Evaluasi program merupakan serangkaian prosedur yang
digunakan dalam rangka menilai atau menaksir kebutuhan klien akan program tertentu, cara
mengimplementasikan program itu, efektivitas program itu, dan nilai atau manfaatnya bagi
klien. Studi kebijakan memiliki cakupan yang lebih luas dibandingkan evaluasi program,
berupa kajian-kajian yang hasilnya digunakan untuk mengevaluasi aneka rencana, prinsip,
atau prosedur yang dilaksanakan untuk mencapai tujuan-tujuan publik yang bersifat luas.
Dalam praktek, sering terjadi tumpang tindih antara evaluasi program dan studi kebijakan.
Hasil tes digunakan untuk sebagai dasar pertimbangan untuk memulai atau melaksanakan,
melanjutkan, memodifikasi, mengakhiri, atau mengembangkan aneka program dan kebijakan.
Menurut Fridenberg (1995), terdapat beberapa syarat untuk mengatakan suatu tes itu
baik atau tidak, syarat tersebut meliputi desain atau rancangan dan segi psikometriknya. Pada
proses penyusunan tes syarat tersebut harus diusahakan dalam dua tahap yaitu tahap
konseptual-teoritis tahap empiris-statis.
Tahap yang pertama adalah tahap konseptual-teoritis, tahap ini berkaitan dengan
desain atau rancangan tes. Pada tahap ini hal-hal yang harus dirumuskan pada perancangan
tes adalah:
28
1. tujuan tes, meliputi hal yang ingin dites, subjek yang akan dites, serta bagaimana skor tes
akan digunakan
2. ranah isi yang akan diukur
3. prosedur administrasi
4. prosedur penskoran
Tahap empiris-statis, terdiri dari dua proses utama yaitu proses uji coba ( try out) dan
proses pemeriksaan pemenuhan syarat-syarat psikometrik tes meliputi analisi butir (item
analysis).item analysis ini berfugsi memeriksa ciri-ciri psikometrik item-item tes secara
individual dan dilanjutkan pemeriksaan pemenuhan syarat-syarat psikometri item-item secara
keseluruhan sebagi kesatuan tes.
Tujuan tes mencakup tiga hal, yaitu: atribut pssikologis yang akan diukur, populasi
subjek yang akan dites, jenis skor ( bagaimana hasil skor akan digunakan) (Fridenberg,
1995).
29
b. Populasi subjek yang akan dites
Berkaitan dengan populsi subjek yang akan dikenai tes. Tes intelegensi untuk populasi
subjek dewasa seperti WAIS misalnya, tidak akan memberikan hasil yang valid jika
dikenakan pada sampel subjek anak-anak begitu juga sebaliknya. Maka populasi
subjek harus benar-benar dirumuskan secara jelas sejak awal sesuai dengan apa yang
ingin kita ambil hasil tesnya. Selain itu perbedaan atau kesalahan dalam pemilihan
populasi berdamapak pada jenis tugas yang harus digunakan sebagai item-item tes
terkait perbedaan kemampuan kelompok subjek.
c. Jenis skor
Skor hasil tes dapat digunakan dengan berbagai cara. Beberapa jenis skor tes:
1) Penskoran beracuan norma ( normreferenced scoring) skor digunakan untuk
membandingkan kinerja relatif seorang testi dengan kelompok sebaya.
2) Penskoran beracuan kriteria ( criterion-referenced scoring) Skor tes digunakan
untuk membandingkan kinerja testi dengan kriteria absolut untuk menunjukan taraf
penguasaan atau taraf pemilikan atas atribut psikologis tertentu.
Penskoran normative, menunjukan taraf pemilikan atas atribut psikologis tugas
tertentu. Penskoran ipsatif, menunjukan taraf penguasaan atau pemiilikan satu
atau lebih atribut psikologis lain dalam tes untuk mengukur lebih dari satu atribut
psikologis secara serentak atau bersamaan.
30
Prosedur administrasi tes biasanya terdapat di dalam buku instruksi tes, prosedur ini
berisi petunjuk dan aneka pedoman tentang kondisi pelaksanaan tes. Biasanya mencakup cara
testi memberikan respon, jenis bantuan yang boleh diberikan, tugas, cara testi meperbaiki
respon yang keliru, serta lama waktu pengerjaan. Prosedur administrasi tes disebut
standardize.
Prosedur penskoran biasanya dimuat di dalam buku petunjuk tes, hal ini dilakukan
untuk menjamin ketepatan penskoran dan pelaporan hasil tes. Skor tes dalam bentuk raw
score masih harus ditafsirkan untuk mendapatkan hasil yang dimalsudkan dari tes itu sendiri
( AERA, APA, & NCME, 1999 dalam Supratiknya). Cara utnuk penafsiran skor tes tersebut
juga perlu dimuat didalam buku petunjuk tes untuk dijamin kebakuannya. Pelaporan ini juga
diserta dengan keterangan tentang keterbatasan serta keterkaitannya dengan informasi lain.
Segi psikometis tes ialah kualitas kinerja tes sebgai alat ysng dimaksudkan untuk
mengukur atribut psikologis tertentu. Terdapat empat aspek esensial kualitas yang
menentukan kinerja tes sebagai alat ukur yaiutu validitas, reliabilitas, statistik item, dan daya
diskriminasi tes.
1. Validitas
Validitas adalah kualitas esensial yang menunjukkan sejauh mana suatu tes sungguh-
sungguh mengukur atribut psikologis yang hendak diukurnya. Terdapat beberapa pengertian
valditas. Pertama validitas ialah kalitas atau ciri yang melekat pada tes. Kedua, validitas
dibedakan kedalam tiga tipe atau jenis dikenal sebagai “trinity” yaitu content validity atau
validitas isi, criterion-related validity atau criterrion oriented validity dan construk validity
( Goodwin & Leech, 2003 dalam Supratiknya).
Menurut AERA, APA, & NCME 1999 dalam Supratiknya, memberikan rumusan
bahwa validitas itu ialah kualitas konsekuensi sosial yang ditimbulkan oleh penafsiran hasil
tes sesusai tujuan penggunaan tes. Maksudnya, seberapa baik sebuah tes mampu menjalankan
tugasnya yana langsung terkait dengan nasib seseorang, maka disebut sebagai konsekuensi
sosial. Dengan kata lain, validitas adalah taraf sejauh mana evidensi atau bukti-bukti empiris
31
maupun teoritis mendukung dalam arti membenarkan cara menafsirkan tes sesuai tujuan
penggunaan tes.
Untuk memeriksa validitas penafsiran skor sesuai tujuan penggunaan tes terdapat lima
jenis evidensi yang harus dikumpulkan ( AEERA, APA, & NCME, 199; GOODWIN &
Leech, 2003 dalam Supratiknya).
Kesesuian antara isi tes dan konstruk yang diukurnya. Aspek-aspek isi tes yang perlu
dievaluasi meliputi:
sufficiency, yaitu isi tes harus mewakili ranah isi spesifiknyang hendak diukur
clarity, yaitu isi tes harus mencerminkan secara jelas ranah isi spesifik yang hendak
diukur
relevance, isi tes harus sesuai dengan aspek-aspek yang hendak diukur
kesesuain antara item-item dan tugas-tugas yang dipakai sebgai stimulus dalam tes
tersebut
ada-tidaknya bias berupa keberpihakan tes pada gender, budaya, umur atau factor
pengelompokan sosial lainnya
kemungkinan terjadinya ketidakrelevanan varian dengan konstruk yang hendak diukur
wdan kurang memadai keterwakilan konstruk yang menunjukan seajuh mana tes tersebut
melebihi atau kurang dari yang semestinya dia ukur.
Evidensi ini didasarkan pada penilaian terhadap konstruk yang diukur dengan kinerja atau
respon yang diberikan oleh subjek. Beberapa strategi mengumpulkan jenis tes ini:
32
Evidensi ini didasarkan pada penilaian sejauh mana hubungan antar item dan
hubungan antar komponen tes sesuai dengan konstruk yang diukur. Salah satu metode yang
sering digunakan ialah analisis konfirmatori dan defferential item function (DIF) tecniques.
Evidensi validitas juga bisa diproleh dengan menganalisis hubungan anata skor tes
dan variabel-variabel lain di luar tes itu sendiri. Variabel eksternal mencakup tiga hal:
seberapa akurat tes tersebut mamapu meprediksikan kinerja yang merupakan kriterianya
tes lain dimaksudkan untuk mengukur konstruk yang sama seperti yang diukur oleh tes
yang bersangkutan
tes lain dimaksudkan untuk mengukur kontruk yang berbeda.
Dampak atau akibat yag direncanakan maupun yang tidak direncanakan dari
penerapan tes juga bisa digunakan sebagai evedensi validitas. Tujuan validasi adalah
memperoleh evidensi atau bukti bahwa manfaat tersebut sungguh-sungguh terjadi.
2. Reliabilitas
b. Koefisien Reliabilitas
33
Terdapat tiga koefisien reliabilitas yaitu koefisien bentuk alternatif merupakan hasil
dari koefisien yang diperoleh dari pengadminitrasian bentuk-bentuk pararel tes pada
kesempatan yang berlainan, koefisien stabilitas merupakan hasil dari koefisien yang
diperoleh dari pengadministrasian tes yang sama terhadapa kelompok subjek yang sama pada
kesempatan yang berlainan, dan koefisien konsistensi internal merupakan hasil dari
koefisien yang diperoleh dari saru kali pengadministrasian tes pada kelompok subjek.
Semakin besar tiga jenis koefisien tersebut, maki kecil kesalahan pengukuran sehingga maki
tinggi reliabilitas hasil pengukurannya.
Fungsi informasi tes mampu mendiskriminasikan dalam arit memilah testi pada
berbagai taraf abilitas atau atribut psikologis yan saedang diukur.
3. Statistik Item
Statistik item-item yang membentuk sebuah tes psikologis diperiksa melalui analisis
item sesudah item-item tersebut diuji cobakan pada sekelompok sampel standarisasi. Tujuan
analisis item adalah untuk memilih item-item yang akan membentuk sebuah skala yang
bersifat homogen dan memiliki daya diskriminasi yang baik. Cara yang paling lazim
ditempuh adalah memeriksa korelasi antara masing-masing item dengan skor total serta
menghitung proporsi subjek yang memilih kunci jawaban. Terdapat dua jenis statistik yang
lazim dijadikan indeks bagi item yang baik, yaitu:
Cara ini cocok untuk diterapkan pada multi-point items (item-item yang memiliki
alternatif jawaban ganda dalam arti lebih dari dua).
34
Cara ini cocok diterapkan pada item-item dikotomis (item-item yang hanya memliki
dua alternatif jawaban termasuk item-item “Ya-Tidak” dan “Benar-Salah”).
Cara ini cocok diterapkan jika skor total skala dibuat dikotomis, misal menjadi “Lulus-
Tidak lulus” atau “Di atas Rerata-Di bawah Rerata” dengan asumsi bahwa kedua
kategori tersebut sungguh-sungguh bersifat non-kontinyu.
Cara ini bisa diterapkan sebagai ganti atau setara koefisien-phi. Bedanya, kategori
“Lulus-Tidak lulus” atau “Benar-Salah” atau sejenisnya diasumsikan bersifat kontinyu.
Masalahnya, korelasi tetrakorik memiliki kesalahan baku (standard error) yang besar
( dua kali lebih besar dari kesalahan baku korelasi product moment).
Proporsi ini dihitung dengan cara membagi jumlah subjek pemilih kunci jawaban
pada masing-masing item dengan jumlah total subjek penjawab (p = ∑n/N). Salah satu
kendala dalam memeriksa statistik ini adalah kemungkinan adanya subjek yang melewatkan
menjawab satu atau lebih item tertentu.
Salah satu statistik yang paling direkomendasikan untuk memeriksa daya diskriminasi
tes adalah koefisien diskriminasi yang disebut Ferguson’s delta atau δ (Kline, 1986).
koefisien diskriminasi menunjukkan seberapa cermat dan konsisten sebuah tes
menjenjangkan testi sepasang demi sepasang dalam hal atribut psikologis yang diukur.
Menurut Kline (1986), rumus koefisien diskriminasi delta Ferguson adalah sebagai berikut:
35
Langkah-langkah perhitungan delta Ferguson adalah sebagai berikut (Kline, 1986):
BAB III
PENUTUP
3.1 KESIMPULAN
Pengukuran merupakan sebuah alat atau pun cara yang digunakan sesorang untuk
mengumpulkan atau memperoleh sesuatu yang diinginkan. Biasanya pengukuran ini berisi
bilangan-bilangan atau pun objek tertentu yang akan diolah dan harus sesuai dengan
aturan-aturan yang berlaku. Pengukuran merupakan hal yang sangat sering digunakan pada
setiap bidang ilmu, dalam hal ini psikologi. Pengukuran psikologi sendiri harus dilakukan
sesuai sesuai syarat-syarat yang berlaku seperti uji validitas, reliabilitas dan lainnya agar
tidak terjadi kekeliruan dan tidak mendapakan hasil yang salah. Pengukuran psikologi ini
juga memberikan maanfaat diberbagai bidang kehidupan seperti di lingkungan sekolah dan
klinis.
36
DAFTAR PUSTAKA
Azwar, Saifuddin. 2018. Dasar-Dasar Psikometrika (Edisi II). Yogyakarta: Pustaka
Pelajar
37