Ranking scales
Ranking scales (skala peringkat) digunakan untuk
memanfaatkan kecenderungan antara dua atau lebih objek-objek atau item. Namun,
peringkat tersebut tidak dapat memberikan petunjuk pasti untuk beberapa jawaban
yang dicari. Sebagai contoh, katakanlah ada empat lini produk dan manajer
mencari informasi yang akan membantu memutuskan mana produk yang harus
mendapatkan perhatian yang besar. Mari kita juga berasumsi bahwa 35% responden
memilih produk pertama, 25% kedua, dan 20% memilih masing-masing produk tiga
dan empat sebagai pilihan bagi mereka. Manajer tidak bisa kemudian menyimpulkan
bahwa produk pertama adalah yang paling disukai, karena 65% dari responden
tidak memilih produk itu! Metode alternatif yang digunakan adalah paired comparisons (perbandingan
berpasangan), forced choice (pilihan
paksa), dan comparative scale (skala
perbandingan).
Paired comparisons
Skala perbandingan berpasangan digunakan ketika, di antara
sejumlah kecil objek, responden diminta untuk memilih antara objek pada waktu
yang bersamaan. Hal ini membantu untuk menilai kecenderungan pilihan. Jika,
misalnya, dalam contoh sebelumnya, selama perbandingan berpasangan, responden
secara konsisten menunjukkan pilihan untuk produk yang satu atas produk dua,
tiga dan empat, manajer andal dapat memahami produk yang menuntut perhatian
penuh nya. Namun, karena jumlah objek yang akan dibandingkan meningkat, begitu
juga jumlah perbandingan berpasangan. Jumlah pilihan berpasangan untuk objek n
akan menjadi [(n) (n-1) / 2]. Semakin besar jumlah objek atau stimulus, semakin
besar jumlah perbandingan berpasangan disajikan kepada responden, dan semakin
besar kelelahan responden. Oleh karena itu, perbandingan berpasangan adalah
metode yang baik jika jumlah stimulus yang disajikan adalah kecil.
Forced choice
Forced choice memungkinkan responden untuk
mengurutkan objek dan membandingkan satu sama lain, di antara alternatif yang disediakan.
Ini adalah mudah bagi responden, terutama jika jumlah pilihan untuk digolongkan
terbatas jumlahnya.
Comparative scale
Skala komparatif menyediakan patokan atau titik acuan untuk
menilai sikap terhadap objek saat ini, peristiwa, atau situasi yang diteliti. Skala
penilaian yang digunakan untuk mengukur konsep perilaku. Skala peringkat
digunakan untuk membuat perbandingan atau peringkat variabel yang telah disadap
pada skala nominal.
International
dimensions of scaling
Selain kepekaan terhadap definisi operasional konsep dalam
budaya lain, masalah scaling juga perlu dibahas dalam lintas budaya penelitian.
Budaya yang berbeda bereaksi secara berbeda juga terhadap masalah scaling.
Misalnya, titik lima atau skala tujuh poin dapat membuat perbedaan di AS,
tetapi bisa di respon secara berbeda oleh subyek di negara lain.
Goodness of measures
Sekarang kita telah melihat bagaimana mendefinisikan variabel
secara operasional dan menerapkan teknik penskalaan yang berbeda, penting untuk
memastikan bahwa instrumen yang kami kembangkan untuk mengukur suatu konsep
tertentu memang akurat mengukur variabel, dan bahwa, pada kenyataannya, kita
benar-benar mengukur konsep yang kami tetapkan untuk mengukur. Penggunaan
instrumen yang lebih baik akan memastikan akurasi lebih pada hasil, yang pada
gilirannya akan meningkatkan kualitas ilmiah penelitian.
Mari kita memeriksa bagaimana kita dapat memastikan bahwa
langkah-langkah yang dikembangkan adalah yang cukup baik. Pertama, analisis
item tanggapan terhadap pertanyaan-pertanyaan variabel yang dilakukan, dan
kemudian reliabilitas dan validitas dari langkah-langkah ditetapkan.
Item analysis
Analisis item dilakukan untuk melihat apakah item dalam
instrumen termasuk sana atau tidak. Dalam analisis item, berarti antara
kelompok skor tinggi dan kelompok skor rendah diuji untuk mendeteksi perbedaan
yang signifikan melalui t-nilai. Item dengan tinggi t-nilai (tes yang mampu
mengidentifikasi item yang sangat diskriminatif dalam instrumen) tersebut
kemudian dimasukkan dalam instrumen. Setelah itu, tes untuk keandalan instrumen
dilakukan dan validitas ukuran dibuat.
Validitas
Validitas berasal dari kata “validity” yang artinya
sejauhmana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi
ukurnya. Kita akan peduli tentang masalah keaslian penyebab dan akibat hubungan
(validitas internal), dan generalisasi terhadap lingkungan eksternal (validitas
eksternal). Beberapa jenis uji validitas digunakan untuk menguji kebaikan
ukuran dan penulis menggunakan istilah yang berbeda untuk menunjukkan mereka.
Demi kejelasan, kita kelompokan uji validitas dengan tiga judul: content validity (validitas isi), criterion-related validity (kriteria
yang berhubungan dengan validitas), dan construct
validity (validitas konstruk).
Content validity
Content validity adalah validitas yang berkaitan dengan baik atau buruknya
sampel yang diambil dari populasi. Validitas isi memastikan bahwa mengukur
mencakup set yang memadai dan representatif item yang memanfaatkan konsep
tersebut. Semakin banyak item skala mewakili domain atau semesta dari konsep
yang diukur, semakin besar validitas konten. Untuk dimasukkan ke dalam cara
yang berbeda, validitas isi adalah fungsi dari seberapa baik dimensi dan elemen
dari sebuah konsep yang telah digambarkan.
Face validity atau validitas rupa adalah validitas yang berhubungan dengan
apa yang kelihatan dalam mengukur sesuatu, tetapi bukan terhadap apa yang
seharusnya akan diukur.
Criterion-related validity
Validitas kriteria terkait dibuat ketika mengukur membedakan
individu pada kriteria yang diharapkan diprediksi. Hal ini dapat dilakukan
dengan membentuk concurrent validity
(validitas konkuren) atau predictive
validity (validitas prediktif).
Concurrent validity adalah validitas yang berkaitan
dengan hubungan (korelasi) antara skor dalam item instrumen dengan kinerja,
atau objek penelitian yang lain.
Predictive validity adalah validitas perkiraan yang
berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerja atau
seseorang di masa mendatang berdasarkan pengukuran awal. Validitas prediksi
adalah validitas instrumen yang diharapkan bisa memiliki hubungan dengan hasil
yang diharapkan dari instrumen yang dibuat. Validitas prediktif menunjukkan
kemampuan alat ukur untuk membedakan antara individu dengan mengacu pada kriteria
masa depan.
Construct validity
Validitas konstruk adalah validitas yang berkenaan dengan
kualitas dalam aspek psikologis tentang apa yang diukur oleh suatu pengukuran
serta terdapat evaluasi bahwa suatu konstruk tertentu itu bisa menyebabkan
kinerja dan hasil yang baik dalam pengukuran. Validitas konstruk membuktikan
seberapa baik hasil yang diperoleh dari penggunaan ukuran sesuai dengan
teori-teori sekitar yang tes dirancang. Hal ini dinilai melalui convergent validity (validitas konvergen) dan discriminant validity (validitas diskriminan).
Convergent validity adalah sejauh mana operasi ini mirip
dengan (menyatu pada) operasi lain yang secara teoritis juga harus sama dengan.
Validitas konvergen akan dibuat bila nilai yang diperoleh dengan dua instrumen
yang berbeda mengukur konsep yang sama sangat berkorelasi.
Discriminant validity dibuat bila, berdasarkan teori, dua
variabel yang diprediksi akan berkorelasi, dan skor yang diperoleh dengan
mengukur mereka memang secara empiris ditemukan begitu. Validitas dengan
demikian dapat dibentuk dalam berbagai cara. Beberapa cara di mana
bentuk-bentuk di atas validitas dapat dibentuk adalah melalui:
1.
Korelasional
analisis (seperti dalam kasus validitas konkuren dan validitas prediktif atau
validitas konvergen dan diskriminan)
2.
Analisis
faktor, teknik multivariat yang menegaskan dimensi konsep yang telah
didefinisikan secara operasional, serta menunjukkan yang mana dari item yang
paling tepat untuk setiap dimensi.
3.
Sifat
multi, multi metode matriks korelasi berasal dari konsep pengukuran dengan
berbagai bentuk dan metode yang berbeda, selain itu membangun kekokohan pengukuran.
Singkatnya, kebaikan ukuran dibentuk melalui berbagai jenis
validitas dan reliabilitas. Hasil penelitian apapun hanya dapat sama baiknya
dengan tindakan yang memanfaatkan konsep-konsep dalam kerangka teoritis
(seperti pada bagan Goodness of Measures).
Reliability
Keandalan dari suatu pengukuran menunjukkan sejauh mana hal
itu tanpa bias (bebas kesalahan) dan karenanya menjamin pengukuran yang
konsisten sepanjang waktu dan di berbagai item dalam instrumen. Dalam kata
lain, keandalan ukuran adalah indikasi dari stabilitas dan konsistensi dengan
instrumen ukuran konsep tersebut dan membantu untuk menilai
"kebaikan" dari ukuran.
Stability of measures
Stabilitas tindakan
Kemampuan ukuran untuk tetap dari waktu ke waktu yang sama
merupakan indikasi dari stabilitas dan kerentanan yang rendah terhadap
perubahan situasi. Ini membuktikan "kebaikan" karena konsep ini
secara stabil diukur, tidak peduli ketika hal itu dilakukan. Dua pengujian
kestabilan adalah test-retest reliability
(reliabilitas tes ulang) dan parallel-form
reliability (reliabilitas bentuk paralel).
Test-retest reliability
Test-tes ulang koefisien reliabilitas diperoleh dengan
pengulangan ukuran yang sama pada kesempatan kedua disebut uji reliabilitas tes
ulang. Ini cara paling sederhana menguji reliabilitas sesuai dengan definisinya
di atas, yakni dengan cara mencoba kuisioner yang sama kepada responden yang
sama lebih dari satu kali (misal 2x) dalam waktu yang berbeda (jeda waktu
tertentu). Jadi nilai reliabilitasnya ditentukan nilai korelasi item-item yang
sama untuk periode survey yang berbeda.
Parallel-form
reliability
Ketika tanggapan pada dua set pengukuran sebanding, terbentuk
konstruk yang sama dan sangat berkorelasi, maka kita memiliki reliabilitas
bentuk paralel.
Internal consistency of
measures
Konsistensi internal dari tindakan pengukuran merupakan
indikasi dari homogenitas item dalam ukuran yang menekan susunannya. Dengan
kata lain, item harus "bersatu sebagai satu set," dan mampu secara
independen mengukur konsep yang sama sehingga responden melampirkan keseluruhan
arti yang sama untuk setiap item. Hal ini dapat dilihat dengan memeriksa apakah
item dan himpunan bagian dari berbagai item dalam alat ukur yang berkorelasi
tinggi. Konsistensi dapat diperiksa melalui interim
consistency reliability (reliabilitas
konsistensi sementara) dan split-half
reliability tests (reliabilitas split-setengah tes).
Interim consistency
reliability
Interim consistency reliability adalah uji konsistensi jawaban
responden untuk semua item di dalam ukuran. Pada tingkatan bahwa item adalah
ukuran independen dari konsep yang sama, mereka akan berkorelasi satu sama
lain. Tes yang paling populer untuk reliabilitas konsistensi interim adalah koefisien
alpha Cronbach.
Split-half reliability
Split-half reliability mencerminkan korelasi antara dua
bagian dari instrumen. Perkiraan yang akan bervariasi tergantung pada bagaimana
item dalam ukuran dibagi menjadi dua bagian. Split-setengah keandalan mungkin
lebih tinggi dari alpha Cronbach hanya dalam keadaan dari sana menjadi lebih
dari satu dimensi yang mendasari respon terpilih oleh ukuran dan ketika kondisi
lain tertentu terpenuhi juga. Oleh karena itu, dalam hampir semua kasus, alpha
Cronbach dapat dianggap sebagai indeks yang sangat cukup dari Interim consistency reliability.
Reflective versus
formative measurement scales
What is reflective
scale?
Dalam skala yang reflektif, semua item diharapkan
berkorelasi. Tidak seperti item yang digunakan dalam skala formatif, yang akan
didiskusikan, masing-masing item dalam skala reflektif diasumsikan untuk berbagi
secara umum. Oleh karena itu, peningkatan nilai construct akan diterjemahkan ke dalam peningkatan nilai untuk semua
item yang mewakili construct.
What is a formative
scale and why do the items of a formative scale not necessarily hang together?
Sebuah skala formatif digunakan ketika membangun sesuatu
ditinjau sebagai kombinasi penjelas dari indikator tersebut. Ambil Job Description Index, suatu ukuran
gabungan yang dimaksudkan untuk mengevaluasi kepuasan kerja. Langkah ini
meliputi lima dimensi: jenis pekerjaan (18 item), kesempatan untuk promosi (9
item), kepuasan terhadap pengawasan (18 item), rekan kerja (18 item), dan pembayaran
(9 item).
Lima dimensi dijabarkan ke dalam 72 elemen yang dapat diamati
dan terukur seperti "Kesempatan Baik untuk kemajuan", "promosi
Reguler", "Cukup kesempatan baik untuk promosi",
"Penghasilan yang memadai untuk biaya normal", "Sangat dibayar
tinggi", dan "Memberikan rasa prestasi ". Singkatnya, Job Description Index meliputi lima
dimensi dan 72 item. Sebuah skala yang berisi item yang tidak selalu
berhubungan disebut skala formatif.
terima kasih..
BalasHapus