Selasa, 17 April 2012

RANKING SCALE

Ranking scales
Ranking scales (skala peringkat) digunakan untuk memanfaatkan kecenderungan antara dua atau lebih objek-objek atau item. Namun, peringkat tersebut tidak dapat memberikan petunjuk pasti untuk beberapa jawaban yang dicari. Sebagai contoh, katakanlah ada empat lini produk dan manajer mencari informasi yang akan membantu memutuskan mana produk yang harus mendapatkan perhatian yang besar. Mari kita juga berasumsi bahwa 35% responden memilih produk pertama, 25% kedua, dan 20% memilih masing-masing produk tiga dan empat sebagai pilihan bagi mereka. Manajer tidak bisa kemudian menyimpulkan bahwa produk pertama adalah yang paling disukai, karena 65% dari responden tidak memilih produk itu! Metode alternatif yang digunakan adalah paired comparisons (perbandingan berpasangan), forced choice (pilihan paksa), dan comparative scale (skala perbandingan).

Paired comparisons
Skala perbandingan berpasangan digunakan ketika, di antara sejumlah kecil objek, responden diminta untuk memilih antara objek pada waktu yang bersamaan. Hal ini membantu untuk menilai kecenderungan pilihan. Jika, misalnya, dalam contoh sebelumnya, selama perbandingan berpasangan, responden secara konsisten menunjukkan pilihan untuk produk yang satu atas produk dua, tiga dan empat, manajer andal dapat memahami produk yang menuntut perhatian penuh nya. Namun, karena jumlah objek yang akan dibandingkan meningkat, begitu juga jumlah perbandingan berpasangan. Jumlah pilihan berpasangan untuk objek n akan menjadi [(n) (n-1) / 2]. Semakin besar jumlah objek atau stimulus, semakin besar jumlah perbandingan berpasangan disajikan kepada responden, dan semakin besar kelelahan responden. Oleh karena itu, perbandingan berpasangan adalah metode yang baik jika jumlah stimulus yang disajikan adalah kecil.

Forced choice
Forced choice memungkinkan responden untuk mengurutkan objek dan membandingkan satu sama lain, di antara alternatif yang disediakan. Ini adalah mudah bagi responden, terutama jika jumlah pilihan untuk digolongkan terbatas jumlahnya.

Comparative scale
Skala komparatif menyediakan patokan atau titik acuan untuk menilai sikap terhadap objek saat ini, peristiwa, atau situasi yang diteliti. Skala penilaian yang digunakan untuk mengukur konsep perilaku. Skala peringkat digunakan untuk membuat perbandingan atau peringkat variabel yang telah disadap pada skala nominal.

International dimensions of scaling
Selain kepekaan terhadap definisi operasional konsep dalam budaya lain, masalah scaling juga perlu dibahas dalam lintas budaya penelitian. Budaya yang berbeda bereaksi secara berbeda juga terhadap masalah scaling. Misalnya, titik lima atau skala tujuh poin dapat membuat perbedaan di AS, tetapi bisa di respon secara berbeda oleh subyek di negara lain.

Goodness of measures
Sekarang kita telah melihat bagaimana mendefinisikan variabel secara operasional dan menerapkan teknik penskalaan yang berbeda, penting untuk memastikan bahwa instrumen yang kami kembangkan untuk mengukur suatu konsep tertentu memang akurat mengukur variabel, dan bahwa, pada kenyataannya, kita benar-benar mengukur konsep yang kami tetapkan untuk mengukur. Penggunaan instrumen yang lebih baik akan memastikan akurasi lebih pada hasil, yang pada gilirannya akan meningkatkan kualitas ilmiah penelitian.
Mari kita memeriksa bagaimana kita dapat memastikan bahwa langkah-langkah yang dikembangkan adalah yang cukup baik. Pertama, analisis item tanggapan terhadap pertanyaan-pertanyaan variabel yang dilakukan, dan kemudian reliabilitas dan validitas dari langkah-langkah ditetapkan.

Item analysis
Analisis item dilakukan untuk melihat apakah item dalam instrumen termasuk sana atau tidak. Dalam analisis item, berarti antara kelompok skor tinggi dan kelompok skor rendah diuji untuk mendeteksi perbedaan yang signifikan melalui t-nilai. Item dengan tinggi t-nilai (tes yang mampu mengidentifikasi item yang sangat diskriminatif dalam instrumen) tersebut kemudian dimasukkan dalam instrumen. Setelah itu, tes untuk keandalan instrumen dilakukan dan validitas ukuran dibuat.
Sangat singkat, reliabilitas adalah tes tentang bagaimana instrumen alat ukur dapat konsisten apapun konsepnya dalam mengukur. Sekali lagi ‘reliability’ adalah indikator apakah sebuah pertanyaan jika ditanyakan berulang-ulang kali baik kepada orang yang sama maupun kepada orang lain jawabannya akan cenderung sama (konsisten/berulang).Validitas adalah tes dari seberapa baik sebuah alat yang dikembangkan untuk mengukur konsep tertentu yang ditujukan untuk mengukur. Dengan kata lain, validitas berkaitan dengan apakah kita mengukur konsep yang tepat, dan kehandalan dengan stabilitas dan konsistensi pengukuran. Validitas dan keandalan ukuran membuktikan kekuatan ilmiah yang telah dilakukan untuk studi penelitian.

Validitas
Validitas berasal dari kata “validity” yang artinya sejauhmana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Kita akan peduli tentang masalah keaslian penyebab dan akibat hubungan (validitas internal), dan generalisasi terhadap lingkungan eksternal (validitas eksternal). Beberapa jenis uji validitas digunakan untuk menguji kebaikan ukuran dan penulis menggunakan istilah yang berbeda untuk menunjukkan mereka. Demi kejelasan, kita kelompokan uji validitas dengan tiga judul: content validity (validitas isi), criterion-related validity (kriteria yang berhubungan dengan validitas), dan construct validity (validitas konstruk).

Content validity
Content validity adalah validitas yang berkaitan dengan baik atau buruknya sampel yang diambil dari populasi. Validitas isi memastikan bahwa mengukur mencakup set yang memadai dan representatif item yang memanfaatkan konsep tersebut. Semakin banyak item skala mewakili domain atau semesta dari konsep yang diukur, semakin besar validitas konten. Untuk dimasukkan ke dalam cara yang berbeda, validitas isi adalah fungsi dari seberapa baik dimensi dan elemen dari sebuah konsep yang telah digambarkan.
Face validity atau validitas rupa adalah validitas yang berhubungan dengan apa yang kelihatan dalam mengukur sesuatu, tetapi bukan terhadap apa yang seharusnya akan diukur.

Criterion-related validity
Validitas kriteria terkait dibuat ketika mengukur membedakan individu pada kriteria yang diharapkan diprediksi. Hal ini dapat dilakukan dengan membentuk concurrent validity (validitas konkuren) atau predictive validity (validitas prediktif).

Concurrent validity adalah validitas yang berkaitan dengan hubungan (korelasi) antara skor dalam item instrumen dengan kinerja, atau objek penelitian yang lain.
Predictive validity adalah validitas perkiraan yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerja atau seseorang di masa mendatang berdasarkan pengukuran awal. Validitas prediksi adalah validitas instrumen yang diharapkan bisa memiliki hubungan dengan hasil yang diharapkan dari instrumen yang dibuat. Validitas prediktif menunjukkan kemampuan alat ukur untuk membedakan antara individu dengan mengacu pada kriteria masa depan.

Construct validity
Validitas konstruk adalah validitas yang berkenaan dengan kualitas dalam aspek psikologis tentang apa yang diukur oleh suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu itu bisa menyebabkan kinerja dan hasil yang baik dalam pengukuran. Validitas konstruk membuktikan seberapa baik hasil yang diperoleh dari penggunaan ukuran sesuai dengan teori-teori sekitar yang tes dirancang. Hal ini dinilai melalui convergent validity  (validitas konvergen) dan discriminant validity (validitas diskriminan).

Convergent validity adalah sejauh mana operasi ini mirip dengan (menyatu pada) operasi lain yang secara teoritis juga harus sama dengan. Validitas konvergen akan dibuat bila nilai yang diperoleh dengan dua instrumen yang berbeda mengukur konsep yang sama sangat berkorelasi.
Discriminant validity dibuat bila, berdasarkan teori, dua variabel yang diprediksi akan berkorelasi, dan skor yang diperoleh dengan mengukur mereka memang secara empiris ditemukan begitu. Validitas dengan demikian dapat dibentuk dalam berbagai cara. Beberapa cara di mana bentuk-bentuk di atas validitas dapat dibentuk adalah melalui:
1.      Korelasional analisis (seperti dalam kasus validitas konkuren dan validitas prediktif atau validitas konvergen dan diskriminan)
2.      Analisis faktor, teknik multivariat yang menegaskan dimensi konsep yang telah didefinisikan secara operasional, serta menunjukkan yang mana dari item yang paling tepat untuk setiap dimensi.
3.      Sifat multi, multi metode matriks korelasi berasal dari konsep pengukuran dengan berbagai bentuk dan metode yang berbeda, selain itu membangun kekokohan pengukuran.

Singkatnya, kebaikan ukuran dibentuk melalui berbagai jenis validitas dan reliabilitas. Hasil penelitian apapun hanya dapat sama baiknya dengan tindakan yang memanfaatkan konsep-konsep dalam kerangka teoritis (seperti pada bagan Goodness of Measures).

Reliability
Keandalan dari suatu pengukuran menunjukkan sejauh mana hal itu tanpa bias (bebas kesalahan) dan karenanya menjamin pengukuran yang konsisten sepanjang waktu dan di berbagai item dalam instrumen. Dalam kata lain, keandalan ukuran adalah indikasi dari stabilitas dan konsistensi dengan instrumen ukuran konsep tersebut dan membantu untuk menilai "kebaikan" dari ukuran.

Stability of measures
Stabilitas tindakan
Kemampuan ukuran untuk tetap dari waktu ke waktu yang sama merupakan indikasi dari stabilitas dan kerentanan yang rendah terhadap perubahan situasi. Ini membuktikan "kebaikan" karena konsep ini secara stabil diukur, tidak peduli ketika hal itu dilakukan. Dua pengujian kestabilan adalah test-retest reliability (reliabilitas tes ulang) dan parallel-form reliability (reliabilitas bentuk paralel).

Test-retest reliability
Test-tes ulang koefisien reliabilitas diperoleh dengan pengulangan ukuran yang sama pada kesempatan kedua disebut uji reliabilitas tes ulang. Ini cara paling sederhana menguji reliabilitas sesuai dengan definisinya di atas, yakni dengan cara mencoba kuisioner yang sama kepada responden yang sama lebih dari satu kali (misal 2x) dalam waktu yang berbeda (jeda waktu tertentu). Jadi nilai reliabilitasnya ditentukan nilai korelasi item-item yang sama untuk periode survey yang berbeda.

Parallel-form reliability
Ketika tanggapan pada dua set pengukuran sebanding, terbentuk konstruk yang sama dan sangat berkorelasi, maka kita memiliki reliabilitas bentuk paralel.

Internal consistency of measures
Konsistensi internal dari tindakan pengukuran merupakan indikasi dari homogenitas item dalam ukuran yang menekan susunannya. Dengan kata lain, item harus "bersatu sebagai satu set," dan mampu secara independen mengukur konsep yang sama sehingga responden melampirkan keseluruhan arti yang sama untuk setiap item. Hal ini dapat dilihat dengan memeriksa apakah item dan himpunan bagian dari berbagai item dalam alat ukur yang berkorelasi tinggi. Konsistensi dapat diperiksa melalui interim consistency reliability  (reliabilitas konsistensi sementara) dan split-half reliability tests (reliabilitas split-setengah tes).

Interim consistency reliability
Interim consistency reliability adalah uji konsistensi jawaban responden untuk semua item di dalam ukuran. Pada tingkatan bahwa item adalah ukuran independen dari konsep yang sama, mereka akan berkorelasi satu sama lain. Tes yang paling populer untuk reliabilitas konsistensi interim adalah koefisien alpha Cronbach.

Split-half reliability
Split-half reliability mencerminkan korelasi antara dua bagian dari instrumen. Perkiraan yang akan bervariasi tergantung pada bagaimana item dalam ukuran dibagi menjadi dua bagian. Split-setengah keandalan mungkin lebih tinggi dari alpha Cronbach hanya dalam keadaan dari sana menjadi lebih dari satu dimensi yang mendasari respon terpilih oleh ukuran dan ketika kondisi lain tertentu terpenuhi juga. Oleh karena itu, dalam hampir semua kasus, alpha Cronbach dapat dianggap sebagai indeks yang sangat cukup dari Interim consistency reliability.

Reflective versus formative measurement scales
What is reflective scale?
Dalam skala yang reflektif, semua item diharapkan berkorelasi. Tidak seperti item yang digunakan dalam skala formatif, yang akan didiskusikan, masing-masing item dalam skala reflektif diasumsikan untuk berbagi secara umum. Oleh karena itu, peningkatan nilai construct akan diterjemahkan ke dalam peningkatan nilai untuk semua item yang mewakili construct.

What is a formative scale and why do the items of a formative scale not necessarily hang together?
Sebuah skala formatif digunakan ketika membangun sesuatu ditinjau sebagai kombinasi penjelas dari indikator tersebut. Ambil Job Description Index, suatu ukuran gabungan yang dimaksudkan untuk mengevaluasi kepuasan kerja. Langkah ini meliputi lima dimensi: jenis pekerjaan (18 item), kesempatan untuk promosi (9 item), kepuasan terhadap pengawasan (18 item), rekan kerja (18 item), dan pembayaran (9 item).

Lima dimensi dijabarkan ke dalam 72 elemen yang dapat diamati dan terukur seperti "Kesempatan Baik untuk kemajuan", "promosi Reguler", "Cukup kesempatan baik untuk promosi", "Penghasilan yang memadai untuk biaya normal", "Sangat dibayar tinggi", dan "Memberikan rasa prestasi ". Singkatnya, Job Description Index meliputi lima dimensi dan 72 item. Sebuah skala yang berisi item yang tidak selalu berhubungan disebut skala formatif.

Tidak ada komentar:

Poskan Komentar