Monday 27 May 2013

BEBERAPA KESALAHAN DALAM ANALISIS DATA

Analisis data kuantitatif dalam penelitian positivis yang melibatkan kuesioner terkadang terlihat sepele. Ada buku dan manual yang bisa diikuti.  Semuanya terlihat sempurna. Ada tabel dan angka yang bisa disalin-dan-ditempel dalam laporan atau artikel. Benarkan demikian? Belum tentu.

Ada banyak kesalahan yang dijumpai ketika membaca beragam dokumen ilmiah, baik itu skripsi atau tesis mahasiswa maupun artikel. Beberapa kesalahan yang sering terjadi dalam analisis data kuantitatif dari kuesioner. Kesalahan juga kadang terkait dengan formulasi pertanyaan dalam kuesioner.


Pertama adalah kesalahan dalam memilih tingkat pengukuran (level of measurement): nomimal, ordinal, interval, atau ratio. Dalam SPSS, misalnya, hanya dikenal tiga jenis data: categorical, ordinal, dan scale. yang terakhir digunakan untuk mengakomodasi data interval dan ratio.

Contoh data nominal adalah jender. Hanya ada dua(?) kemungkinan: pria dan wanita. Contoh lain adalah golongan darah. Contoh data ordinal adalah jenjang pendidikan; mulai sekolah dasar dampai dengan universitas. Kita bisa mengurutkan data ini; dengan menyimpulkan, misalnya pendidikan si A lebih tinggi dibandingkan dengan pendidikan si A. Contoh data interval adalah suhu (dalam Celcius, bukan dalam Kelvin) atau penghasilan. Kita bisa ‘membandingkan’ nilai internal, misalnya dengan mengatakan penghasilan si A dua kali penghasilan penghasilan si B. Contoh data ratio adalah suhu tetapi dalam derajat Kelvin atau Fahrenheit, di mana nilai 0 (nol) di sana berbeda dengan 0 (nol) dalam sistem Celcius. Dalam sistem Celcius (data interval), kita bisa menyimpulkan bahwa 100 derajat adalah dua kali lebih panas dibandingkan 50 derajat. Tidak demikian halnya dengan 100 dan 50 derajat Kelvin, karena acuan nilai derajat Kelvin atau Fahrenheit tidak dimulai dengan 0 (nol).

Apa akibat pemilihan tingkat pengukuran ini? Ini terkait kesalahan kedua, kesalahan dalam memilih teknik statistik deskriptif. Tidak teknik analisis statistik dapat diaplikasikan untuk semua data. Sebagai contoh, kita tidak bisa menghitung rata-rata data nominal dan ordinal seperti contoh di atas. Anda tetap ingin tetap menghitung rata-rata? Untuk data nomimal tidak ada peluang, tetapi untuk data ordinal *kadang* masih ada peluang. Sebagai contoh, untuk jenjang pendidikan, kita bisa mengkonversinya dengan berapa lama dibangku pendidikan (schooling years) — dalam bentuk interval — karena kita tahu lama pendidikan setiap jenjang. Bagaimana jika yang kita buat dalam bentuk ordinal adalah tingkat penghasilan (misal a. <1 juta; b. 1-2 juta; dst)? Kita tidak bisa mengkonversikannya dalam bentuk internal, dan akibatnya kita tidak bisa menghitung rata-rata. Apa solusinya? Dalam kuesioner, tanyakan besar penghasilan, tetapi biarkan responden yang mengisinya tanpa kita memberikan pilihan. Lebih sulit bagi responden? Mungkin. Lebih tidak pasti? Bisa jadi. Tetapi bukankah dengan data ordinal, responden juga melakukan perkiraan.

Ketiga, masih terkait dengan kesalahan kedua, yaitu kesalahan dalam memilih teknik statistik untuk analisis multivariate. Sebagai contoh, kita tidak bisa menggunakan regresi biasa ketika variabel dependennya dalam bentuk nominal (misal untuk kasus adopsi: ya dan tidak yang diwakili oleh angka 0 dan 1). Kadang saya temukan penelitian yang ‘hantam kromo’ dalam menggunakan regresi berganda (multiple regression). Begitu juga halnya untuk analisis korelasi. Analisisi korelasi Pearson, misalnya didesain untuk data interval. Chi kuadrat digunakan untuk data nominal atau ordinal. Bagaimana kalau yang satu interval dan satunya lagi nominal? Komparasi rata-rata dengan uji t mungkin alternatifnya.

Keempat, seringkali peneliti tidak menguji reliabilitas dan validitas intrumen penelitian yang digunakan untuk mendapatkan data dari responden. Validitas pengukuran terkait dengan ketepatan alat untuk mengukur yang kita ingin ukur. Sebagai contoh, kilometer adalah alat ukur yang valid untuk menghitung jarak di Jakarta, dan bukan waktu. Pertanyaan yang memberikan jawaban yang valid adalah ‘berapa kilometer jarak antara Monas dan Grogol’ dan bukan ‘berapa jam jarak antara Monas dan Grogol’. Reliabilitas tekait dengan konsitensi hasil pengukuran. Jika kita gunakan penggaris dari besi atau plastik untuk mengukur panjang meja, kita akan menghasilkan panjang yang sama meski kita lakukan berulang kali. Penggaris ini adalah alat ukur yang reliabel. Bagaimana kalau penggarisnya dari bahwa yang lentur seperti karet? Hasil yang berbeda bisa kita dapatkan. Penggaris karet bukan alat ukur yang valid. Contoh lain adalah soal untuk ujian TOEFL. Jika seseorang mengikuti tes TOEFL dua kali dalam sebulan (meski nampaknya tidak boleh), bisa jadi nilai yang didapatkan berbeda. Jika ini kasusnya, kita bisa mengatakan bahwa ujian TOEFL adalah alat ukur kemampuan bahasa Inggris yang valid, tetapi reliabilitasnya bisa didiskusikan.

Dalam penelitian positivis, pastikan kita melakukan uji ini, jika dalam instrumen kita mengukur sebuah konstruk yang terdiri dari beberapa item/pertanyaan untuk mengukurnya. Uji reliablitas bisa dilakukan dengan menghitung Cronbach’s alpha untuk setiap konstruk. Namun, sebelumnya lakukan uji validitas; misalnya dengan factor analysis baik itu confirmatory (jika intrument pernah digunakan atau dikembangkan dengan asumsi teoretikal tertentu, dan jumlah kontruk yang diharapkan sudah diketahu) atau explanatory (untuk instrumen baru). Namun tunggu sebentar. Tidak semua kontruk bisa duji relibalitasnya dengan nilai Cronbach’s alpha.
Ini kesalahan yang kelima. Cronbach’s alpha hanya diaplikasikan jika konstruk bersifat reflektif dalam item yang digunakan untuk mengukurnya. Contoh konstruk adalah ‘ease of use‘ dalam Technology Acceptance Model (TAM). Konstruk ‘ease of use‘ dioperasionalkan dengan beberapa item yang menggambarkannya, seperti terkait dengan tiadanya usaha yang keras dan kecilnya pengetahuan yang dibutuhkan. Lain halnya jika konstruk yang diukur adalah ‘status sosial’ yang terdiri dari beragam item, misalnya pendidikan, penghasilan, jabatan, dan lain-lain. Konstruk terakhir bersifat formatif, dan nilai kumulatif semua item membentuk sebuah indeks. Dalam kasus ini, Cronbach’s alpha tidak bisa diaplikasikan.

Untuk melakukan uji ini, jika kita menggunakan SPSS, beragam uji harus dilakukan terpisah. Tetapi jika kita gunakan analisis SEM atau PLS, dengan software yang tepat (misalnya SmartPLS), semua analisis, mulai dari uji reliabilitas dan validitas, sampai dengan regresi dapat dilakukan sekaligus.
Masih banyak kesalahan lain yang sering saya jumpai. Lima kesalahan di atas, menurut saya sangat mendasar, dan bisa dengan mudah dihindari dengan sedikit peduli dengan ‘filosofi’ di balik setiap konsep dalam statistik yang ada.

sumber:

Fathul Wahid.  2012.   Beberapa kesalahan analisia data dalam penelitian positivisme.. Publikasiinternasional





No comments:

Post a Comment