Korelasi atau Regresi? Pertanyaan seperti ini sering muncul ketika peneliti akan melakukan analisis statistik untuk melihat hubungan antar variabel. Jawaban yang sering saya dengar adalah: "Kalau korelasi itu untuk dua variabel, satu variabel independen dan satu variabel dependen.Sementara kalo regresi itu untuk lebih dari dua variabel, lebih dari satu variabel independen dan satu variabel dependen."
Ungkapan ini tidak sepenuhnya salah, karena regresi memang bisa digunakan untuk melihat hubungan antara lebih dari satu variabel independen dengan satu variabel dependen. Masalahnya adalah ungkapan ini tidak menggambarkan perbedaan utama antara regresi dan korelasi. Regresi juga bisa digunakan untuk menganalisis hubungan antara satu variabel independen dengan satu variabel dependen. Selain itu diperoleh kesan bahwa kedua teknik ini berbeda hanya pada tataran jumlah variabel yang ditangani, padahal perbedaan keduanya lebih dari itu.
Mungkin sebelum kita sampai ke
Ketika berbicara mengenai korelasi, biasanya orang (mahasiswa atau peneliti) akan berbicara mengenai korelasi antara dua atau lebih variabel yang memiliki skala pengukuran interval bukan kategorik. Sebenarnya pengertian korelasi juga dapat digunakan untuk menganalisis hubungan antara dua atau lebih variabel yang memiliki skala pengukuran kategorik. Tapi untuk sementara kita sisihkan dulu saja pembahasannya agar tidak terlalu rumit.
Angka yang digunakan untuk menggambarkan derajat hubungan ini disebut koefisien korelasi dengan lambang rxy. Teknik yang paling sering digunakan untuk menghitung koefisien korelasi selama ini adalah teknik Korelasi Product Momen Pearson. Teknik ini sebenarnya tidak terbatas untuk menghitung koefisien korelasi dari variabel dengan skala pengukuran interval saja, hanya saja interpretasi dari hasil hitungnya harus dilakukan dengan hati-hati.
Pemikiran utama korelasi product momen adalah seperti ini:
Jika kenaikan kuantitas dari suatu variabel diikuti dengan kenaikan kuantitas dari variabel lain, maka dapat kita katakan kedua variabel ini memiliki korelasi yang positif. Jika kenaikan kuantitas dari suatu variabel sama besar atau mendekati besarnya kenaikan kuantitas dari suatu variabel lain dalam satuan SD, maka korelasi kedua variabel akan mendekati 1.
Jika kenaikan kuantitas dari suatu variabel diikuti dengan penurunan kuantitas dari variabel lain, maka dapat kita katakan kedua variabel ini memiliki korelasi yang negatif. Jika kenaikan kuantitas dari suatu variabel sama besar atau mendekati besarnya penurunan kuantitas dari variabel lain dalam satuan SD, maka korelasi kedua variabel akan mendekati -1.
Jika kenaikan kuantitas dari suatu variabel diikuti oleh kenaikan dan penurunan kuantitas secara random dari variabel lain atau jika kenaikan suatu variabel tidak diikuti oleh kenaikan atau penurunan kuantitas variabel lain (nilai dari variabel lain stabil), maka dapat dikatakan kedua variabel itu tidak berkorelasi atau memiliki korelasi yang mendekati nol.
Dari pemikiran ini kemudian lahirlah Rumus Korelasi Product Momen Pearson seperti yang sering kita lihat di buku.
Rumus pertama :
Jika setiap subjek yang memiliki nilai X lebih rendah dari meannya, memiliki nilai Y yang juga lebih rendah dari meannya, nilai r akan menjadi positif. Begitu juga jika setiap subjek yang memiliki nilai X lebih tinggi dari meannya, memiliki nilai Y yang lebih tinggi dari meannya.
Jika setiap subjek yang memiliki nilai X yang lebih tinggi dari meannya, memiliki nilai Y yang lebih rendah dari meannya maka nilai r akan menjadi negatif. Begitu juga jika tiap subjek yang memiliki nilai X lebih rendah dari meannya memiliki nilai Y yang lebih tinggi dari meannya.
Jika tiap nilai X yang lebih tinggi dari meannya terkadang diikuti oleh nilai Y yang lebih tinggi terkadang lebih rendah dari meannya maka nilai r akan cenderung mendekati 0 (nol).
Rumus Kedua
Nah dari rumus kedua ini dapat kita simpulkan bahwa nilai korelasi sebenarnya nilai kovarian dari dua variabel x dan y yang distandardkan dengan menggunakan standard deviasi x dan standard deviasi y sebagai denominatornya. Mengapa nilai kovarian perlu distandardkan? (ada yang bertanya apa itu kovarian? lihat di posting berikutnya ya...). Nilai kovarian sangat dipengaruhi oleh satuan skala yang digunakan oleh kedua variabel. Misalnya kita menghitung kovarian dari tinggi badan dengan panjang rambut , pengen tahu apakah tinggi badan berkorelasi dengan panjang rambut (iseng banget yak...). Kita menghitung tinggi badan dan panjang rambut dalam satuan meter. Kemudian kita hitung kovariannya. Setelah itu kita menggunakan data yang sama, hanya mengubah satuannya menjadi centimeter, lalu menghitung kovariannya. Nah kovarian dari hasil perhitungan kedua akan terlihat lebih besar daripada yang pertama.
Lebih besar? Ya karena dengan menggunakan satuan centimeter,
Oleh karena itu perlu distandardkan agar data yang sama akan menghasilkan angka yang sama meskipun diubah skalanya.
Rumus Ketiga
Rumus ketiga ini agak sulit ceritanya. Kalo nggak hati-hati bisa dimarah-marah sama Pedhazur (Pedhazur, 1997) soalnya. Begini:
Zx dan Zy itu berbicara mengenai nilai X dan Y dalam satuan SD.
Jika nilai X ada di bawah mean dari X maka nilai Zx akan negatif, jika nilai X ada di atas meannya maka nilai Zx akan positif. Begitu juga dengan Y.
Seperti pada rumus pertama, jika Zx dan Zy sepakat (keduanya positif atau negatif) maka nilai r akan positif. Jika Zx dan Zy berlawanan (jika yang satu positif yang lain negatif) maka nilai r akan negatif.
Nah misalnya ada seratus subjek memiliki nilai X dan Y. Lalu kita hitung satu-satu nilai Z dari X dan Y untuk tiap subjek. Tentu saja ada beberapa yang sangat sepakat yang lain agak sepakat yang beberapa berlawanan. Kemudian nilai-nilai Z ini dijumlahkan sehingga jika yang sepakat lebih banyak akan menghasilkan angka positif. Kalo yang berlawanan lebih banyak akan menghasilkan angka negatif. Kemudian hasil penjumlahan ini dicari rata-ratanya.
Jadi bisa dibilang nilai r itu akan menggambarkan rata-rata keadaan X dan Y dari semua subjek dalam kelompok.
Ribet ya? OK...OK... contohnya begini : misalnya ada sekelompok orang di stadion. Beberapa dari mereka (misalnya 80 orang) mengenakan baju hijau dan celana hijau, sisanya baju hijau celana merah (idih norak banget yak...). Kalo kamu ditanya bagaimana pakaian mereka? kita bisa bilang kebanyakan berpakaian sepakat hijau-hijau, karena tingkat kesepakatan hijau-hijau lebih dominan. Jadi bisa dibilang korelasi baju dan celana di kelompok itu positif. Semoga bisa lebih jelas ya.
Further Study:
Pedhazur,E.J.(1997) Multiple Regression in Behavioral Research.
Tidak ada komentar:
Posting Komentar