Analisis diskriminan dan analisis regresi merupakan dua metode analisis yang berbeda. Perbedaan ini dapat ditinjau dari tujuan metode analisis dan jenis data respon (y). Dari sisi tujuan analisis, analisis diskriminan bertujuan untuk mengenali faktor-faktor yang dapat membedakan dua kelompok atau lebih. Faktor-faktor pembeda ini akan membentuk sebuah fungsi pembeda (disebut fungsi diskriminan). Setelah fungsi pembeda diketahui, analisis diskriminan selanjutnya dapat mengenali observasi baru dan mengelompokkan ke salah satu kelompok yang ada.

Berbeda dengan analisis diskriminan, analisis regresi bertujuan untuk membentuk sebuah fungsi yang dapat menjelaskan hubungan dua variabel, yaitu variabel penjelas/prediktor (x) dan variabel respon (y). Dalam hal ini, kita tidak mengenal pengelompokkan data sebelumnya.

Perhatikan ketiga scatterplot berikut:

Gambar 1.

Gambar 2.

Gambar 3.

Pada Gambar 1 tampak dua data (variabel) yang berasal dari dua kelompok yang berbeda. Analisis diskriminan sangat tepat digunkan pada contoh kasus Gambar 1. Di sini kita akan mencari sebuah fungsi (bisa linear, atau berupa kurva lengkung semisal parabola)  yang dapat memisahkan kedua kelompok ini. Tentunya, fungsi yang didapatkan akan mampu memisahkan dua kelompok data secara sempurna karena variabel x1 dan x2 pada Gambar 1 mencirikan kedua kelompok secara nyata. Artinya, kedua kelompok memang memiliki variansi yang sangat berbeda.

Gambar 2 menampilkan dua variabel yang dibedakan atas variabel prediktor (C7) dan variabel respon (y2). Didasarkan pada asumsi bahwa C7 mempengaruhi y2. Pertanyaannya, bagaimana bentuk hubungan antara C7 dan y2? Untuk menjawab pertanyaan ini kita dapat menggunakan model regresi. Model regresi dimaksudkan untuk mencari sebuah fungsi (dalam kasus ini fungsi garis/linear) yang dapat meminimumkan kesalahan antara nilai prediksi dengan data y2.

Pada Gambar 3, kita tidak mempunyai dasar bahwa x1 mempengaruhi x2 atau sebaliknya. Pada kasus ini x1 dan x2 keduanya merupakan variabel prediktor yang berasal dari dua kelompok yang berbeda (misal kelompok 1 = titik hitam dan kelompok 2 = titik merah). Kita tidak mencari sebuah fungsi yang menyatakan hubungan antara x1 dan x2. Yang kita cari adalah suatu fungsi f(x1,x2) yang dapat memisahkan antara kelompok hitam dan kelompok merah. Berbeda dengan Gambar 1, pada Gambar 3 ini kita dapat menemukan fungsi f(x1,x2) yang meminimalkan variasi dalam kelompok tetapi memaksimalkan variasi antar kelompok. Pada akhirnya, akan ditemukan kesalahan pengelompokkan. Misal, titik merah yang harusnya menjadi kelompok 2, oleh fungsi diskriminan dikelompokkan sebagai kelompok 1. Demikian sebaliknya. Ukuran salah pengelompokkan ini menjadi salah satu kriteria kebaikan dari fungsi diskriminan (Goodness of Fit) yang dalam model regresi diukur oleh besaran R kuadrat. Semakin kecil persentase salah pengelompokkan semakin baik fungsi diskriminan yang digunakan.

Perbedaan kedua antara analisis diskriminan dan regresi adalah dari sisi jenis variabel respon. Variabel respon dalam analisis diskriminan berbentuk kategorik yang menandakan kelompok sementara dalam model regresi berbentuk kontinyu (angka yang diperoleh dari hasil pengukuran).

Dalam praktiknya, variabel respon yang digunakan dalam penelitian biasanya lebih dari satu variabel. Oleh karena kita sulit mencari variabel penelitian yang benar-benar independen tidak jarang kita temui variabel yang masih berkorelasi meskipun kecil. Adanya korelasi di antara variabel ini akan mempengaruhi kebaikan suatu model. Tugas kita adalah memilah-milah variabel mana yang benar-benar mempengaruhi variabel respon (dalam analisis regresi) atau variabel-variabel yang benar-benar mampu membedakan dua kelompok atau lebih (dalam analisis diskriminan). Dalam analisis regresi, tujuan ini dapat dicapai melalui metode backward, forward, ataupun stepwise. Dalam analisis diskriminan juga ada pemilihan variabel yang mampu membedakan kelompok (Silakan merujuk pada Buku Multivariat karangan Dillon).

Pemanfaatan analisis diskriminan dan analisis regresi biasa digunakan secara berbarengan dengan tujuan yang berbeda. Analisis regresi digunakan untuk mencari variabel-variabel prediktor yang berpengaruh terhadap variabel respon. Selanjutnya, variabel-variabel tersebut digunakan untuk membentuk sebuah fungsi pembeda (diskriminan) yang mampu mengenali perbedaan antar kelompok.

Berikut dilampirkan beberapa referensi yang dapat digunakan untuk memahami regresi dan diskriminan lebih lanjut. Semoga bermanfaat.

Referensi:

  1. analisis_korelasi-regresi-linear
  2. analisis_faktor-diskriminan
  3. analisis-diskriminan
  4. analisis-diskiminan-teori
  5. forward-stepwise-regression-procedure
  6. chapter-12-discriminant-analysis