Covariance sebuah kata yang digunakan untuk menyatakan sebuah matrik yang memuat dua informasi sekaligus. Bentuknya berupa matrik bujursangkar. Informasi yang pertama adalah variansi yang terletak pada elemen diagonal utama. Informasi yang kedua adalah kovariansi yang terletak pada elemen selain elemen diagonal utama.

Untuk kasus data sampel, estimasi matrik kovariansi biasanya dengan menggunakan metode Maximum Likelihood Estimator (atau metode MLE). Tetapi, oleh karena tidak semua data bersifat normal. Kadang kala kita dapati beberapa titik data yang sangat berbeda karakteristiknya dari kebanyakan data yang ada. Pada kasus seperti ini penggunaan metode MLE untuk mengestimasi matrik kovariansi harus lebih hati-hati. Mengapa?

Estimator MLE tidak memiliki sifat robust terhadap kehadiran data outlier (sejumlah data yang berbeda distribusinya dari sebagian besar kelompok data).  Misalkan dua variabel x1 dan x2 memiliki data berikut {(1,4),(4,4,),(4,4),(3,4),(2,4),(3,3),(4,5),(3,5),(1,2),(3,3)}. Estimasi Matrik Kovariansi dari data tersebut adalah : {(1,29;0,51),(0,51;0,84)}. Nilai eigen dari matrik kovariansi tersebut adalah 1,62 dan 0,51.

Sekarang, apa yang terjadi jika data kesembilan kita ganti dengan (10,20). MIsalnya karena kesalahan entri data. Seharusnya (1,2) tapi terentri (10,20). Maka matrik kovariansi akan menjadi {(5,79;11,31),(11,31;26,04)}. Nilai eigen matrik kovariansi yang baru adalah 31,09 dan 0,73. Ada lonjakan yang cukup besar antara nilai eigen pertama dari matrik kovariansi sebelum dan sesudah perubahan data kesembilan. Selisihnya bisa mencapai 29,07 poin. Cukup besar bukan? Di sinilah letak ketidakrobust-an estimasi matrik kovariansi dengan MLE. Lopuhaa dan Rousseeuw (1991) menyatakan breakdown point dari  metode MLE adalah 1. Artinya, satu saja data ekstrim ditemukan akan mengakibatkan lonjakan nilai eigen suatu matrik kovariansi sangat besar. Dengan demikian metode MLE dikatakan tidak robust terhadap keberadaan data outlier meskipun hanya 1 titik data.

Untuk mengatasi kelemahan estimator MLE dalam mengestimasi matrik kovariansi digunakanlah estimator covariance robust. Dua di antaranya penulis gunakan dalam penyusunan thesis yaotu MCD estimator dan MWCD estimator. MCD estimator adalah estimator matrik kovariansi yang menggunakan sebagian data yang menghasilkan determinan matrik kovariansi terkecil. Data-data yang “normal” diberi pembobot sama dengan satu sedang data-data outlier diberi pembobot sama dengan nol. Untuk MWCD, pembobot yang diberikan untuk data “norma” tidak seragam tetapi bergantung pada jarak. (silakan unduh file berikut untuk memahami MCD dan MWCD: referensi-mcd-dan-mwcd).

Pemanfaatn estimator covariance robust dalam dunia analisis multivariat adalah untuk merobustkan metode multivariat itu sendiri. Sebagaimana penulis buktikan pada analisis diskriminan kuadratik. Proporsi salah pengelompokkan dari fungsi diskrimina kuadratik dengan menggunakan estimator robust MCD lebih kecil daripada menggunakan metode MLE. Berikut disajikan hasil terapan MCD estimator dalam analisis diskriminan kuadratik yang penulis kutif dari thesis.

analisis-diskriminan-kuadratik-robust.