Covariance sebuah kata yang digunakan untuk menyatakan sebuah matrik yang memuat dua informasi sekaligus. Bentuknya berupa matrik bujursangkar. Informasi yang pertama adalah variansi yang terletak pada elemen diagonal utama. Informasi yang kedua adalah kovariansi yang terletak pada elemen selain elemen diagonal utama.
Untuk kasus data sampel, estimasi matrik kovariansi biasanya dengan menggunakan metode Maximum Likelihood Estimator (atau metode MLE). Tetapi, oleh karena tidak semua data bersifat normal. Kadang kala kita dapati beberapa titik data yang sangat berbeda karakteristiknya dari kebanyakan data yang ada. Pada kasus seperti ini penggunaan metode MLE untuk mengestimasi matrik kovariansi harus lebih hati-hati. Mengapa?
Estimator MLE tidak memiliki sifat robust terhadap kehadiran data outlier (sejumlah data yang berbeda distribusinya dari sebagian besar kelompok data). Misalkan dua variabel x1 dan x2 memiliki data berikut {(1,4),(4,4,),(4,4),(3,4),(2,4),(3,3),(4,5),(3,5),(1,2),(3,3)}. Estimasi Matrik Kovariansi dari data tersebut adalah : {(1,29;0,51),(0,51;0,84)}. Nilai eigen dari matrik kovariansi tersebut adalah 1,62 dan 0,51.
Sekarang, apa yang terjadi jika data kesembilan kita ganti dengan (10,20). MIsalnya karena kesalahan entri data. Seharusnya (1,2) tapi terentri (10,20). Maka matrik kovariansi akan menjadi {(5,79;11,31),(11,31;26,04)}. Nilai eigen matrik kovariansi yang baru adalah 31,09 dan 0,73. Ada lonjakan yang cukup besar antara nilai eigen pertama dari matrik kovariansi sebelum dan sesudah perubahan data kesembilan. Selisihnya bisa mencapai 29,07 poin. Cukup besar bukan? Di sinilah letak ketidakrobust-an estimasi matrik kovariansi dengan MLE. Lopuhaa dan Rousseeuw (1991) menyatakan breakdown point dari metode MLE adalah 1. Artinya, satu saja data ekstrim ditemukan akan mengakibatkan lonjakan nilai eigen suatu matrik kovariansi sangat besar. Dengan demikian metode MLE dikatakan tidak robust terhadap keberadaan data outlier meskipun hanya 1 titik data.
Untuk mengatasi kelemahan estimator MLE dalam mengestimasi matrik kovariansi digunakanlah estimator covariance robust. Dua di antaranya penulis gunakan dalam penyusunan thesis yaotu MCD estimator dan MWCD estimator. MCD estimator adalah estimator matrik kovariansi yang menggunakan sebagian data yang menghasilkan determinan matrik kovariansi terkecil. Data-data yang “normal” diberi pembobot sama dengan satu sedang data-data outlier diberi pembobot sama dengan nol. Untuk MWCD, pembobot yang diberikan untuk data “norma” tidak seragam tetapi bergantung pada jarak. (silakan unduh file berikut untuk memahami MCD dan MWCD: referensi-mcd-dan-mwcd).
Pemanfaatn estimator covariance robust dalam dunia analisis multivariat adalah untuk merobustkan metode multivariat itu sendiri. Sebagaimana penulis buktikan pada analisis diskriminan kuadratik. Proporsi salah pengelompokkan dari fungsi diskrimina kuadratik dengan menggunakan estimator robust MCD lebih kecil daripada menggunakan metode MLE. Berikut disajikan hasil terapan MCD estimator dalam analisis diskriminan kuadratik yang penulis kutif dari thesis.
February 6, 2009 at 8:55 pm
thanks for your artickle…
February 22, 2009 at 5:22 pm
Pak,saya ingin tw tntng MCD ESTIMATOR,saya ingin minta jurnalny yg hubert (2004).trma ksh
March 12, 2009 at 9:51 am
assalamualaikum….
pak, libra yang bapak kasih dalam bentuk zip.tidak ada bagian setup-nya,hanya data-data saja…kalau boleh saya mw yang bagian setup-nya….
saya sudah mencoba mendownload dari internet beberapa hari ini, tapi tidak dapat juga.
terima kasih…atas bantuannya selama ini.
April 6, 2009 at 3:17 pm
Pak, saya mau tanya perbedaan MCD dan MWCD. menurut paper bapak MCD bisa digunakan untuk menggantikan estimator klasik pada PCA, yang saya tanyakan apa kelemahan dan kekurangan pca dengan menggunakan MCD? teruz kemudian yang saya baca MCD tidak dpt digunakan untuk mereduksi dimensi jika p>n. lalu apa ada nilai maksimal n berapa? untuk n lebih dari 1000 apa MCD masih mampu walaupun p<n?
MOHON BANTUANNYA PAK. TERIMA KASIH
April 11, 2009 at 10:56 am
Perbedaan MCD dan MWCD terletak pada weighted yang digunakan. Pada MCD semua subset data diberi bobot 1 yang lain diberi bobot nol. Pada MWCD subset data diberi bobot sesuai jarak mengikuti distribusi tertentu. Silakan merujuk pada Paper Roelant dkk yang membahas lengkap MWCD. Setahu saya MWCD masih dalam bentuk paper yang mungkin bisa dinaikkan menjadi Jurnal.
April 14, 2009 at 8:10 am
maaf mengganggu lagi..untuk perhitungan estimator robust dengan MCD, perhitungan jaraknya menggunakan jarak mahalanobis atau jarak robust pak?
trims bnyk
April 18, 2009 at 9:48 am
To Rheini: Saya hanya punya Librari nya Matlab. trus… MCD menggunakan jarak robust.
April 14, 2009 at 9:33 am
oy bapak ada robust library splus?
kl ada tlg dikirim lewat email ya pak.
terima kasih
June 11, 2009 at 1:23 pm
Pak,saya mahasiswi Universitas MUlawarman,, saya sedang mengerjakan skripsi tentang analisis diskriminan robust dengan metode MCD….tapi saya msh belum jelas ttg penggunaan metode MCD pada analisis diskriminan robust,, bisa kah bapak memberikan gambaran umum ttg hal tersebut. trima ksih.
June 16, 2009 at 4:11 pm
Ditunggu aja posting mengenai analisis diskriminan robust…. (Belum Sempat diupload)
September 10, 2009 at 11:44 am
pak saya ingin mengetahui tentang regresi robust yang menggunakan metode estimasi-M.
saya minta tolong ya pak,penjelasan tentang metode tersebut
November 3, 2009 at 11:56 am
slmt siang Pa..
Bpk sy mw nanya.
metode regresi robust yang baik digunakan yg mn y Pa??
da kriteria u/ msg2 metode nya g??
pa sy blh mnt jurnal atw materi ttg metod robust regrssion tsb, lengkp dg penurunan rumus ny??
mksh byk y Pa..
November 5, 2009 at 1:16 pm
pak sya mhswa yg sdng menyusun kolokium mengenai Regresi Robust dengan metode M-estimasi.tapi materinya masdih sedikit..kalau bisa saya minta penjelasannya mengenai hal tersebut.Trima kasih.