Robust Principal Component Analysis

Analisis komponen utama (principal component analysis=PCA) merupakan teknik statistik yang telah banyak digunakan. Pembahasan materi ini dapat ditemukan pada buku-buku analisis multivariat baik teori maupun aplikasi. Pemanfaatan PCA utamanya dalam menyusutkan dimensi data yang saling berkorelasi satu sama lain. Perkembangan

PCA dimulai sejak diperkenalkan pertama kali oleh Pearson pada tahun 1901. Sejalan dengan perkembangan teknologi komputer dan kemajuan di bidang matematika. PCA hingga kini masih terus mengalami perkembangan. Perkembangan selanjutnya, diperkenalkan generalisasi dari PCA oleh Loève pada tahun 1963.

Perkembangan PCA selanjutnya dipengaruhi adanya kebutuhan model PCA yang robust terhadap data pencilan (outlier). PCA klasik (CPCA) sangat dipengaruhi oleh kehadiran pencilan karena CPCA didasarkan pada matrik kovarian yang juga sangat sensitif terhadap keberadaan data pencilan. Untuk mengatasi masalah ini, matrik kovarian diestimasi estimasi kovarian yang robust dengan M-estimator (Devlin, dkk, 1975), Minimum Covariance Determinant (Rousseeuw, 1984), atau S-estimator (Croux dan Haesbroek, 1999). Ketiga metode ini baik jika digunakan untuk kasus jumlah variabel p > jumlah observasi n. Untuk kasus ini, Li dan Chen (1985) memperkenalkan robust PCA dengan Projection Pursuit (PP).

analisis-data-outlier-dgn-robpca-paper.pdf

126 Comments

  1. selamat siang pak….
    saya mahasiswi teknik informatika , sedang menyusun tugas akhir,.
    saya butuh referensi tentang PCA untuk judul TA saya tanda tangan digital pak..
    mohon pencerahannya pak..
    apakah bukunya tersedia.. kalo bapak ada referensinya mohon dengan sangat bantu saya.. kirimin ke email pak..
    terima kasih pak

  2. selamat pagi pak.
    saya lisa dari Yogyakarta, saya sedang mengerjakan TA tentang estimator M dan estimator S. namun saya masih kesulitan pak untuk menemukan materinya. mohon bantuannya dari bapak. jika ada apakah bisa dikirimkan ke email saya, alamat email saya lheisshyaniqta@gmail.com .
    Terima kasih

  3. selamat siang pak, saya erna dari NTT. Saya saat ini sedang mengerjakan tugas akhir dengan menggunakan metode LTS namun saya kesulitan untuk mendapatkan materinya pak. jika ada yang memupnyai materi ini bisa tlong kirimkan ke alamat email saya ervina_selay@yahoo.com.
    terima kasih

  4. Selamat malam pak Suryana. saya mau bertanya perbedaan estimasi parameter dengan ordinary least square (OLS) dan least trimmed squares(LTS)?
    apakah Bapak mempunyai materi dan langkah kerja dari metode least trimmed squares(LTS)?? jika ada apakah bisakah tolong dikirimkan untuk saya karena saya sangat kesulitan mencari buku dan bahan referensinya mengenai metode least trimmed squares. alamat email saya intanfm.cabby@gmail.com. terima kasih banyak pak sebelumnya

  5. selamat malam Pak Suryana. Saya Amelia mahasiwi S1 Statistika. Saya ada kendala mengerjakan syntax SAS untuk skripsi saya. Saya bingung syntax SAS untuk metode Least Trimmed Square dengan data bangkitan(simulasi). Saya sudah mencoba mengerjakan syntaxnya tapi tidak muncul nilai MSEnya. jika Bapak berkenan mohon diberikan bantuan bagaimana syntax SASnya dan jika punya referensi ttg LTS mohon dikirim k email saya :
    amelia.memey02@gmail.com
    terimakasih Pak.

  6. selamat sore pak, sya mhasiswa statistik dari Jogja, saya mau tanya pak penggunaan mcd untuk regresi linier berganda bisa gak ya pak??terima kasih pak..mohon jika berkenan Bapak bisa balas di email saya rocim08@gmail.com

  7. selamat malam pak Suryana. saya mau bertanya perbedaan esrimasi parameter degan ordinary least square (OLS) dengan least trimmed squares(LTS)?
    apakah Bapak mempunyai materi dan langkah kerja dari metode least trimmed squares(LTS)?? jika ada apakah bisakah tolong dikirimkan untuk saya karena saya sangat kesulitan mencari bukunya mengenai metode least trimmed squares. alamat email saya elisse91@yahoo.com. terima kasih banyak 🙂

  8. selamat sore, saya Erna… apakah Bapak mempunyai materi dan langkah kerja dari metode least trimmed squares??. jika ada apakah bisa dkirimkan untuk sya karena saya sangat kesulitan mencari bukunya disini. alamat email saya ervina_selay@yahoo.com. terimaksih banyak sebelumnya.

  9. Selamat malam Pak Suryana. Saya Ema mahasiswi S1 Statistika Univ Brawijaya. Saya bermaksud (jika disetujui dosen pembimbing) membahas di skripsi saya mengenai penerapan robust PCA dengan menggunakan metode Projection Persuit atau menggunakan metode MVE. Kalau berkenan saya mohon bantuan Bapak mengenai apa manfaat penggunaan robust PCA ini dalam masyarakat atau lingkungan? Mengenai 2 metode tadi apa perbedaannya? Jika Bapak tidak keberatan dan memiliki informasi, referensi buku atau jurnal mohon dikirimkan ke email saya (emaainunnirfianti@gmail.com) terima kasih Pak 🙂

  10. selamat malam bapak, saya eka irawan mahasiswa UNUD Bali,, saya sedang mengerjakan tugas akhir saya tentang LMS dan MVE tapi saya sangat kurang literatur pak,, jika bapak memiliki file LMS dan MVE saya minta tolong dikirim,, ini email saya ekaone17@yahoo.co.id,, terimakasi atas bantuan bapak,, saya sangat butuh bantuan bapak..

  11. selamat siang pak, saya mukti…
    saya mau nanya mengenai jarak robust…
    pak kalau boleh tau, bagaimana cara jarak robust meminimumkan efek masking dan swamping??
    saya sangat butuh bantuan bapak…
    sebelumnya saya sangat berterimakasih atas bantuan bapak…

    1. Selamat pagi Sdri Idha, mohon maaf permintaan Sdri tidak bisa dipenuhi karena ukuran file SAS sangat besar sekali sehingga tidak mungkin dikirim by email. Terima kasih untuk kunjungannya.

  12. askum.. salam kenal bapak Suryana. Saya Sherly mhsiswi S1 statistka. Sama seperti mbak dan mas2 yang coment di atas, Skripsi saya juga Regresi robust dengan metode Least Median Square (LMS), nie saya kendala di software pengolahan datanya pak. Software yang mudah untuk olah LMS apa ya pak? Saya mau make S-Pluss, tapi bingung input rumus-rumusnya. bingung banget pak. Mungkin bapak ada referensi cara mengolah datanya atau sekiranya bisa membantu saya cara menginputkan formulanya bapak?? terimakasih.. sekira bapak ada referensi tentang LMS serta cara pengolahan data nya, saya tunggu kiriman file bapak, ini email saya pak : tyas_bakpao@ymail.com

  13. pak saya mhsw dr Solo, mau tanya, kalau untuk mengestimasi parameter regresi robust untuk model non-linier apa saja metodenya? apakah sama dengan model linier berganda?

  14. slm kenal pak..saya wira mahasiswa uksw jurusan matematika..
    saya mau tanya..apa PCA itu datanya harus berdistribusi normal???
    seandainya data tdk normal apa harus ditransformasi ke normal???
    terimakasih

  15. assalamualaikum..
    selamat sore pak.
    perkenalkan, saya mita mahasiswa matematika UI yang sedang menyususn skripsi.
    saya mau tanya pak mengenai asumsi data pada PCA, apakah butuh asumsi normal?
    apakah data sampel yang digunakan harus banyak misalkan 10 kali dari banyaknya prediktor?
    apakah bisa mengatasi masalah missing data?

    mohon bantuannya ya pak.
    sebelumnya saya ucapkan terima kasih

  16. selamat malam pak, saya mukti…
    saya mau nanya mengenai metode minimum covariance determinant (MCD)…
    pak kalau boleh tau ap sich kelebihan MCD itu??
    apakah MCD untuk mendeteksi pencilan atau mengatasi pencilan??
    sebelumnya saya sangat berterimakasih atas bantuan bapak…

  17. slmat malam pak…
    saya ika mahasiswa UNTAN.saya sedang mengerjakan tugas akhir saya tentang Metode Volume Ellipsoid untuk mendeteksi outlier tapi terkendala karena kurang literatur. boleh saya minta file kalo ada tentang MVE pak…
    kalo boleh kirimkan ke email saya di ikharimah@ymail.com.
    terima kasih atas bantuan bapak…

  18. met siang pak…
    saya mukti yg dulu pernah minta file dengan bapak…
    saya mau nanya pak??
    apa bedanya Minimum Covariance Determinant dengan Least Median Square??

  19. mau nanya nih pak,kegunaan robust pca untuk data outlier apa sih? setelah mengidentifikasi outlier dengan fast mcd,data yang kita olah dengan metode robust pca apakah data yang tdk mengandung outlier, dan data yang mengandung outlier itu kita buang??? maaf pertanyaannya enggak absurd!! pemula sih….

  20. asmlkum pak..
    saya sedang nulis skripsi ttg regresi robust dengan menggunakan metode LTS..
    boleh minta referensi nya gk pak ttg LTS..
    terima kasih pak buat bantuannya..
    ini alamat imel sy.. juventus_3131@yahoo.com

  21. Salam kenal pak,
    saya ingin menanyakan mengenai metode robust dengan penduga MM. Mengapa menggunakan estimasi LMS atau LTS atau S dalam menduga koefisen awal baru metode M. kalau bapak mempunyai jurnal beserta contoh data mengenai materi ini mohon bantuannya ya pak.. Terimakasih

  22. met malem pak mw tanya pengolahan robust estimasi-mm dengan program S-plus.bapak punya programnya tidak.saya kesulitan mendapatkan programnya.kalo ada kirim di email saya ya pak

  23. selamat siang Pak
    wah,blok yang sangat menarik,sudah benyak rekan-rekan mahasiswa statistika yang comment di blok ini ya Pak?saya jadi tertarik ikut jejak mereka Pak..hehe
    saya aulia mahasiswa S1 statistika di unibraw yang juga sedang menyelesaikan tugas akhir,tema yang saya ambil mengenai robust pls dengan penduga M atau biasa disebut Partial robust M regression (PRM) untuk data mengandung outlier,,nah yang saya bingungkan pada pendeteksian outlier pak,saya mendapatkan dari jurnal outlier untuk robust pls itu jika outliernya terletak pada skor komponen (T),tapi ada juga jurnal lain mengatakan jika outlier terletak pada variabel x atau y..saya bingung disitu Pak..
    terima kasih jika bapak bersedia membantu mengatasi kebingungan saya..:-P

  24. Assalamualaikum bpak Suryana,.perkenalkan nama saya Lia mahasiswa statistik di Jogja.Menarik sekali blog bapak..Kebetulan saya juga sedang mengambil tugas akhir dengan tema robust PCA (alhamdulilah dosen pembimbing sudah setuju).Saya mendapatkan kesulitan pak dalam hal materinya,.saya hanya punya sedikit sekali referensi.Mohon bapak bersedia memberikan materi2 yang bapak punya tentang PCA,robust PCA atau mungkin dari thesis bapak sendiri. Satu lagi bapak saya juga belum menemukan data yang bisa dianalisis dengan robust PCA (data outlier).Mohon bantuannya pak untuk materi2nya beserta data.
    Terima kasih atas kebaikan bapak,..Nuwun.

    Salam

    Lia

  25. Assalamualaikum bpk Suryana,..menarik sekali pak blognya.Perkenalkan nama saya Lia mahasiswa prodi statistik di jogja.Saya ingin mengambil skripsi (alhamdulilah pembimbing sdh megizinkan) tentang robust PCA,.dan saya mengalami kesulitan dalam materi sekaligus datanya.Mohon sekiranya bapak bersedia mengirimkan materi2 yang menyangkut robust PCA,paper/tesis bapak atau materi2 lain yang bapak punya.Dan satu lagi pak,.saya juga sulit untuk mendapatkan data yang bisa diolah dengan robust PCA serta PCA.Seperti yg bapak sampaikan di atas,saya juga ingin membandingkan antara PCA dan robust PCA.Mohon bantuan dan bimbingannya yaa bapak,..Terimakasih.Nuwun

  26. maaf pak,
    saya Griya Dari UNS
    saya tertarik dengan regresi Robust dengan penduga S..
    tapi datanya mengandung Multikolinearitas,
    apakah menanganinya dengan ROBPCA juga?

    kalau menggunakan yang S-estimator itu bedanya apa ya pak?
    trimakasih

  27. mf pak saya mhsswi di Jogja.
    saya sedang membahas tentang reg robust dengan estimasi LMS.
    apakah bpk punya referensi tentang LMS?
    kalau punya tolong kirim ke email saya
    lina.kurnia07@gmail.com
    dan kalau bpk punya software Splus tolong saya dikirimi jg.
    terimakasih atas bantuannya..

  28. pak, saya mahasiswi UNY.saya sedang mengerjakan TA tentang regresi robust.
    saya kesulitan mecari bahan tentang estimasi S dan LMS.saya mohon bapak dapat bersedia membantu saya.
    tolong kirimkan referensi yang bpk punya ke:
    lina.kurnia07@gmail.com
    dan juga kalau bapak mempnyai software Splus tolong kirimkan juga.
    terimakasih sebelumnya pak.

  29. aslm, pak saya yanti mahasiswi yang sedang TA, tolong pak bantu saya, saya butuh file tentang robust, least median squares, least trimmed of squares, dan penjelasan dari bapak.

    terimakasih bapak atas bantuannya..

  30. pak, saya mahasiswi unpad yang sedang mengerjakan tugas akhir, tugas akhir saya memperbandingkan metode analisis regresi komponen utama robust yaitu
    MVE-LMS dan MVE-LTS
    saya kesulitan mencari bahan2 tersebut,
    saya mohon beberapa referensi yang bapak punya dapat di emailkan ke dini_aderlina@yahoo.com

    terimaksaih atas bantuan bapak..

  31. salam
    pak sy mau tanya, sy kurang begitu faham ttg langkh2 m estimasi, n dalam m estimasi ada yg namanya fungsi2 ukuran robust gunanya untuk apa? dan apakah m estimasi bs diselesaikan dengan bantuan MINITAB.mohon penjelasannya…makasih

  32. saya mau tanyakan tentang Least Trimmed Square… apa bpk punya referensi mengenai ini?
    trus bgm hubungannya dengan robust…
    mohon penjelasannya…
    terima kasih

  33. ass.wr.wb.
    pak sy ingin tanya apakah data Indeks harga konsumen (IHK) bisa saya gunakan pada metode ROBPCA untuk mengatasi pencilannya??

  34. ass.wr.wb.
    maaf pak, saya mau tanya..
    tapi mungkin agak sedikit keluar dari ROBPCA.
    saya mahasiswa yang sedang mengerjakan skripsi dan salah satu pengolahan datany menggunakan faktor analisis dg SPSS 14.
    salah satu syarat faktor analisis, data harus berupa interval.
    tapi pada ekstraksi faktor, menggunakan pilihan principal component analysis yang bisa digunakan untuk data ordinal juga.

    kalau seperti itu, jadi sebaiknya data ordinal harus diubah dulu menjadi interval atau tidak ya pak sebelum dilakukan analisis faktor?
    mohon bantuannya dan terima kasih atas bantuannya pak..

  35. salam kenal.pak, saya mau tanya apa perbedaan regresi robust dengan m estimasi dan LMS serta Rank residual? manakah dari ketiga estimasi tersebut yang lebih baik?trimakasih.

    1. salam kenal pak.saya mau tmy, apakah kelemahan dari regresi robust dengan penduga S, M, dan MM??
      mohon informasi yg lengkap y pak!!
      krn ini d buat acuan bhn skripsi yg sedang saya kerjakan.terimakasih.

  36. maaf pak , saya mau tanya pada paper bapak tentang analisis data outlier pada pengeluaran rumah tangga dengan metode robust PCA digunakan data pengeluaran rumah tangga, yang saya tanya data seperti apa saja yang bisa dipakai untuk metode robust PCA selain pengeluaran rumah tangga?

  37. Assalam…
    maaf pak bisa minta tolong saya kurang paham dengan robust m-estimasi jadi bisa kirimkan contoh study kasus regresi robust dengan M-estimasi dengan analisisnya, mohon bantuannya
    trimaksih sebelumnya,,,,,,,,,,,,,,,,,,

  38. Pak, maaf. Saya pernah membaca thesis Bapak. Disitu dituliskan bahwa untuk data yang jumlah sample<variabel, akan lebih baik menggunakan MCD, M-estimator, atau S-estimator. Apakah dalam hal ini PCA klasik tidak bisa digunakan?apa prasyarat untuk penerapan ketiga metoda tersebut?bagaimana saya harus memilih mana yang tepat digunakan untuk suatu data?terima kasih banyak Pak sebelumnya. mohon bantuannya karena data thesis saya memiliki karakteristik seperti itu dan tidak dapat dioperasikan dengan SPSS dengan metoda PCA klasik. Maaf apabila pertanyaan saya terlalu dangkal, karena saya termasuk newcomer dalam statistik.terima kasih.

    1. Untuk LTS Robust Regression, Fitri bisa mengolahnya dengan SAS 9.0 dengan memanggil PROC ROBUSTREG. LTS bisa juga diolah melalui S-Plus dengan ltsreg procedure.

      Untuk M-Estimation Robust Regression, Fitri dapat menggunakan R dengan mengaplikasikan fungsi rlm (robust linear model) dalam MASS library. Terima kasih.

      1. Aslm. Pak, sy mau nanya lagi. KLo untuk pembahasan mengenai robust (M dan LTS estimator) harus ada pembahasan mengenai Multikolinearitas, Autokorelasi, Hteroskedastisitas gak pak???ditunggu jawabannya secepatnya.trims

      2. truz klo di studi kasusnya perlu dibahas tentang metode OLS gak pak?atau cukup ngebahas metode robustnya aja?

      3. pak, bisa tolong dijelaskan kenapa metode robust tidak bisa dilakukan uji F atau t, karena harus mmenuhi distribusi identik dan independen.Truz pemilihan model terbaiknya gmn caranya??Waktu saya baca jurnal ada AICR, BICR, dan RFPE itu maksudnya apa????mohon penjelaasannya. trims

    2. aslm. pak, saya mw minta algoritma (syntax) SAS 9.0 untuk pengujian pengamatan berpengaruh(DFFITS, DCOOKS)???Saya gtau pak.trims.ditunggu jawabannya….

  39. aslm.pak, mohon bantuannya, ad file tentang metode robust Least Median Square(LMS), Least Trimmed Square (LTS),Minimum Covariance Determinant (MCD), Minimum Volume Elipsoid (MVE)klo ad tlg kirim k email sy y pak??? file di atas rencana untuk tgs akhir saya.
    besar harapan saya klu file ny ad.
    saya sangat berterima kasih banyak klu bpk bs mengirimkan file tersebut.

  40. aslm. Pak, ini pitri yang pernah minta file2 tentang metode robust LTS dan M estimator. Skrg sy mw minta bantuan bpk lagi. sy mw minta data yang ada pencilannya yng bisa diolah menggunaan metode LTS dan M estimatr, ada g pak datanya????klo ada tlg kirim ke email sy y pak??besar harapan saya kiranya bpk mw membantu sy lg. Jazakallah…

  41. aslm. Pak, ini pitri yang pernah minta file2 tentang metode robust LTS dan M estimator. Skrg sy mw minta bantuan bpk lagi. sy mw minta data yang ada pencilannya yng bisa diolah menggunaan metode LTS dan M estimatr, ada g pak datanya????klo ada tlg kirim ke email sy y pak??besar harapan saya kiranya bpk mw membantu sy lg. Jazakallah…

  42. aslm.pak, file yg bpk kirim ke email sy cuma ada “Radical M estimator corelation and rgression” klo file ttg LTS nya blum dikirim y pak?mksh

      1. aslm. iya pak udah nyampe kirimn file2nya di email sy. Jazakallah khoiron katsiro atas kebaikan bpk.

  43. pak,,, mohon bantuannya… saya ingin mengolah data dengan menggunakan LIBRA dengan Matlab R2009a bisa tidak?

  44. aslm. mf pak, file CD tentang Robust M estimator dan LTS estimator udah dikirim k almt kmpus sy blum?soalnya di kampus blum ada paket kiriman dari bpk.mf pak…mksh.

  45. asl.maaf pak program matlab dan splus yang bbapak kirim lewat email belum masuk di email saya bisa dikirim ulang! terima kasih sebelumnya untuk penjelasan tahapan ROBPCAnya Pak.

  46. aslm. Pak, sebenarnya untuk membandingkan dua buah model yang PALING robust antara LTS dan M estimator itu dilhat dari apanya??trims

    1. Menurut hemat Saya, Pitri sedang meneliti efek penggunaan metode estimasi robust LTS dan M terhadap pemodelan. Jadi, ukurannya buka pada metode mana yang paling robust tetapi metode mana yang mempunyai efek terhadap pemodelan yang terbaik. Jadi, ukuran kinerja metode tersebut bisa dilihat dari model mana yang mengasilkan error terkecil atau metode mana yang menghasilkan pelanggaran model paling sedikit (multikolinearitas, autokorelasi, dsb). Ukuran tingkat kerobust-an sendiri bisa dilihat dari besaran breakdown value masing-masing metode, tingkat konvergensinya (cepat atau lambat), MSE, dll.

  47. Pak, sy mau tanya tentang aplikasi PCA untuk pengelompokkan kemiripan data pakai pemrograman matlab trus diplot gambarnya.
    secara analitis sy th langkah2nya :
    1. masukkan data dalam bentuk matriks
    2.kurangi masing-masing data dengan rata-rata dari set data tersebut
    3. hitung matriks kovarian dari set data tersebut
    4.hitung eigenvalue dan eigenvektor dari matriks kovarian
    5.pilih eigenvalue kemudian hitung matriks feturePCA
    transformasi data awal menjadi data final.

    tapi untuk pemrograman di matlab sy blm bs. mohon petunjuknya via email. trkmsh

    1. @ Ummi: Trims tuk kunjungannya di statistikaterapan. Ummi bisa menggunakan program robpca yang disimpan dalam folder LIBRA. Baca dan ikuti langkah-langkah pengolahan Robpca yang ada di blog ini. Untuk diketahui rob pca selain bisa mengolah PCA robust juga bisa mengolah PCA klasik. Ummi juga bisa mengolah PCA di SPSS, Matlab atau Software statistik yang lain.

  48. pak saya mau bertanya, saya mengangkat paper anda tentang ROBPCA sebagai tema skripsi yang saya susun, tapi saya agak bingung dalam tahapan ROBPCA ini, apa yang pertama harus saya cari? apakah menentukan datanya dulu outlier atau tidak? karena saya agak bingung waktu membaca paper ini, kalau bisa tolong jelaskan secara rinci tahapan analisis data outlier ini dengan menggunakan metode ROBPCA? lalu metode apa yang digunakan untuk menentukan data outliernya?

    1. @ Wahyuna: Izinkan Saya menjelaskan jawaban dari pertanyaan Sdri. Tahapan analisis Robust PCA yang pertama adalah mengidentifikasi data apakah data yang akan kita kaji mengandung sejumlah outlier atau tidak. Metode penentuan data outlier dalam hal ini dengan menggunakan robust distance yang distribusi asymptotiknya mengikuti distribusi chi-square. Dalam papernya Hubert (2004) disebutkan bahwa data multivariat dikatakan outlier apabila melebihi batas chi-sguare dengan tingkat signifikansi 95 persen. Secara grafis, data outlier ini akan berada di luar ellips yang terbentuk. Dengan terbentuknya sekelompok data outlier ini kita dapat mengkaji jenis data outlier yang terbentuk apakah termasuk kategori shift outlier, scale outlier, atau radial outlier.
      Data shift outlier mempunyai ciri berbeda dengan data tidak outlier dalam hal rata-ratanya saja, scale outlier berbeda dalam hal varians kovariannya dan radial outlier berbeda dalam hal keduanya baik rata-rata maupun varian kovariannya.
      Setelah data outlier teridentifikasi barulah kita aplikasikan Robust PCA dan Klasik PCA untuk diketahui perbedaan kinerja dari kedua metode PCA tadi. Mana yang menghasilkan sedikit komponen untuk penjelasan varian data yang maksimal. Dalam paper saya dicontohkan bahwa metode robust pca menghasilkan sedikit komponen untuk penjelasan varian data yang sama dengan PCA klasik.

  49. pak, cara menggunakan ROBPCA di Matlab bagaimana?bisa jelaskan…
    saya sudah membaca, artikel bpak ttg mengolah data dengan robpca tapi, tidak bisa…

  50. Mohon maaf pak, Saya mahasiswa univ. Tarumanagara yang sedang menyusun tugas akhir berkaitan dengan 7 metode regresi. Salah satunya tentang regresi clasic PCR. Mohon bantuan bapak untuk menerangkan bedanya dengan ROBPCA yang bapak terangkan dimana..? Apa bedanya metode ROBPCA tadi dengan metode robust with minimum covariant determinant (keunggulan / kelebihan)?

      1. Mohon bantuan ya,,,saya juga sudah mencoba mendownld program matlab untuk ROBPCA tapi belum berhasil,,,bsa gak saya mta tlg untuk dikirimkan programnya???

    1. @pitri: Robust kalau dibahasa Indonesiakan artinya “tegar” dalam arti tidak terpengaruh oleh kehadiran outlier. Estimator Robust bermakna kokoh dalam mengestimasi baik ada outlier maupun tidak ada outlier.

      1. aslm. pak, terima kasih buku maronanya yg dah dikirim ke email. tp tidak bisa dibuka.heheheee. gmn atuh pak???mksh jg sebelumnya udah mw ngirimin file2 LTS dan M estimator. Ditunggu y pak..

      2. @pitri: Maaf atuh…. kirain sudah bisa dibuka filenya. Ya udah referensinya dikirim via CD aja.

    2. aslm.pak, file yg bpk kirim ke email sy cuma ada “Radical M estimator corelation and rgression” klo file ttg LTS nya blum dikirim y pak?mksh

  51. berhubung sy anak kosan, sy kirimkan alamat kampus sy. Gedung FPMIPA Universitas Pendidikan Indonesia (UPI) jalan dr setiabudhi no.229, bandung.atas nama PITRI NURHAYATI Nim 060039 Jurusan Pendidikan Matematika, Prodi Matematika.
    Judul skripsi sy, Penggunaan Metode robust dalam menaksir parameter regresi . tapi isinya perbandingan model penaksir LTS dan M

  52. pagi pak…
    saya vera, mau bertanya, untuk robust principal component analysis sebenarnya ada berapa metode, dan metode mana yang paling baik…
    terimakasih

  53. pagi, pak..
    saya mau minta tolong,,, saya baru membaca tentang ROBPCA… dan tertarik untuk menjadikannya sebagai bahan TA…
    boleh tidak saya minta beberapa data untuk saya bisa pakai dengan metode ini…
    terima kasih sebelumnya…

  54. mf pak sy mohon bantuannya. sya lg nyusun tugas akhir tentang perbandingan antara metode LTS dan M estimator. Sy mw minta tolong dikirimkan file-filenya pak. sy kekurangan referensi. Truz, menurut bpk..bagus gak judul TA sy??apa kelebihan dan kekurangan dari metode tersebut.trima kasiih

    1. @ V3: Referensi yang dimaksud V3, Insya Alloh Saya memepunyai beberapa referensi yang sangat relevan. Berhubung filenya besar silakan kirimkan alamat rumah/kampus untuk Saya kirimi referensi dimaksud dalam bentuk CD. Soal judul….. belum jelas apanya yang akan dibandingkan apakah kinerja estimatornya atau perbandingan kerobust-annya atau apa?

  55. selamat malam pak….perkenalkan nama saya seno. saya lg mengerjakan skripsi saya yang berjudul analisis regresi robust dgn metode LMS, yang saya mw txkan metode apa yang trbgus untuk mendeteksi penclan dan apa alasanya? serta metode apa yang bsa saya gunakan untuk mendeteksi pencialn y berpengaruh untuk variabel berganda?selain permsalahn itu saya jg msh sgt kkergan refrensi ttg regresi robust dengan metode LMS??kl ada refrensi bsa tlong krimkan via email??trmksh seblumnya

  56. salam kenal, saya Lina mahasiswi Universitas Mulawarman Samarinda. saya sekarang sedang menulis skripsi tentang Analisis Diskriminan Robust dengan metode MCD(Minimum Covariance Determinant),, Yang saya ingin tanyakan, bisa kah saya meminta penjelasan atau gambaran umum mengenai analisis diskriminan robust dengan metode MCD tersebut????
    Terima kasih.

  57. Selamat malam

    Salam kenal, saya eri mahasiswa di Statistika UNPAD. pa, bisa tolong jelaskan alasan mengapa kita harus menggunakan PCA dan Analisis Faktor?
    Lalu mana yang lebih baik digunakan (perbandingannya)bila kita ingin melihat faktor-faktor mana yang lebih berpengaruh..?

    Apa bapa mengetahui web yang menjelaskan perbandingan PCA dan Analisis Faktor

    1. PCA dan Analisis Faktor merupakan dua teknik analisis yang berbeda. PCA mereduksi variabel yang saling berkorelasi dengan membentuk variabel baru yang merupakan kombinasi linear dari variabel yang lama. Sebaliknya, faktor analisis mencari faktor umum (general faktor) yang membangkitkan variabel itu sendiri. Dengan demikian, untuk mencari fator-faktor umum yang medasari suatu variabel sangat cocok jika menggunakan analisis faktor.

  58. selamat sore dan salam kenal..
    saya mahasiswi Statistika IPB. saat ini saya sedang mulai menyusun skripsi tentang robust principle component. beruntung sekali saya menemukan situs ini..=)

    1. Selamat bergabung di peminat robust PCA. Jika ada yang akan didiskusikan, jangan sungkan untuk melayangkan diskusi melalui blog ini atau via email. Tks.

  59. salam kenal, saya ria mahasiswa brawijya. saya sekarang sedang menulis skripsi tentang robust principal component regression (RPCR). yang saya ingin tanyakn. kenapa qta mesti melakukan regresi robust, padahal pencilan sudah tertangani pada PCA robust? alasan mengapa menggunakan regresi komponen utama? knapa tidak menggunakan regresi linier berganda biasa saja. terima kasih.

    1. To Ria…. thanks buat kunjungannya. Saya belum membaca jurnal RPCR. Tetapi sekilas bisa saya jelaskan tujuan masing-masing dari dua metode dalam RPCR. Ada kemungkinan variabel independen dalam model masih saling berkorelasi. Padahal, regresi berganda mensyaratkan tidak ada korelasi di antara variabel independen. Untuk mengatasinya kita gunakan principal component karena dengan principal component variabel independen yang saling berkorelasi bisa direduksi menjadi sejumlah variabel yang saling dependen (bebas).
      Robust statistik bertujuan agar estimasi parameter dari model regresi tidak dipengaruhi oleh sejumlah data yang bersifat pencilan. Dengan Robust Principal Component data-data yang bersifat pencilan tersebut tidak akan disertakan dalam penghitugan estimasi rata-rata dan kovariansi data. Dengan langkah ini diharapkan pemodelan regresi menjadi lebih resisten terhadap data outlier (pencilan). Demikian Ria, kalau tidak keberatan… minta tolong jurnal RPCR dikirimkan ke email suryana@bps.go.id untuk menambah wawasan perstatistika Saya. Terima kasih.

  60. perkenalkan nama saya yudi….saya tertarik dengan regresi robust dan ingin membahas materi ini di skripsi saya..pak surya punya ide ga??

    1. To: Yudi,
      Saran saya, coba Yudi eksplorasi data lebih dulu. Apabila ada sejumlah data outlier dan Yudi ingin meneliti hubungan dua variabel, maka regresi robust bisa digunakan. Tetapi jika, tidak ada data outlier maka regresi biasa cukup Yudi gunakan. Demikian.

  61. bs jelaskan, pa sich M-Estimator & S-Estimator tu???

    Llu prbedaanny pa diantara kedua estimasi tsb???

    Fungsi kedua estimator tsb pa???

    thx b4

    1. Untuk persamaan antara M dan S estimator, sama-sama digunakan untuk mengestimasi reta-rata dan kovariansi data yang mengandung outlier. Perbedaannya terletak pada tingkat robustnessnya. Seingat saya, S-estimator lebih baik dari sisi breakdownt point dan konvergensinya. Secara teknis perhitungannya, sebaiknya merujuk pada jurnal yang membahas kedua estimator ini.

  62. mau tanya,, apakah sesuai jika saya menggunakan regresi robust untuk meneliti hubungan antara data curah hujan dengan temperatur dan data pasang surut? kalo tidak sesuai, metode apa yang sesuai?
    lalu jika ingin mengetahui distribusinya bagaimana? terimakasih..

    1. Menurut Saya, untuk menetukan model apa yang sesuai untuk pemodelan curah hujan, temperatur dan pasang-surut sebaiknya Ajeng membuat scatterplotnya dulu. Dari langkah ini, jika plotnya menunjukkan pola tertentu semisal linear, kuadratik, atau kubik silakan gunakan analisis regresi (sesuaikan dengan bentuk plotnya). Jika data mengandung pencilan, baru kita gunakan regresi robust. Tetapi, jika plot data tidak berpola, Saya sarankan gunakan regresi nonparametrik. Model akan menyesuaikan bentuk plot data.

      Untuk mengetahui bentuk distribusi data, Ajrng bisa memanfaatkan Minitab. Pada salah satu menu terdapat fungsi untuk mencari bentuk distribusi data. Demikian, semoga bermanfaat.

  63. salam kenal pak surya,saya revan mahasiswa fapet ipb,..saya ingin mempelajari PCA yg aplikasinya untuk bidang peternakan..saya tidak begitu paham dengan statistik..jd dimana(referensi) saya bisa belajar PCA ini sebagai orang awam..mohon bantuannya.
    terimakasi

  64. perkenalkan saya anisyah anak matematika ugm yang mendalami statistik…..Saya pernah mencoba paper / jurnal yang bapak pernah rekomendasikan untuk menggunakan toolbox libra untuk metode robpca………pas saya coba koq banyaknya principal components yang muncul cuma max 10…… pa mang gitu yachhhhhh…………tidak bisa diperbanyak kah??????????
    Trima Kasih………….

  65. Pagi pak…Pak, tehnik PCA ini katanya hanya bagus untuk data linear. Kalau untuk data non linear lebihj bagus pake tehnik apa ya pak?
    Terimakasih…

  66. selamat pagi pak…saya mau tanya apa ROBPCA ini sudah ada program aplikasi untuk membantu menghitungnya tidak? soalnya saya sedang mencari teori statistik yang bisa saya buat programnya untuk skripsi saya. Terima kasih

    1. Program Aplikasi yang ada adalah Matlab. Itupun dengan menambahkan Toolbox LIBRA dari Hubert. Sri bisa googling. Pasti dapet. Jika tidak, Saya bisa kirimkan via email tanggal 15 Desember 2008. Terima kasih.

  67. Selmt malam.Bapak Suryana saya mohon bantuan lagi, saya membutuhkan beberapa data (5 data) yang dapat dianalisis dengan metode ROBPCA, jika Bapak mempunyai beberapa data tersebut, mohon saya diizinkan untuk memakainya sebagai penerapan pada skripsi saya. Saya mencoba menggunakan softwere S-plus6 untuk melakukan analisis tersebut.Terima kasih atas bantuan Bapak sebelumnya, karena hal tersebut sangat membantu saya dalam menyelesaikan skripsi saya.terima kasih.

  68. Jawaban Untuk Sdri Tiwik:

    ROBPCA digunakan untuk mereduksi dimensi data dengan Principal Component Analysis dari data yang mengandung sejumlah outlier. Merobust-kan data artinya bisa bermakna menganalisis data dengan tidak menyertakan data outlier. Dalam ROBPCA misalnya, Hubert dkk menggunakan MCD untuk merobustkan rata-rata dan matrik varians-kovarians. Caranya dengan mengambil sebagian data di mana determinant matrik varians-kovarians terkecil. Dengan algoritma FAST-MCD menjadikan pencarian rata-rata dan matrik varians-kovarians dengan metode MCD menjadi cepat dari sisi waktu komputasi.

    Untuk pengolahan ROBPCA bisa menggunakan Matlab ataupun S-Plus. Hubert dkk telah menyusun LIBRA yang merupakan kumpulan source program Matlab untuk penghitungan robust statistik. Toolbox ini bisa diunduh di
    http://wis.kuleuven.be/stat/robust/LIBRA.html

    Jika ada kesulitan pengoperasiannya, bisa menghubungi kembali melalui site

    http://www.statistikaterapan.wordpress.com.

    Terima kasih.

  69. Jawaban untuk Ririn di Unibraw,

    Untuk mengetahui suatu data multivariat mengandung outlier atau tidak bisa melalui pendekatan jarak robust. Jarak robust merupakan modifikasi dari jarak mahalanobis dengan menggantikan unsur vektor rata-rata dan matrik varians-kovarians (klasik) dengan rata-rata dan matrik varians-kovarians yang menggunakan metode robust seperti MCD. Data multivariat dikatakan outlier jika melebihi jarak robust pada alpha yang ditentukan. Distribusi dari jarak robust mendekati distribusi chi square pada alpha tertentu. Pembahasan mengenai ini bisa mengacu pada tulisan Hubert dkk mengenai Multivariate Robust.

    Sewaktu saya menyusun thesis, Hubert dalam proses penyusunan buku. Adapun Hubert (2004) masih berupa journal. (Journal dan Papernya masih saya cari, kalau sudah ketemu ta kirim ke Sdri Ririn via email).

  70. Salam kenal, P’Sur, saya berminat sekali dg ilmu statistika walaupun background saya dari ekonomi. Baru-baru ini saya dengar istilah Robust PCA (ROBPCA). Katanya utk data yg banyak outlier-nya & sulit untuk di normal-kan … betul ya Pak? Saya ingin tahu, kalau data kita di-robust, apa itu maksudnya data kita itu ditransformasi dg formula semacam z-score, tapi mean diganti dg m-estimator dan std deviasi diganti dengan interquartile range? Aplikasi ROBPCA di SPSS bgm ya? Help me ya Pak, soalnya utk yg spt ini saya betul-betul ‘buta’. Saya sdh coba baca jurnalnya Hubert, Croux, Rouseeuw dll, tapi yg ada saya malah semakin bingung berat, soalnya itu rumusnya cukup asing buat saya. Trims banyak.

  71. slmt siang…!saya ingin tanya, bagaimana kita tau suatu data multivariat mengandung pencilan metode inferensia/kuantitatif? ?menurut Anda, saya sebaik’y menggunakan metode Stahel Donodo /MCD untk mengts pencilan? saya mencr bk kargn Hubert (2004) d.perpuz UNIBRAW tdk ada,di mn sy bs memprlh bk itu ya?terima kasih

  72. Salah satu referensi statistik robust bisa Sdri Ririn download di
    wis.kuleuven.be/stat/robust/Papers/robpca.pdf

    Referensi lainnya yang penting adalah:
    http://wis.kuleuven.be/stat/robust/LIBRA.html

    karena memuat program pengolahan robpca oleh Hubert (2004).

    Masih di site yang sama, Sdri dapat menemukan referensi lain mengenai robust statistik.

    Semoga, jawaban ini membantu Sdri.

    Terima kasih.

  73. Salam kenal,saya adlh mhswi statistika Univ.Brawijaya.Saya tertarik dgn paper yg saudara berkaitan dengan ROBPCA terkait dengan pencilan data.Saya terinspirasi dengan paper tersebut, sehingga saya mengambil judul skripsi yang berkaitan dengan ROBPCA terhadap pencilan data.Jika Saudara mempunyai jurnal atau referensi buku yang berkaitan dengan ROBPCA,mohon Saudara berkenan untuk memberikan informasi kepada saya, untuk membantu penyelesaian skripsi saya (ri2n_medy@yahoo.com).Terima kasih.

  74. Trims tuk kunjungannya. Salam perkenalan. Robust Principal Component Analysis (RPCA) merupakan pengembangan dari Principal Component Analysis (PCA) klasik. Apa bedanya? Penurunan komponen pada PCA klasik berbasis pada estimasi rata-rata dan kovariansi dengan metode Maximum Likelihood Estimator (MLE). Ada kelemahan penggunaan metode MLE. Pada saat data mengandung sejumlah outlier, sejumlah data yang berasal dari distribusi yang berbeda dengan distribusi data asal, rata-rata dan kovariansinya tidak resisten. Sebagai contoh, Haniaty mempunyai data 1,2,3,4,dan 5. Rata-rata kelima data ini adalah 3. Seandainya data ketiga kita ganti dengan 100 (sebagai contoh outlier) maka rata-rata menjadi 22,4 sangat berbeda dengan rata-rata sebelumnya. Inilah contoh bahwa rata-rata dengan metode MLE tidak resisten terhadap keberadaan data outlier. Sebagai ukuran tingkat resistensi suatu metode terhadap keberadaan outlier digunakan breakdownpoint. Breakdownpoint untuk rata-rata adalah 1, artinya dengan hanya menggantikan 1 nilai ektrim pada data asal maka akan didapati perubahan rata-rata yang sangat besar.
    Untuk mengatasi kelemahan PCA klasik, digunakanlah RPCA yang menggunakan metode estimasi untuk rata-rata dan kovariansi data dengan metode yang resisten terhadap keberadaan outlier. Salah satu metode yang digunakan adalah Minimum Covariance Determinant yaitu suatu metode yang mengestimasi rata-rata dan kovariansi data dengan menggunakan sebagian data yang menghasilkan determinan kovariansi terkecil. Penggunaan MCD dalam PCA telah dikembangkan oleh Hubert (2004). Saya mempunyai jurnalnya, jika Sdr. Haniaty ingin tahu lebih jauh.
    Saya pernah mencoba menerapkan robust PCA pada reduksi data pengeluaran di Provinsi Jawa Tiur Tahun 2002. Hasilnya sangat mengesankan. Untuk mereduksi data dengan mempertahankan variasi data lebih dari 80 persen, PCA klasik membutuhkan minimal 11 komponen dari 21 komponen yang ada sementara RPCA cukup menggunakan 3 komponen saja.
    Terima kasih.

Leave a reply to Suryana Cancel reply