Memahami Regresi Linear dengan Simulasi

Pada posting kali ini, penulis mencoba menyajikan sebuah tulisan ringan mengenai bagaimana cara pintas mempelajari pemodelan statistik yang berbasis model (model based). Yang dimaksud model based di sini adalah model statistik yang telah ditentukan lebih dahulu model matematisnya sebelum karakteristik data diketahui. Sebagai contoh dalam model regresi linear peneliti mengasumsikan hubungan antara variabel bebas dan variabel terikat berbentuk lurus (linear).
Salah satu kelemahan model based adalah adanya berbagai asumsi yang menyertai model itu. Dalam model regresi misalnya meangasumsikan error harus berdistribusi normal dengan rata-rata nol dan varians tertentu. Karena error model bisa terdeteksi setelah model terbentuk maka variabel terikatlah yang disyaratkan berdistribusi normal dengan rata-rata dan varians tertentu. Permasalahannya data seperti apa yang berdistribusi normal dengan rata-rata dan varians tertentu itu?
Melalui simulasi data, kita dapat memahami pemodelan statistik yang model based tadi. Caranya?

Misalkan kita ingin mempelajari bagaimana sih model regresi linear itu? Pertama kita modelkan dulu secara matematis, misalkan model regresi linear kita nyatakan sebagai

reglin

 

di mana y diasumsikan berdistribusi normal dengan rata-rata  mu dan varians  var tertentu. Error diasumsikan berdistribusi normal dengan rata-rata nol dan varians var.

Kita bisa meminta bantuan pada minitab (Penulis menggunakan Minitab 14) untuk simulasi di atas. Sebelumnya, aktifkan terlebih dahulu Command Session dengan mengklik

Editor

         Enable Command.

Misalkan model regresi yang akan kita bangkitan adalah

reglincontoh

 

dengan

ye

 

 

Pertama, bangkitkan 100 data berdistribusi normal dengan rata-rata 5 dan var 2, simpan di kolom C1 dengan mengetik

MTB > Random 100 C1;
SUBC> Normal 5 2.

Beri keterangan ‘y’ pada kolom C1.

Kedua, bangkitkan 100 data berdistribusi normal dengan rata-rata nol dan var 3, simpan di kolom C2 dengan mengetik

MTB > Random 100 C2;
SUBC> Normal 0 3.

Beri keterangan e atau error pada kolom C2.

Selanjutnya, bangkitkan 100 data konstan, misalnya 5 pada kolom C3 dengan mengetikkan

MTB > Set C3
DATA> 1( 5 : 5 / 1 )100
DATA> End.

Beri keterangan ‘c’ pada kolom 3 tersebut.

Langkah terakhir membangkitkan variabel bebas x. Dalam hal ini, x bersifat fix dan tidak mempunyai distribusi tertentu. Ketikkan

MTB > LET C4 =0.5*(C1-C2-C3)
 

 

Beri keterangan x pada kolom 4.

Buat scatter plot antara x dan y. Hasilnya akan tampak sebagai berikut:

scatterplot-of-y-vs-x

Tampak scatter plot antara y dan x menunjukkan pola linear dengan slop positif. Cobalah dengan langkah yang sama dengan menggantikan distribusi error yang berbeda, dan perhatikan pola yang terbentuk. Di sini, penulis mencoba distribusi error normal(0,1) dan normal (0,1.5). Scatter plot yang dihasilkan tampak sebagai berikut:

scat-gif

Kesimpulan yang bisa dipetil adalah, semakin kecil varians dari error, maka pola linear akan semakin nyata terlihat. Pengaruh error akan mempengaruhi pola linear yang terbentuk.

7 Comments

  1. didalam penjelasan regresi diatas secara singkat regresi itu alat untuk mengukur variabel yang mempengaruhi terhadap yang di pengaruhi(devenden to indevenden variable) contoh :seberapa besar pengaruh politik uang terhadap kemenangan kandidat calon pimpinan x

  2. regresi linier digunakan untuk menganalisis hubungan antara satu peubah dengan peubah lain atau satu peubah dengan beberapa peubah. regresi biasa digunakan untuk memodelkan suatu masalah tapi regresi hanya bisa digunakanuntuk interpolasi jadi tidak bisa ekstrapolasi.. jadi regresi tidak bisa dilakukan untuk peralaman

    1. yang lebih tepat ,regresi linier di gunakan untuk mengukur seberapa besar pengaruh yang mempengaruhi terhadap yang di pengaruhi( devenden to indevenden)

  3. Haii..

    terus terang saya masih dangkal tentang regresi linier dan penggunaannya.bisa ga posting tentang dasar teorinya? thanks

  4. terimakasih ya sebelumnya , maaf merepotkan lagi nih , saya mau nanya : parameter apa aja yang dipergunakan dalam statistika non parametrik . selain parameter penghalus . mohon bantuanya . ( kalau tidak berkeberatan mohon tolong balas juga ke email saya )
    terimakasih atas balasanya .

  5. salam kenal nih ,
    isi bahasannya bagus dan berbobot,
    minta bantuannya dong , tolong jelaskan tentang regresi linier non parametrik , metode apa saya yang dapat kita gunakan dalam hal ini . saya pernah membaca tentang metode theil, bisa dijelaskan . mohon bantuannya . ( Kalau bisa balaske email saya )
    terimaksih atas balasannya.

    1. To: Rainer
      Mohon maaf sebelumnya, Saya pernah belajar regresi non parametrik tetapi kurang mendalami. Setahu saya, regresi non parametrik digunakan untuk mengamati hubungan antar variabel yang pola scatter plotnya tidak menunjukkan pola yang jelas. Mengenai metode theil, saya belum pernah membacanya. Terima kasih tuk kunjungannya.

Leave a comment