Pada posting kali ini, penulis mencoba menyajikan sebuah tulisan ringan mengenai bagaimana cara pintas mempelajari pemodelan statistik yang berbasis model (model based). Yang dimaksud model based di sini adalah model statistik yang telah ditentukan lebih dahulu model matematisnya sebelum karakteristik data diketahui. Sebagai contoh dalam model regresi linear peneliti mengasumsikan hubungan antara variabel bebas dan variabel terikat berbentuk lurus (linear).
Salah satu kelemahan model based adalah adanya berbagai asumsi yang menyertai model itu. Dalam model regresi misalnya meangasumsikan error harus berdistribusi normal dengan rata-rata nol dan varians tertentu. Karena error model bisa terdeteksi setelah model terbentuk maka variabel terikatlah yang disyaratkan berdistribusi normal dengan rata-rata dan varians tertentu. Permasalahannya data seperti apa yang berdistribusi normal dengan rata-rata dan varians tertentu itu?
Melalui simulasi data, kita dapat memahami pemodelan statistik yang model based tadi. Caranya?

Misalkan kita ingin mempelajari bagaimana sih model regresi linear itu? Pertama kita modelkan dulu secara matematis, misalkan model regresi linear kita nyatakan sebagai

reglin

 

di mana y diasumsikan berdistribusi normal dengan rata-rata  mu dan varians  var tertentu. Error diasumsikan berdistribusi normal dengan rata-rata nol dan varians var.

Kita bisa meminta bantuan pada minitab (Penulis menggunakan Minitab 14) untuk simulasi di atas. Sebelumnya, aktifkan terlebih dahulu Command Session dengan mengklik

Editor

         Enable Command.

Misalkan model regresi yang akan kita bangkitan adalah

reglincontoh

 

dengan

ye

 

 

Pertama, bangkitkan 100 data berdistribusi normal dengan rata-rata 5 dan var 2, simpan di kolom C1 dengan mengetik

MTB > Random 100 C1;
SUBC> Normal 5 2.

Beri keterangan ‘y’ pada kolom C1.

Kedua, bangkitkan 100 data berdistribusi normal dengan rata-rata nol dan var 3, simpan di kolom C2 dengan mengetik

MTB > Random 100 C2;
SUBC> Normal 0 3.

Beri keterangan e atau error pada kolom C2.

Selanjutnya, bangkitkan 100 data konstan, misalnya 5 pada kolom C3 dengan mengetikkan

MTB > Set C3
DATA> 1( 5 : 5 / 1 )100
DATA> End.

Beri keterangan ‘c’ pada kolom 3 tersebut.

Langkah terakhir membangkitkan variabel bebas x. Dalam hal ini, x bersifat fix dan tidak mempunyai distribusi tertentu. Ketikkan

MTB > LET C4 =0.5*(C1-C2-C3)
 

 

Beri keterangan x pada kolom 4.

Buat scatter plot antara x dan y. Hasilnya akan tampak sebagai berikut:

scatterplot-of-y-vs-x

Tampak scatter plot antara y dan x menunjukkan pola linear dengan slop positif. Cobalah dengan langkah yang sama dengan menggantikan distribusi error yang berbeda, dan perhatikan pola yang terbentuk. Di sini, penulis mencoba distribusi error normal(0,1) dan normal (0,1.5). Scatter plot yang dihasilkan tampak sebagai berikut:

scat-gif

Kesimpulan yang bisa dipetil adalah, semakin kecil varians dari error, maka pola linear akan semakin nyata terlihat. Pengaruh error akan mempengaruhi pola linear yang terbentuk.