November 22, 2016

Makalah regresi dan korelasi


Judul: Makalah regresi dan korelasi
Penulis: Anggara Hutagalung


REGRESI DAN KORELASI
DISUSUN
O
L
E
H
Kelompok 9 :
Dita Hasni
M. Anwar
Ernawati Sembiring

MAGISTER BIOMEDIK
FAKULTAS KEDOKTERAN
UNIVERSITAS SUMATERA UTARA
MEDAN
2011
BAB I
REGRESI
Pendahuluan
Istilah regresi mula-mula digunakan sebagai konsep dasar statistika oleh Sir Francis Gallon pada tahun 1877. Galton menggunakan istilah regresi untuk meramal sat1! variabel dengan variabel lain. Misalnya, meramal tinggi badan anak-anak yang dilahirkan oleh orang tua yang jangkung. Analisis regresi ini kemudian berkembang dan digunakan untuk meramal lebih dari saru variabel yang dinamakan multipel-regresi.Dari analisis regresi dapat diketahui bentuk hubungan antara dua variabel, sedangkan untuk mengetahui eratnya hubungan dapat diketahui dengan analisis korelasi. Eratnya hubungan ini mempunyai arti penting karena makin erat hubungan antara dua variabel maka makin yakin kita bahwa hubungan antara dua variabel tersebut merupakan hubungan sebab akibat.Bentuk hubungan
Analisis regresi dan korelasi didasarkan atas hubungan yang terjadi antara dua variabel atau lebih. Variabel yang digunakan untuk meramal disebut variabel bebas atau variabel independen, sedangkan variabel yang akan diramal disebut variabel respons atau variabel dependen.
Variabel dependen biasanya terdiri dari satu variabel, sedangkan variabel independen dapat lebih dari satu variabel. Misalnya, meramal keadaan kesehatan masyarakat suatu daerah dapat dilakukan berdasarkan angka kesakitan. Di samping itu, dapat ditambahkan beberapa variabel lain yang berkaitan dengan keadaan kesehatan, seperti keadaan lingkungan dan keadaan sosial ekonomi.
Gambaran tentang hubungan antara dua variabel dapat diketahui titik-titik kordinat yang terdapat pada diagram pencar. Hubungan tersebut dapat berupa garis lurus (linier) atau garis lengkung (kurva linier).bentuk hubungan tersebut dapat berupa garis regresi positif atau negatif. Dikatakan regresi positif bila perubahan yang terjadi pada variabel independen diikuti oleh perubahan dengan arah yang sama pada, variabel dependen sehingga garis yang dihasilkan bergerak dari kiri bawah ke kanan atas. Sebaliknya, bila perubahan pada variabel independen diikuti oleh garis dependen dengan arah yang berlawanan disebut regresi negatif sehingga garis yang dihasilkan bergerak dari kiri atas ke kanan bawah.1 Grafik regresi positif dan negative
Linear positif linear negatif


Kurva linier positifkurva linier negatif.

Hubungan yang terjadi antara dua variabel dapat pula ditinjau dari sifat hubungannya yaitu hubungan langsung atau tidak langsung. Dikatakan hubungan langsung apabila perubahan variabel independen secara langsung diikuti oleh perubahan variabel dependen. Misalnya, hubungan antara berat badan dengan tinggi badan.dikatakan hubungan tidak langsung apabila perubahan yang terjadi pada variabel independen tidak secara langsung mengakibatkan perubahan pada variabel dependen. Misalnya, hubungan antara derajat kesehatan masyarakat dengan banyaknya penduduk yang memiliki mobil.1.3 MENGGAMBAR GARIS REGRESI LINIER
Untuk menggambar garis regresi dapat dilakukan dengan berbagai mstode antara l3^ seperti berikut.Metode tangan bebas (freehand method)
Metode setengah rata-rata (semi everage method)
3 Metode kuadrat terkecil (least square method
Metode Tangan Bebas (Freehand Method)
Metode ini merupakan metode yang paling sederhana dan mudah dikerjakan karena dilakukan dengan mengikuti titik-titik koordinat dari grafik pericar berdasarkan perkiraan subjektif. Dengan metode ini diperoleh garis regresi secara kasar dan bersifat kira-kira.misalkan, seseorang menggambarkan garis regresi dari grafik pencar yang sama dan dilakukan berulang-ulang maka akan menghasilkan gambar yang berbeda (variabilitas interna) atau menggambarkan garis regresi pada satu grafik pencar yang dilakukan oleh beberapa orang akan menghasilkan garis regresi vang berbeda (variabilitas eksterna).
Dengan demikian, dari satu grafik pencar akan dihasilkan banyak garis regresi- Oleh karena itu, metode ini mempunyai ketepatan yang rendah
Metode Setengah Rata-Rata (Semi Everage Method)
Metode ini dilakukan dengan mengambil beberapa titik koordinat yang terletak di sebelah kiri kemudian dihitung rata-ratanya dan beberapa titik koordinat di sebelah kanan kemudian dihitung rata-ratanya sehingga diperoieh dua titik yang terletak di sebelah kiri dan kanan lalu kedua titik tersebut dihubungkan.Misalkan, kita ambil 3 titik di sebelah kiri, yaitu (1,3), (2,5), dan (3,1). Kita hitung rata-ratanya dan diperoleh satu titik koordinat (2,3), Sekarang, kita ambil 3 titik koordinat yang terletak di sebelah kanan yaitu (8,4), (9,6) dan (10,8) maka akan diperoleh satu titik koordinat rata-rata (9,6) kemudian titik koordinat rata-rata yang terletak di sebelah kiri dihubungkan dengan Titik koordinat rata-rata yang terletak di sebelah kanan.
Dengan cara demikian dapat digambarkan garis regresi. Cara ini dimaksudkan untuk memperbaiki cara tangan bebas.
Grafik 1.2.

Metode Kuadrat Terkecil (Least Square Method)
Metode ini merupakan cara lain unuk menggambar garis regresi menggunakan rumus garis linier dengan perhitungan matematik.
Y = a + bX
rumus umum garis linier
Y= nilai variabel dependen
X = variabel independen
a = Y intercept, yaitu perpotongan antara garis regresi dengan sumbu Y
b = Koefisien regresi merupakan arah garis regresi dan menunjukkan besarnya perubahan variabel independen yang mengakibatkan perubahan pada variabel dependen
a dan b merupakan nilai yang tetap untuk satu garis regresi.
Bila garis regresi diperoleh dari sampel dan digunakan untuk meramalkan garis regresi populasi maka rumus di atas berubah menjadi seperti berikut.Rumus
Y = a + bX
PRINSIP DASAR KUADRAT TERKECfL
Prinsip yang digunakan untuk menggambar garis regresi dengan kuadrat kecil adalah jumlah penyimpangan terkecil antara titik-titik koordinat
yang diperoleh dan titik-titik koordinat garis regresi estimasi. Juml.ih penyimpangan ini dapat dituliskan sebagai berikut.Rumus : ( Y-Y)
Penjelasan
3274716792989Misalkan, kita mempunyai 3 titik koordinat Y, (2,8), Y2 (6,1), dan Y3 (10,6). Dari titik koordinat tersebut dapat digambarkan 2 garis regresi linier seperti yang terlihat pada grafik di bawah ini :
Bila kita lihat dari jumlah penyimpangan kedua garis tersebut maka hasilnya sama walaupun sepintas tampak bahwa grafik A lebih baik dari-pada grafik B.
Grafik A
(Y- Y)
8-6 = 2
1-5 = -4
6-4 = 2
Grafik B (Y- Y)
8-2 = 6
1-5 =-4
6-8 = -2
0 Kesalahan total
0
Kesalahan total
Dari hasil di atas tampak bahwa kedua garis tersebut sama walaupun sepintas dapat kita ketahui bahwa kedua garis regresi estimasi tersebut berbeda.
Untuk menghilangkan kelemahan tersebut maka perhitungan dilakukan dengan nilai absolut hingga diperoleh hasil seperti berikut.Y - YY - Y
|8-6 |=2 l 8-2 l =6
|11-5| =4l11-5 | =4
|6-4| = 2 l 16-81 l= 2
8 12 '
Dengan cara ini dapat terlihat bahwa garis A lebih baik daripada garis B tetapi dengan cara demikian masih belum memuaskan karena tidak menekankan pada besarnya penyimpangan.
Contoh lain, misalkan kita mempunyai dua grafik pencar dengan titik-koordinat seperti yang terlihat pada grafik 1.4.

Bila kita hitung penyimpangan absolut tiap titik koordinat maka akan dihasilkan seperti berikut ini.
Grafik A, Grafik B
(Y - Y )(Y - Y )|4-4 | = 0|4-5 | = 1
|7-3 | = 4|7-4| = 3
|2-2|=0, |2-3| = 1
4 5
Dengan hasil di atas kita simpulkan bahwa garis regresi A lebih baik daripada garis regresi B, tetapi bila kita perhatikan dengan lebih saksama tampak bahwa garis regresi A hanya memperhatikan satu penyimpangan, sedangkan garis regresi B memperhatikan semua penyimpangan.
Untuk menghindarkan hal di atas maka setiap penyimpangan dipangkatkan dua sebelum dijumlahkan kemudian baru ditentukan penyimpangan terkecil sehingga mendapatkan garis regresi yang tepat. Oleh karena itu,cara ini disebut metode kuadrat terkecil. Bila contoh di atas menggunakan kuadrat terkecil maka akan diperoleh hasil sebagai berikut
(4-4 )2 = 0(4-5 )2 = 1
(7-3 )2 = 16(7-4)2 = 9
(2-2)2=0, (2-3) = 1
16 11
Dari hasil di atas disimpulkan bahwa garis regresi B lebih baik darip.nl.i garis regresi A.Ketiga cara di atas mempunyai kelemahan karena tidak dapat dilakul |fl pada grafik pencar dengan titik koordinat yang banyak. Untuk menentul m garis regresi dengan titik koordinat yang banyak dilakukan denj'.m menghitung besarnya a dan b menggunakan rumus berikut.Rumus : b = XY-nX YX2-nX2 atau
b = XY-X. YnX2-X2Dimana
b : koefisien regresi
X = nilai variabel independen
X= rata-rata nilai independen
Y = nilai variabel dependen
Y = rata-rata nilai dependen
n = jumlah pengamatan
rumusa = Y - b X atau Y/n - b (X/n)
a = Y- intercept
b = koefisien regresi
Y = nilai variabel dependen
Y = nilai rata-rata dependen
X = nilai variabel independen
X = nilai rata-rata independen
n = jumlah pengamatan
Dokter Puskesmas ingin mengetahui hubungan antara jumlah pengunjung dengan obat tetrasiklin yang digunakan. Untuk ini diambil sampel 6 hari kerja dengan hasil sebagai berikut.Hari Jumlah kunjungan
X Jumlah tetrasiklin Y XY X2
1 60 150 9000 3600
2 50 140 7000 2500
3 70 205 14350 4900
4 40 130 6200 1600
5 60 165 9900 3600
6 70 210 14700 4900
Total 350 1000 60150 211000
b = [(6x 60150) - (350 x 1000)] / (6 x 21100) - (350 x 350)
= 2,66
a =1000/6 - 2,66 x (350/6) = 11,5
Dari hasil perhitungan di atas maka rumus garis regresi berubah menjadi
Y=11,5 + 2,66 XBila x = 1Y = 14,2
Bila X= 2Y = 16,8Dan seterusnya hingga setiap harga X akan diperoleh harga Y.
Meneliti Hasil Perhitungan
Hasil perhitungan di atas dapat diteliti kebenarannya dengan menjumlah semua selisih antaraY dan Y . Bila jumlah Y - Y sama dengan 0, berarti perhitungan kita tidak salah.
Contoh Perhitungan di atas :
150 - (11,5 + 2,66 x 60) = 150 - 171,1 = - 21,1 J
140 - (11,5 + 2,66 x 50) = 140 -144,5 = - 4,5
205 - (11,5 + 2,66 x 70) = 205 -197,7 = 7,3
130 - (11,5 + 2,66 x 40) = 130 - 117,9 = 12,1
165 - (11,5 + 2,66 x 60) = 165 -171,1 = - 6,1
210 - (11,5 + 2,66 x 70) = 210 - 197,7 = 12,3+
0
ESTIMASI KESALAHAN BAKU
Setelah kita menentukan bentuk garis regresi maka tindakan selanjulnva adalah menentukan ketepatan garis regresi tersebut.Dengan diagram pencar dapat diketahui secara kasar ketepatan garis regresi dengan memperhatikan luas penyimpangan terhadap garis regresi yang berupa titik-titik koordinat. Bila penyebaran titik-titik koordinat tidak luas berarti semakin tepat garis regresi yang kita buat dan sebaliknya.Perhitungan estimasi kesalahan baku dapat diperkirakan dengan menggunakan rumus berikut :Rumus : Se = Y-Y2n-2 atau Se = Y2- a Y-bXYn-2Y = nilai variabel dependen
X = nilai variabel independen
b = koefisien regresi
Y = nilai estimasi terhadap setiap nilai Y
a = Y- intercept
n = jumlah pasangan pengamatan
sebagai penyebut digunakan n -2 karena di sini kita kehilangan 2 derajat kebebasan, yaitu a dan b yang digunakan untuk menaksir A dan B populasi,
contoh tentang hubungan antara pengunjung Puskesmas dengan jumlah tctrasiklin dapat dihitung estimasi kesalahan baku seperti berikut.
X Y Y-Y* (Y - Y )2 Y2
60 150 -21,1 445,21 22500
50 140 -4,5 20,25 19600
70 205 73,0 53,29 42025
40 130 12,1 146,41 16900
60 165 6,1 37,21 27225
70 210 12,3 151,29 44100
853,66 172350
Se = 853,66/4 = 14,6
INTERPRETASI KESALAHAN BAKU
seperti deviasi standar, kesalahan baku juga menunjukkan besarnya penyebaran titik-titik koordinat terhadap garis regresi.
Bila penyebaran meluas berarti kesalahan baku juga besar dan sebaliknya. pmyebaran titik-titik koordinat sempit berarti kesalahan baku kecil.
bila kesalahan baku sama dengan nol berarti tidak ada penyebaran atau semua titik koordinat terletak pada garis regresi yang disebut garis regresi sempurna.
Bila diasumsikan bahwa titik-titik koordinat hasil pengamatan berasal dari populasi berdistribusi normal maka garis regresi sampel dapat digunakan untuk mengadakan estimasi garis regresi populasi dengan interval estimasi berdasarkan distribusi normal standar, yaitu penyimpangan kesalahan baku sama dengan 68% dari seluruh titik-titik koordinat akan terletak pada daerah tersebut. Demikian pula dengan penyimpangan 2 SE sama dengan 95,5% dan penyimpangan 3 SE sama dengan 99%.
Grafik.
642048323187
Y = a + bx + 3Se
Y = a + bx + 2Se
Y = a + bx+ 1Se
Y = a + bx (garis regresi)
Y = a + bx- 1Se
Y = a + bx - 2Se
Y = a + bx - 3Se
99,7%

Untuk interval estimasi dapat digunakan rumus limit konfidensi.
Rumus
Limit atas: Y + z atau t x Se
Limit bawah: Y - z atau t x Se
Z digunakan pada sampel yang cukup besar, sedangkan t digunakan pada sampel kecil, deviasi standar tidak diketahui dan dk = n - 2. Untuk menghitung estimasi kesalahan baku yang lebih tepat daripada Se digunakan rumus Sp, seperti berikut.
Rumus : Sp = Se 1+1n+ X-X02X2 -nX2X0 = nilai spesifik untuk X yang akan diramalkan terhadap nilai Y
Nilai Sp bergantung pada besarnya sampel dari nilai X0, yaitu nilai yang akan digunakan untuk menaksir garis regresi. Bila nilai X0 mendekati nilai X dan sampel (n) cukup besar maka nilai Sp akan mendekati Se.
Misalnya, pada contoh kunjungan dan tetrasiklin dengan estimasi garis regresi dapat diestimasikan variasi jumlah tetrasiklin yang digunakan.Y =11,5 +2,66 X Misalnya, X0 = 50 dan Sp = 15,69
Maka Y = 11,5 + 2,66 x 50 = 144,5
Derajat kepercayaan yang diinginkan adalah 95%, Sp = 15,69Karena besarnya sampel adalah 6 dan simpangan baku populasi tidak diketahui maka distribusi yang digunakan adalah distribusi "t".
a = 0,05; dk = 4
t = 2,776
Limit atas:Y + 2,776 Sp = 144,5 + 2,776 x 15,69 = 188
Limit bawah: Y - 2,776 Sp = 144,5 - 2,776 x 15,69 = 101
Kesirnpulannya, kita 95% percaya bahwa jumlah penggunaan tetrasiklin terletak antara 101 dan 188.BAB II
KORELASI
Analisis korelasi dapat digunakan untuk mengadakan uraian tentang derajat hubungan linier antara satu variabel dengan variabel lain.
Korelasi memang sering digunakan bersama dengan regresi untuk menjelaskan variasi variabel dependen Y, tetapi korelasi sendiri dapat digunakan untuk mengukur derajat hubungan antara dua variabel melalui koefisien korelasidan koefisien determinasi
1. Koefisien korelasi Pearson
Korelasi pearson-product moment digunakan untuk menguji hubungan antara dua variabel dengan skala data interval atau rasio dengan interval atau rasio. Formulanya adalah :r = NX.Y - X. Y{NX2 –(X)2 } {NY2 –(Y)2 } dimana: X sebagai data-data dari variabel independent /variabel bebas
Y sebagai data-data dari variabel dependen/variabel terikat.Untuk dapat memberikan penafsiran terhadap koefisien korelasi yang ditemukan besar atau kecil, maka dapat berpedoman pada ketentuan yang tertentu pada tabel berikut :
Interval koefisien Tingkat hubungan
0,000=0.199 Sangat rendah
0,200- 0,399 Rendah
0,400-0,599 Sedang
0,600-0,799 Kuat
0,800-1,000 Sangat kuat
Sebagai contoh adalah: sebuah penelitian untuk mengetahui apakah ada hubungan antara Hb'ibu hamil dengan berat badan bayi lahirnya. Variabel independent adalah Hb ibu hamil dengan skala data interval dan variabel dependen adalah berat badan bayi lahir dengan skala data interval. Peneliti mengumpulkan data sebanyak 20 responden, melalui catatan medik di salah satu rumah sakit di Jogjakarta. Hasil pengumpulan data kemudian di masukkan pada tabel berikut ini
No Hb BBL No Hb BBL
1 11.2 2500 11 10.7 2700
2 11.3 2450 12 10.1 2560
3 11.5 2500 13 10.3 2600
4 10.6 2450 14 11.9 2700
5 10.7 2470 15 12.1 3200
6 10.5 2490 16 12.2 3400
7 11.6 2510 17 11.9 3000
8 11.7 2570 18 12.5 3200
9 11.3 2600 19 12.3 3400
10 11.4 3000 20 12.4 3400
Dari data tersebut maka kita akan membuat tabel Bantu dalam mengerjakan formula pearson product-moment, dimana X dan Y telah diketahui sehingga dapat dicari SX, SY, SX.Y, SX2, SY2, (SX)2, (SY)2, untuk memudahkan mencarinya maka perlu dibuat tabel Bantu seperti berikut:
No X Y X2. Y* X.Y
1 11.2 2500 125.44 ' 6250000 28000
2 11.3 2450 127.69 6002500 27685
3 11.5 2500 132.25 ' 6250000. 28750
4 10.6 2450 112.36 .6002500 25970
5 10.7 2470 114.49 • 6100900 26429
6 10.5 2490 110.25 6200100 26145
7 11.6 2510 134.56 6300100 29116
8 11.7 2570 136.89 6604900 30069
9 11.3 2600 127.69 ' 6760000 29380
10 11.4 3000 129.96 9000000 34200
11 10.7 2700 114.49 7290000 28890
12 10.1 2560 102.01 6553600 25856
13 10.3 2600 106.09 6760000 26780
14 11.9 2700 141.61 7290000 32130
15 12.1 3200 146.41 10240000 38720
16 12.2 3400 148.84 11560000 41480
17 11.9 3000 141. 6i 9000000 35700
18 12.5 3200 156.25 10240000 40000
19 12.3 3400 151.29 11560000 41820
20 12.4 3400 ' 153.76 11560000 42160
X= 228,2 Y= 55700 X2=
2613.94 Y2=
157524600 X.Y= 639280
(X)2= 52075.24 (Y)2= 3102490000 :Dari tabel tersebut maka kita masukkan ke dalam rumus koefisien korelasi,
r = NX.Y - X. Y{NX2 –(X)2 } {NY2 –(Y)2 } =20 ×63980- (228,2 ×55700)20×2613,94-52075,24} {20×157524600-3102490000 = 12785600-12710740203,56{48002000} = 0,753
Interpretasi nya : bahwa terdapat hubungan yang kuat antara Hb ibu hamil dengan berat badan lahir bayi nya.
Koefisien Determinasi
Dari koefisien korelasi Pearson (r) dapat dihitung lebih lanjut kuadrat r, disebut koefisien determinasi. Koefisien r kuadrat ( r2) dapat diartikan sebagai besar nya proporsi variasi Y yang dapat dijelaskan oleh variabel X. Hal ini didasarkan pemahaman bahwa variasi Y atau perubahan dari nilai Y, seyogyanya dijelaskan oleh variabel X yang kita duga sebagai faktor prediktor. Apabila variasi Y dapat dijelaskan 100% oleh variabel X, berarti X memang memegang peran dalam perubahan nilai Y. Atau dapat dikatakan penentu nilai Y. Dapat diperhatikan bahwa bila besar r= 1, maka r2 = 100%. Ini berarti bila terjadi perubahan nilai X, maka nilai Y pasti akan berubah.
Pada data Hb ibu dengan BBL diatas , maka nilai koefisien korelasi nya adalah 0,567
( 56,7%) ,hal ini berarti variabel BBL dapat dijelaskan oleh variabel Hb ibu sebesar 56,7%.
D. Uji Hipotesis Koefisien Korelasi
Pengujian signifikansi koefisien korelasi selain dapat menggunakan tabel r juga dapat dihitung dengan uji t. Rumus uji t resebut :
t = r (n-2)1-r2tabel . Koefisien Korelasi pada Derajat Kemaknaan 5% dan 1%
dk 5% 1 % dk .5% 1%
1 0,887 1,000 24 0,388 0,496
2 0,950 0,999 25 0,381 0,487
3 0,878 0,959 26 0,374 0,478
4 0,811 0,917 27 0,367 0,470
5 0,754 0,874 28 0,361 0,463
6 0,707 0,834 29 0,355 0,456
7 0,666 0,798 30 0,349 0,449
8 0,632 0,765 35 0,325 0,418
9 0,602 0,735 40 0,304 0,393
10 0,576 0./08 45 0,288 0,372
11 0,553 0,684 50 0,273 0,354
12 0,532 0,661 60 0,250 0,325
13 0,514 0,641 70 0,323 0,302
14 0,497 0,623 80 0,217 0,283
15 0,482 0,606 90 0,205 0,267
16 0,468 0,590 100 0,195 0,254
17 0,456 0.575 125 0,174 0,228
18 0,444 0,561 150 0,159 0,208
19 0.433 0,549 200 0,138 0,148
20 0,423 0,537 300 0,113 0,148
21 0,413 0,526 400 0,098 0,128
22 0,404 0,515 500 0,088 0,115
23 0,396 0,505 1000 0,062 0,081


Download Makalah regresi dan korelasi.docx

Download Now



Terimakasih telah membaca Makalah regresi dan korelasi. Gunakan kotak pencarian untuk mencari artikel yang ingin anda cari.
Semoga bermanfaat


Tinggalkan Komentar
EmoticonEmoticon