Monday, June 13, 2016

Regresi Logistik Dengan MINITAB 5


Model regresi logistic

 Regresi Logistik dengan Minitab
                Seorang peneliti ingin mengetahui pengaruh 10 kelompok tingkat pendapatan pertahun terhadap status keluarga sehat. Data sebagai berikut :
Kelompok
Tingkat pendapatan (juta)
jumlah keluarga
keluarga sehat
1
6
40
8
2
8
50
12
3
10
60
18
4
13
80
28
5
15
100
45
6
20
70
36
7
25
65
39
8
30
50
33
9
35
40
30
10
40
25
20

Langkah-langkah :
Buat layout untuk dimasukkan kedalam worksheet minitab. Layoutnya menjadi :
Tingkat pendapatan (juta)
status
frekuensi
6
1
8
8
1
12
10
1
18
13
1
28
15
1
45
20
1
36
25
1
39
30
1
33
35
1
30
40
1
20
6
0
32
8
0
38
10
0
42
13
0
52
15
0
55
20
0
34
25
0
26
30
0
17
35
0
10
40
0
5
keterangan :
status = 1 à sehat
status = 0 à tidak sehat
Langkah analisis dimulai dengan memilih menu Stat – Regression – Binary Logistic Regression
Masukkan data peubah respon yaitu status ke Response, lalu masukkan data dalam kolom frekuensi ke dalam kolom frequency, pada model masukkan peubah penjelas yaitu tingkat pendapatan.

Klik Option – Link Function Logit – OK


Hasil Output :
Binary Logistic Regression: status versus Tingkat pendapatan (juta)

Link Function: Logit


Response Information

Variable  Value  Count
status    1        269  (Event)
          0        311
          Total    580

Frequency: frekuensi


Logistic Regression Table

                                                                       95%
                                                                Odds    CI
Predictor                       Coef    SE Coef      Z      P  Ratio  Lower
Constant                    -1.60234   0.204034  -7.85  0.000
Tingkat pendapatan (juta)  0.0790658  0.0101125   7.82  0.000   1.08   1.06



Predictor                  Upper
Constant
Tingkat pendapatan (juta)   1.10

Output  di atas ini sesungguhnya merupakan output untuk uji Wald (uji parsial) yang digunakan untuk menguji manakah dari perubah penjelas yang berpengaruh terhadap peubah respon. Hipotesis yang diuji adalah:
                H0 : tingkat pendapatan tidak berpengaruh terhadap status
                H1 : tingkat pendapatan berpengaruh terhadap status
                Tolak H0 jika p-value < alpha (0,05)
Kesimpulan : p-value (0.00) < alpha (0.05) maka tolak H0 yang artinya cukup bukti untuk menyatakan bahwa jumlah pendapatan berpengaruh nyata terhadap status kesehatan pada taraf nyata 5%.
                Selain uji Wald output di atas menunjukkan koefisien regresi logistik. Sehingga persamaan regresi logistiknya adalah:
               
Dengan model peluang logit adalah g(x) = -1.60234+0.0791tingkat pendapatan
Log-Likelihood = -365.301
Test that all slopes are zero: G = 70.404, DF = 1, P-Value = 0.000

Uji G merupakan uji simultan yang digunakan untuk mengetahui peran seluruh peubah penjelas dalam model. Hipotesis yang diuji adalah:
                H0 : Semua peubah penjelas tidak berpengaruh terhadap status kesehatan
                H1 : minimal ada 1 peubah penjelas berpengaruh terhadap status kesehatan
Tolak H0 jika p-value < alpha (0,05)
Kesimpulan : Pada output di atas terlihat p-value (0.000) < alpha (0.05) berarti tolak H0. Hal ini berarti bahwa minimal ada 1 peubah penjelas yang berpengaruh nyata terhadap status kesehatan pada taraf nyata 5%.

Goodness-of-Fit Tests

Method           Chi-Square  DF      P
Pearson             2.34682   8  0.968
Deviance            2.35415   8  0.968
Hosmer-Lemeshow     2.31913   6  0.888

Pengujian model logit dilakukan dengan melihat nilai statistic Goodness of fit. Metode yang sering digunakan untuk Goodness of fit data kategori adalah Pearson, Deviance dan Hosmer-Lemeshow. Hipotesis yang diuji adalah:
                H0 : model layak
                H1 : model tidak layak
Tolak H0 jika p-value < alpha (0,05)
Kesimpulan : Dari ketiga metode yang digunakan, terlihat bahwa semua p-value nya bernilai > 0,05 sehingga terima H0 jadi dapat disimpulkan bahwa model layak.

Table of Observed and Expected Frequencies:
(See Hosmer-Lemeshow Test for the Pearson Chi-Square Statistic)

                            Group
Value     1     2     3     4     5     6     7     8  Total
1
  Obs    20    18    28    45    36    39    63    20    269
  Exp  23.5  18.5  28.8  39.7  34.6  38.5  64.7  20.7
0
  Obs    70    42    52    55    34    26    27     5    311
  Exp  66.5  41.5  51.2  60.3  35.4  26.5  25.3   4.3
Total    90    60    80   100    70    65    90    25    580


Measures of Association:
(Between the Response Variable and Predicted Probabilities)

Pairs       Number  Percent  Summary Measures
Concordant   54118     64.7  Somers' D              0.40
Discordant   20943     25.0  Goodman-Kruskal Gamma  0.44
Ties          8598     10.3  Kendall's Tau-a        0.20
Total        83659    100.0

Sedangkan output bagian terakhir menjelaskan tentang keragaman peubah Y yang dapat dijelaskan oleh peubah penjelas.
                Untuk melihat sejauh mana keragaman peubah Y yang dapat dijelaskan oleh peubah-peubah penjelas, digunakan persen keragaman concordant.
Pada kasus ini terlihat nilai percent untuk concordant 64,7%. Hal ini berarti bahwa keragaman peubah respon (status kesehatan) dapat dijelaskan oleh peubah-peubah penjelas dalam model sebesar 64,7% sedangkan sisanya dijelaskan oleh factor lain di luar model.

Untuk mengetahui nilai odd ratio pada setiap kategori dapat dilakukam dengan memasukkan peubah penjelas (tingkat pendapatan) ke factors (optional) - OK




hasil output :
Logistic Regression Table

                                                                     95%
                                                              Odds    CI
Predictor                      Coef   SE Coef      Z      P  Ratio  Lower
Constant                   -1.38629  0.395282  -3.51  0.000
Tingkat pendapatan (juta)
  8                        0.233615  0.515652   0.45  0.651   1.26   0.46
 10                        0.538997  0.485400   1.11  0.267   1.71   0.66
 13                        0.767255  0.459557   1.67  0.095   2.15   0.88
 15                         1.18562  0.443454   2.67  0.008   3.27   1.37
 20                         1.44345  0.461993   3.12  0.002   4.24   1.71
 25                         1.79176  0.469415   3.82  0.000   6.00   2.39
 30                         2.04959  0.495353   4.14  0.000   7.76   2.94
 35                         2.48491  0.538127   4.62  0.000  12.00   4.18
 40                         2.77259  0.637373   4.35  0.000  16.00   4.59



Predictor                  Upper
Constant
Tingkat pendapatan (juta)
  8                         3.47
 10                         4.44
 13                         5.30
 15                         7.81
 20                        10.47
 25                        15.06
 30                        20.50
 35                        34.45
 40                        55.80


Interpretasi :
Hasil output menunjukkan bahwa peluang penduduk dengan tingkat pendapatan 8 juta/tahun memiliki status sehat lebih besar 1,26 kali dari penduduk dengan tingkat pendapatan 6 juta/tahun. dst.