Friday, May 17, 2013

Non Parametrik Test dengan SPSS


APLIKASI STATISTIK NON PARAMETRIK MENGGUNAKAN SPSS
*      Uji non-parametrik dilakukan bila persyaratan untuk metode parametrik tidak terpenuhi, yaitu bila sampel tidak berasal dari populasi yang berdistribusi normal, jumlah sampel terlalu sedikit (misal hanya 5 atau 6) dan jenis datanya kategorik (nominal atau ordinal).
*      Keuntungan penggunaan non-parametrik adalah bisa digunakan diberbagai bentuk distribusi data & jenis data (bahkan nominal & ordinal) sehingga penggunaannya lebih luas, cenderung lebih sederhana, dan mudah dimengerti.
*      Kekurangannya adalah tidak adanya sistematika yang jelas dan hasilnya bisa meragukan karena kesederhanaan metodenya.
Seperti halnya uji parametrik, uji non-parametrik juga bisa dilakukan di berbagai situasi, yaitu :
1.     Uji Data 2 sampel
a.       Dua Sampel berhubungan
→ Uji Bertanda Peringkat Wilcoxon
Uji ini digunakan untuk kasus dua populasi berpasangan. Pengukuran berat badan setelah diet tidak saling bebas dengan berat badan sebelum diet.
Data :
Before
60
65
67
75
74
80
89
74
68
70
After
59
60
68
76
68
72
86
70
70
65

Data dimasukkan ke dalam spss dengan 2 kolom (sebelum dan sesudah)
Prosedur SPSS : Klik Analyze > Nonparametric Tests > 2 related samples pada Data View.


Lalu klik 2 variable yang ingin dimasukkan >
Pada test type kita pilih wilcoxon

Selanjutnya klik OK.





H0 : M1=M2 (berat badan sebelum dan sesudah diet tidak berbeda)
H1 : M1≠M2 (berat badan sebelum dan sesudah diet berbeda)
Penjelasan Output :
Nilai asymp sig (2 tailed) menunjukkan p-value. Karena p-value yang diperoleh sebesar 0.046< α=5%, maka  tolak H0 yang berarti bahwa berat badan sebelum dan sesudah diet berbeda pada taraf nyata 5%.

b.       Dua Sampel Tidak Berhubungan
→ Uji Mann-Whitney
Uji ini digunakan untuk dua populasi yang saling bebas satu sama lain.
Data :
Sales
Kelompok
      20
tanpa training
      23
tanpa training
      25
tanpa training
      14
tanpa training
      16
tanpa training
      24
tanpa training
      10
tanpa training
      23
tanpa training
      17
tanpa training
      29
tanpa training
      20
tanpa training
      16
tanpa training
      22
tanpa training
      18
tanpa training
      30
Training
      32
Training
      35
Training
      25
Training
      27
Training
      21
Training
      36
Training
      24
Training
      29
Training
Masukkan data ke dalam spss dengan mengubah tanpa training =1 dan training=2. Setelah itu,
Prosedur SPSS : Klik Analyze > Nonparametric Tests > 2 independent samples pada Data View. 



Lalu klik 2 variable yang ingin dimasukkan. Masukkan variable sales ke Test Variable List dan kelompok sebagai Grouping variable. Pada test type kita pilih Mann-Whitney.
Lalu klik Define Groups dan tampil kotak di bawah ini :

Karena ada 2 group (training dan tanpa training). Selanjutnya klik OK.


H0 : Kedua populasi identik ( Data penjualan kedua kelompok salesman tidak berbeda)
H1 : Kedua populasi tidak identik ( Data penjualan kedua kelompok salesman berbeda)
Penjelasan Output :
Nilai asymp sig (2 tailed) menunjukkan p-value. Karena p-value yang diperoleh sebesar 0.000< α=5%, maka  tolak H0 yang berarti bahwa data penjualan kedua kelompok salesman berbeda pada taraf nyata 5%.









Thursday, May 2, 2013

Regresi Logistik Dengan MINITAB 5


Model regresi logistic

 Regresi Logistik dengan Minitab
                Seorang peneliti ingin mengetahui pengaruh 10 kelompok tingkat pendapatan pertahun terhadap status keluarga sehat. Data sebagai berikut :
Kelompok
Tingkat pendapatan (juta)
jumlah keluarga
keluarga sehat
1
6
40
8
2
8
50
12
3
10
60
18
4
13
80
28
5
15
100
45
6
20
70
36
7
25
65
39
8
30
50
33
9
35
40
30
10
40
25
20

Langkah-langkah :
Buat layout untuk dimasukkan kedalam worksheet minitab. Layoutnya menjadi :
Tingkat pendapatan (juta)
status
frekuensi
6
1
8
8
1
12
10
1
18
13
1
28
15
1
45
20
1
36
25
1
39
30
1
33
35
1
30
40
1
20
6
0
32
8
0
38
10
0
42
13
0
52
15
0
55
20
0
34
25
0
26
30
0
17
35
0
10
40
0
5
keterangan :
status = 1 à sehat
status = 0 à tidak sehat
Langkah analisis dimulai dengan memilih menu Stat – Regression – Binary Logistic Regression
Masukkan data peubah respon yaitu status ke Response, lalu masukkan data dalam kolom frekuensi ke dalam kolom frequency, pada model masukkan peubah penjelas yaitu tingkat pendapatan.

Klik Option – Link Function Logit – OK


Hasil Output :
Binary Logistic Regression: status versus Tingkat pendapatan (juta)

Link Function: Logit


Response Information

Variable  Value  Count
status    1        269  (Event)
          0        311
          Total    580

Frequency: frekuensi


Logistic Regression Table

                                                                       95%
                                                                Odds    CI
Predictor                       Coef    SE Coef      Z      P  Ratio  Lower
Constant                    -1.60234   0.204034  -7.85  0.000
Tingkat pendapatan (juta)  0.0790658  0.0101125   7.82  0.000   1.08   1.06



Predictor                  Upper
Constant
Tingkat pendapatan (juta)   1.10

Output  di atas ini sesungguhnya merupakan output untuk uji Wald (uji parsial) yang digunakan untuk menguji manakah dari perubah penjelas yang berpengaruh terhadap peubah respon. Hipotesis yang diuji adalah:
                H0 : tingkat pendapatan tidak berpengaruh terhadap status
                H1 : tingkat pendapatan berpengaruh terhadap status
                Tolak H0 jika p-value < alpha (0,05)
Kesimpulan : p-value (0.00) < alpha (0.05) maka tolak H0 yang artinya cukup bukti untuk menyatakan bahwa jumlah pendapatan berpengaruh nyata terhadap status kesehatan pada taraf nyata 5%.
                Selain uji Wald output di atas menunjukkan koefisien regresi logistik. Sehingga persamaan regresi logistiknya adalah:
               
Dengan model peluang logit adalah g(x) = -1.60234+0.0791tingkat pendapatan
Log-Likelihood = -365.301
Test that all slopes are zero: G = 70.404, DF = 1, P-Value = 0.000

Uji G merupakan uji simultan yang digunakan untuk mengetahui peran seluruh peubah penjelas dalam model. Hipotesis yang diuji adalah:
                H0 : Semua peubah penjelas tidak berpengaruh terhadap status kesehatan
                H1 : minimal ada 1 peubah penjelas berpengaruh terhadap status kesehatan
Tolak H0 jika p-value < alpha (0,05)
Kesimpulan : Pada output di atas terlihat p-value (0.000) < alpha (0.05) berarti tolak H0. Hal ini berarti bahwa minimal ada 1 peubah penjelas yang berpengaruh nyata terhadap status kesehatan pada taraf nyata 5%.

Goodness-of-Fit Tests

Method           Chi-Square  DF      P
Pearson             2.34682   8  0.968
Deviance            2.35415   8  0.968
Hosmer-Lemeshow     2.31913   6  0.888

Pengujian model logit dilakukan dengan melihat nilai statistic Goodness of fit. Metode yang sering digunakan untuk Goodness of fit data kategori adalah Pearson, Deviance dan Hosmer-Lemeshow. Hipotesis yang diuji adalah:
                H0 : model layak
                H1 : model tidak layak
Tolak H0 jika p-value < alpha (0,05)
Kesimpulan : Dari ketiga metode yang digunakan, terlihat bahwa semua p-value nya bernilai > 0,05 sehingga terima H0 jadi dapat disimpulkan bahwa model layak.

Table of Observed and Expected Frequencies:
(See Hosmer-Lemeshow Test for the Pearson Chi-Square Statistic)

                            Group
Value     1     2     3     4     5     6     7     8  Total
1
  Obs    20    18    28    45    36    39    63    20    269
  Exp  23.5  18.5  28.8  39.7  34.6  38.5  64.7  20.7
0
  Obs    70    42    52    55    34    26    27     5    311
  Exp  66.5  41.5  51.2  60.3  35.4  26.5  25.3   4.3
Total    90    60    80   100    70    65    90    25    580


Measures of Association:
(Between the Response Variable and Predicted Probabilities)

Pairs       Number  Percent  Summary Measures
Concordant   54118     64.7  Somers' D              0.40
Discordant   20943     25.0  Goodman-Kruskal Gamma  0.44
Ties          8598     10.3  Kendall's Tau-a        0.20
Total        83659    100.0

Sedangkan output bagian terakhir menjelaskan tentang keragaman peubah Y yang dapat dijelaskan oleh peubah penjelas.
                Untuk melihat sejauh mana keragaman peubah Y yang dapat dijelaskan oleh peubah-peubah penjelas, digunakan persen keragaman concordant.
Pada kasus ini terlihat nilai percent untuk concordant 64,7%. Hal ini berarti bahwa keragaman peubah respon (status kesehatan) dapat dijelaskan oleh peubah-peubah penjelas dalam model sebesar 64,7% sedangkan sisanya dijelaskan oleh factor lain di luar model.

Untuk mengetahui nilai odd ratio pada setiap kategori dapat dilakukam dengan memasukkan peubah penjelas (tingkat pendapatan) ke factors (optional) - OK




hasil output :
Logistic Regression Table

                                                                     95%
                                                              Odds    CI
Predictor                      Coef   SE Coef      Z      P  Ratio  Lower
Constant                   -1.38629  0.395282  -3.51  0.000
Tingkat pendapatan (juta)
  8                        0.233615  0.515652   0.45  0.651   1.26   0.46
 10                        0.538997  0.485400   1.11  0.267   1.71   0.66
 13                        0.767255  0.459557   1.67  0.095   2.15   0.88
 15                         1.18562  0.443454   2.67  0.008   3.27   1.37
 20                         1.44345  0.461993   3.12  0.002   4.24   1.71
 25                         1.79176  0.469415   3.82  0.000   6.00   2.39
 30                         2.04959  0.495353   4.14  0.000   7.76   2.94
 35                         2.48491  0.538127   4.62  0.000  12.00   4.18
 40                         2.77259  0.637373   4.35  0.000  16.00   4.59



Predictor                  Upper
Constant
Tingkat pendapatan (juta)
  8                         3.47
 10                         4.44
 13                         5.30
 15                         7.81
 20                        10.47
 25                        15.06
 30                        20.50
 35                        34.45
 40                        55.80


Interpretasi :
Hasil output menunjukkan bahwa peluang penduduk dengan tingkat pendapatan 8 juta/tahun memiliki status sehat lebih besar 1,26 kali dari penduduk dengan tingkat pendapatan 6 juta/tahun. dst.