Thứ Bảy, ngày 29 tháng 10 năm 2011

Các mô hình kinh tế lượng phổ biến, p2



HỒI QUY NHỊ PHÂN BINARY LOGISTIC
  • Mô hình này cũng chính là mô hình phân tích Hồi quy tuyến tính nhưng có biến phụ thuộc là biến định tính và nhị phân (chỉ mang 2 tính chất Có/Không) và biến độc lập (nguyên nhân) có thể là biến định tính hoặc định lượng. Mô hình dùng để xác định phân loại bằng cách ước lượng xác suất xảy ra đối với biến phụ thuộc dựa vào biến độc lập đã cho sẵn, thay vì ước lượng số như Hồi quy tuyến tính thông thường. Đồ thị có trục Y là xác suất (biến phụ thuộc), trục X là biến độc lập[1]. Mô hình dùng để mô tả sự phân phối dữ liệu nên người ta không dùng mô hình Hồi quy tuyến tính thông thường do giá trị biến phụ thuộc có thể mang số âm hoặc số rất lớn.
  • Mô hình:


  • Hệ số Odds: là tỉ lệ xác suất xảy ra sự kiện (thành công) với xác suất không xảy ra sự kiện (thất bại). Hay nói cách khác là khả năng xảy ra sự kiện gấp bao nhiêu lần so với không xảy ra (xem thêm ví dụ[2]).
Hệ số Odds : 

  • Phương pháp thực hiện: Menu – Analyze – Regression – Binary Logistic. Chọn biến độc lập (Covariates) và biến phụ thuộc (Dependent) đưa vào mô hình. Chú ý, biến phụ thuộc bắt buộc phải là biến định tính thì mô hình mới tiếp tục tiến hành.

  • Ý nghĩa các bảng biểu:

Variables in the Equation

B
S.E.
Wald
df
Sig.
Exp(B)
Step 1a
CODE
.001
.006
.035
1
.851
1.001
DTOC
1.519
.679
5.001
1
.025
4.569
SEXH
-.750
.577
1.692
1
.193
.472
HOCVAN
-.324
.104
9.701
1
.002
.723
TRINHDO
.231
2.048
.013
1
.910
1.260
PHUTHUOC
.377
.292
1.668
1
.197
1.457
NGHENGHIEP
-2.115
.841
6.318
1
.012
.121
KHOANCACH
.266
.222
1.435
1
.231
1.304
DUONGOTO
-1.398
.549
6.484
1
.011
.247
KNONG
.200
.820
.060
1
.807
1.222
LAMXA
-1.627
.909
3.202
1
.074
.197
DTDAT
.004
.034
.016
1
.900
1.004
TIENVAY


5.670
27
1.000

Constant
-22.869
16222.942
.000
1
.999
.000
a. Variable(s) entered on step 1: CODE, DTOC, SEXH, HOCVAN, TRINHDO, PHUTHUOC, NGHENGHIEP, KHOANCACH, DUONGOTO, KNONG, LAMXA, DTDAT, TIENVAY.

à bảng Variables in the Equation cho biết các biến được lựa chọn qua kiểm định Wald. Những biến có sig > 0.05 đều bị loại. Ở Ví dụ này có thêm biến Lamxa có sig=0.074 tuy lớn hơn 0.05 nhưng nhỏ hơn 0.1 nên có thể chấp nhận biến nếu lấy độ tin cậy 10% thay vì 5%.

Omnibus Tests of Model Coefficients

Chi-square
df
Sig.
Step 1
Step
102.946
39
.000
Block
102.946
39
.000
Model
102.946
39
.000


à bảng Kiểm định Omnibus cho biết sự tương quan giữa biến phụ thuộc và các biến độc lập nếu sig nhỏ hơn 0.05, đạt ý nghĩa thống kê.

Model Summary
Step
-2 Log likelihood
Cox & Snell R Square
Nagelkerke R Square
1
116.630a
.432
.616
a. Estimation terminated at iteration number 20 because maximum iterations has been reached. Final solution cannot be found.

à Hệ số likelihood này được Agresti (1996) cho là đáng tin cậy hơn hệ số Wald[3]. Hệ số này dùng để đo sai sót và ngày càng giảm dần trong quá trình lập lại để chọn mô hình. Vì vậy mô hình được chọn là mô hình có hệ số này càng nhỏ càng tốt[4].

Classification Tablea

Observed
Predicted

DANHO
Percentage Correct

0
1
Step 1
DANHO
0 (không nghèo)
113
16
87.6
1 (nghèo)
21
32
60.4
Overall Percentage


79.7
a. The cut value is .500

à mức độ chính xác của dự báo thể hiện qua bảng Classification Table như sau: có 129 hộ được dự báo là không nghèo thì có 113 hộ đúng, tỉ lệ nhận xét đúng là 87.6%. Đối với 53 hộ được dự đoán là nghèo thì kết quả đúng là 32 hộ, tỉ lệ 60.4%. Tổng quát thì tỉ lệ đúng của toàn bộ mô hình là 79.7%.

à mô hình Logistic được viết như sau:
Ln(Pi/(1-Pi)) = 1.519*Dtoc - 0.324*Hocvan - 2.115*Nghenghiep - 1.398*Duongoto + e
Với Pi: xác suất hộ nghèo

Nghĩa là Trình độ học vấn càng cao, Không phải làm nghề nông và nhà gần đường ô tô thì thường là những hộ không nghèo. Mô hình cũng cho thấy yếu tố Nghề nghiệp ảnh hưởng mạnh nhất đến thu nhập của những gia đình nghèo, nếu có đi làm thì dễ thoát nghèo hơn. Ngoài ra, người dân tộc Kinh thì tỉ lệ người nghèo sẽ nhiều hơn người dân tộc khác là do dân số dân tộc Kinh chiếm chủ yếu trong dân số quốc gia. Tuy vậy, mô hình chỉ đúng với tỉ lệ 80%.

VD: Nếu một người là người Kinh, có trình độ học vấn lớp 12, làm công nhân (không phải nghề nông), có đường ôtô đi đến nhà thì:
Ln (Odds) = 1.519*1 - 0.324*12 - 2.115*1- 1.398*1= -5.882
Hệ số Odds = 0.0028 hay Xác suất để là hộ nghèo: P = 1/[1+e^-(-5.882)] = 0.0028
à Vậy khả năng người đó là người nghèo chỉ xác suất rất thấp 0.28%.



[4] Người viết hiện chưa tìm được tài liệu cho thấy rõ số này bao nhiêu là nhỏ, chỉ biết khi chọn giữa các mô hình thì chọn mô hình nào hệ số likelihood nhỏ nhất. 




--- CÒN TIẾP ---

Không có nhận xét nào:

Đăng nhận xét