0 like 0 dislike

Cho em hỏi các bước làm mô hình hồi qui tuyến tính đa biến trong stata? Các biến phải như thế nào mới được đưa vào mô hình?

in Stata by

1 Answer

1 like 0 dislike

Câu hỏi quá rộng nên sẽ không trả lời chi tiết hết được, bạn làm rồi đặt các câu hỏi liên quan thêm. Và sẽ có bổ sung khi cần thiết. Tóm tắt như sau (chi tiết trong chương 9, Applied Linear Statistical Models - Kutner et al)

Thu thập và chuẩn bị dữ kiện:

  • Kiểm tra chất lượng dữ kiện: xử lý các vấn đề như mất dữ kiện, nhập sai...
  • Xem xét các mối liên quan và tương tác mạnh giữa các biến số độc lập, và thực hiện các phương pháp hiệu chỉnh phù hợp, v.d. các vấn đề như đa cộng tuyến có thể giải quyết bằng cách chuẩn hóa dữ kiện,...

Chọn ra biến số tiên đoán (tiên tố)

Chọn lựa các tiên tố đã biết và tiềm tàng từ các nguồn.

  • Các nghiên cứu cùng chủ đề
  • Các biến số có mối liên quan với biến số phụ thuộc (v.d. kiểm định từng biến số và xem có mối liên quan ý nghĩa thống kê, lưu ý là không phải có mối liên quan mới được đưa vào, v.d. bạn có thể dựa trên kiến thức và quan sát trong lúc làm việc để đưa vào nghiên cứu xem yếu tố bạn nghi ngờ có ảnh hưởng không)
  • Với lượng biến số độc lập lớn, có thể chạy các bước lựa chọn biến số tự động để có gợi ý về biến số. V.d. như chọn từng bước (cùng chiều ngược chiều), từng giai đoạn, hồi quy chóp, hồi quy lasso, chọn tập tốt nhất,...(xem một số phương pháp ở mục 6.3)

  • Việc lựa chọn sẽ được hỗ trợ bởi các tiêu chí so sánh mức độ phù hợp của mô hình như AIC, Cp,... (mục 6.2 liệt kê một vài tiêu chí phổ biến)

Cải thiện và chọn lựa mô hình

Gồm nhiều quá trình liên quan nhiều đến thống kê (xem tóm tắt trong chương 3)

  • Đánh giá tương tác, phi tuyến tính
  • Đánh giá phần dư và các chẩn đoán khác (như xem có ảnh hưởng của các giá trj ngoại lai? phần dư có phân phối bình thường?)

Và thực hiện các phương pháp hiệu chỉnh tương ứng, v.d. như chuyển đổi biến số, sử dụng các hàm liên kết khác
- Chọn ra mô hình thử nghiệm

Thẩm định mô hình

Có thể thực hiện các phương pháp sau

  • Thu thập dữ kiện mới để kiểm tra mô hình và khả năng tiên đoán của mô hình
  • So kết quả với y văn
  • Tách dữ kiện làm 2, 1 dựng mô hình, 1 để kiểm tra chéo

Chọn mô hình cuối cùng.

Trong nhiều lĩnh vực, có thể có nhiều mô hình phù hợp và đi đến các kĩ thuật như lấy trung bình mô hình. Hoặc các thuật bootstrap để đánh giá tính bất định của mô hình,...

"Tất cả các mô hình là sai, nhưng một số là hữu ích"
Box & Draper (1987), Empirical model-building and response surfaces, Wiley, p. 424.

by (100 points)

Related questions

0 like 0 dislike
0 answers
asked Jul 19, 2013 in R by anonymous | 1.2k views
0 like 0 dislike
0 answers
0 like 0 dislike
1 answer
asked Jun 16, 2014 in Stata by anonymous | 1.1k views
0 like 0 dislike
1 answer
asked May 6, 2015 in Stata by anonymous | 417 views