Trong hồi quy logistic, các hệ số này theo đơn vị log số chênh (log-odds). Bạn cần viết lại dạng như sau để hiểu
log(p/1-p) = 2,675 + 0,566 X1 + 3,13 1 X2
với p là xác suất có bệnh. Vế trái được gọi là hàm logit
, log của số chênh, cụ thể là log của xác suất mắc bệnh chia cho xác suất không mắc bệnh.
Các hệ số cho biết tiên đoán về log số chênh của việc mắc bệnh sẽ tăng bao nhiêu khi tăng X1 1 đơn vị trong khi giữ nguyên X2.
Để dễ diễn giải bạn nên chọn tùy chọn lúc phân tích để chuyển đổi hệ số thành tỷ số số chênh (OR - Odds Ratio).
Tính tay thì bạn lấy mũ các hệ số, vd cho biến số X1
exp(0,566) = 1.76
. Nghĩa là một đơn vị gia tăng trong X1
, mình sẽ tiên đoán log-odds bệnh sẽ tăng 1.76 đơn vị khi giữ nguyên X2
.
Với biến X2
là tăng 1 đơn vị tương đương tăng từ 0 lên 1 hay đồng nghĩa với khi chuyển từ nữ sang nam.
Nếu có thêm biến thì cũng diễn giải ảnh hưởng của một biến khi giữ nguyên tất cả các biến còn lại trong mô hình.
Hệ số 2.675 đương nhiên là log-odds khi tất cả các biến số có giá trị là 0. Bạn cần xem xét để diễn giải, căn chỉnh biến số vì giả sử X1
là chiều cao, hệ số này sẽ là log-odds mắc bệnh của một người nữ cao 0 cm sẽ không có ý nghĩa.