TAILIEUCHUNG - Bài giảng Phân tích số liệu - Bài 8: Phân tích hồi quy bội
Trong Bài giảng Phân tích số liệu Bài 8: Phân tích hồi quy bội nhằm trình bày về hồi quy tuyến tính bội, phân tích hồi quy bội, mô hình hồi quy bội. Mô hình hồi quy bội gồm 1 biến phụ thuộc Y (biến định lượng) và nhiều biến độc lập X1, , Xp. Phân tích hồi quy của Y theo Xi là tìm dạng phụ thuộc hàm giữa chúng. | BÀI 8 PHÂN TÍCH HỒI QUY BỘI MÔ HÌNH HỒI QUY BỘI Mô hình hồi quy bội gồm 1 biến phụ thuộc Y (biến định lượng) và nhiều biến độc lập X1, , Xp. Phân tích hồi quy của Y theo Xi là tìm dạng phụ thuộc hàm giữa chúng. HỒI QUY TUYẾN TÍNH BỘI Hồi quy tuyến tính của Y theo X1, , Xp có dạng: trong đó βk: các hệ số hồi quy, i: sai số ngẫu nhiên. Điều kiện của mô hình - i có phân phối chuẩn với E( i) = 0 và D( i) = 2 (phương sai thuần nhất). - Các sai số không tự tương quan nhau cov( i , j) = 0 - Các biến độc lập Xk không tương quan tuyến tính với nhau (không đa cộng tuyến tính). SPSS: Analyze\Regression\Linear ĐA CỘNG TUYẾN TÍNH Đa cộng tuyến tính là hiện tượng các biến độc lập có sự tương quan với nhau. HỆ SỐ TƯƠNG QUAN RIÊNG Nếu có hiện tượng đa cộng tuyến tính, ta dùng hệ số tương quan riêng để đánh giá ảnh hưởng thật sự của các biến đa cộng tuyến tính lên biến phụ thuộc. Nhận xét. 1. Tuổi và Chỉ số cơ thể đều tương quan với Cholesterol. Nhưng Tuổi và Chỉ số cơ thể cũng có tương quan với nhau. 2. Tuổi có tương quan thật sự với Cholesterol. CÁC BƯỚC PHÂN TÍCH CƠ BẢN B1. Phân tích tương quan: các biến độc lập tương quan tuyến tính với biến phụ thuộc đưa vào mô hình. B2. Kiểm định ANOVA sự phù hợp mô hình hồi quy H0: 1 = 2 = = p = 0. Tính hệ số xác định R2 – giải thích sự biến thiên của biến dự báo qua hồi quy. B3. Ước lượng các hệ số hồi quy bằng phương pháp bình phương bé nhất, kiểm định xem các hệ số bằng 0 hay không => phương trình hồi quy tuyến tính mẫu CÁC BƯỚC PHÂN TÍCH CƠ BẢN B4. Kiểm tra tính đa cộng tuyến tính của mô hình qua: - Tương quan riêng giữa biến phụ thuộc và mỗi biến độc lập. - Ngưỡng Tolerance và nhân tố VIF của mỗi biến độc lập đối với các biến độc lập còn lại. - Nếu các biến độc lập có hệ số tương quan riêng thấp hoặc nhân tố VIF lớn (thường VIF > 10) thì nên loại các biến đó ra khỏi mô hình hồi quy. CÁC BƯỚC PHÂN TÍCH CƠ BẢN B5. Khảo sát mẫu phần dư - Vẽ đồ thị scatter các điểm để khảo sát điều kiện kỳ vọng bằng 0 và phương sai không đổi. - Kiểm định tính chuẩn của mẫu phần dư. - Kiểm định tính tự tương quan bằng Durbin-Watson. B6. Dùng phương trình hồi quy tuyến tính mẫu để dự báo THỰC HÀNH Bài toán: trong file , hãy phân tích hồi quy tuyến tính bội của mô hình sau: Biến phụ thuộc: Cholesterol Các biến độc lập: Tuổi, chỉ số BMI PHƯƠNG PHÁP STEPWISE Giả sử mô hình phân tích hồi quy gồm biến phụ thuộc Y và p biến độc lập Xk, k=1p. Bài toán đặt ra là xác định một tập con của các biến độc lập dùng để dự báo tuyến tính cho Y. Phương pháp hồi quy từng bước (Stepwise) giúp ta chọn ra mô hình phù hợp bằng cách đưa vào hay loại ra các biến độc lập thật sự có ý nghĩa. Trên cơ sở phương pháp Stepwise, người xử lý dựa vào các điều kiện đảm bảo của mô hình để lựa chọn mô hình phù hợp nhất (thường là mô hình có hệ số R2 cao, sai số dự báo phân tán nhỏ và ít biến độc lập). THỰC HÀNH Bài toán: Trong file , phân tích hồi quy tuyến tính của mô hình: Biến phụ thuộc: Hàm lượng CO2 Các biến độc lập: Thời gian, phần trăm hòa tan, lượng dầu, lượng than đá, Tổng số lượng hòa tan, Số Hydrogen tiêu thụ.
đang nạp các trang xem trước