TAILIEUCHUNG - Bài giảng Phân tích số liệu - Bài 6: Phân tích tương quan
Nội dung cơ bản trong Bài giảng Phân tích số liệu Bài 6: Phân tích tương quan nhằm nêu 2 biến lượng. Phân tích tương quan là xem xét mối quan hệ phụ thuộc hay độc lập giữa các biến phân tích. Thêm vào đó, chỉ rõ mức độ phụ thuộc, chiều phụ thuộc và dạng phụ thuộc (nếu có). | BÀI 6 PHÂN TÍCH TƯƠNG QUAN MỤC ĐÍCH Phân tích tương quan là xem xét mối quan hệ phụ thuộc hay độc lập giữa các biến phân tích. Thêm vào đó, chỉ rõ mức độ phụ thuộc, chiều phụ thuộc và dạng phụ thuộc (nếu có). Ví dụ: - Xét xem chiều cao con cái chịu ảnh hưởng chiều cao bố, mẹ như thế nào? - Xét xem các mùa ảnh hưởng đến địa điểm du lịch như thế nào? Phân tích tương quan là bước đầu của các phương pháp phân tích số liệu nhiều chiều, chẳng hạn như phân tích hồi quy, phân tích thành phần chính, phân tích nhân tố, phân tích phân biệt MÔ HÌNH: 2 BIẾN ĐỊNH LƯỢNG Mô hình này gồm 2 biến phân tích là các biến định lượng. Phương pháp phân tích: - Vẽ đồ thị đám mây (scatter plot) giữa 2 biến >> hình ảnh về sự tương quan. - Nếu 2 biến có phân phối chuẩn >> dùng hệ số tương quan Pearson rP: đo mức độ phụ thuộc tuyến tính. - Nếu 2 biến không có phân phối chuẩn >> dùng hệ số tương quan Spearman rS: đo mức độ tương quan theo hạng (đơn điệu). - Kiểm định hệ số tương quan: H0: Hệ số tương quan bằng 0 SPSS: Analyze\Correlate\Bivariate MÔ HÌNH: 2 BIẾN ĐỊNH LƯỢNG Ví dụ các loại tương quan. Nhận xét: x và y1 không tương quan. MÔ HÌNH: 2 BIẾN ĐỊNH LƯỢNG Ví dụ các loại tương quan. Nhận xét: x và y2 tương quan tuyến tính và tương quan thuận. MÔ HÌNH: 2 BIẾN ĐỊNH LƯỢNG Ví dụ các loại tương quan. Nhận xét: x và y3 tương quan tuyến tính và tương quan ngịch. MÔ HÌNH: 2 BIẾN ĐỊNH LƯỢNG Ví dụ các loại tương quan. Nhận xét: x và y4 tương quan phi tuyến và tương quan ngịch. MÔ HÌNH: 2 BIẾN ĐỊNH LƯỢNG Chú ý: - Hệ số tương quan nằm trong đoạn [-1;1], giá trị của nó chỉ mức độ tương quan (giá trị càng lớn tương quan càng mạnh), dấu của nó chỉ chiều tương quan. - Nên sử dụng các phép đổi biến đưa về điều kiện chuẩn để sử dụng hệ số tương quan Pearson. - Với hệ số tương quan Pearson lớn thì cũng có thể nó không có mối quan hệ tuyến tính >> cần kết hợp đồ thị đám mây. - Các quan sát ngoại lai ảnh hưởng nhiều đến hệ số tương quan Pearson, không ảnh hưởng đến hệ số tương quan Spearman. - Hệ số tương quan Spearman có thể dùng để xem mối tương quan giữa 2 biến định tính thứ tự. THỰC HÀNH Bài toán: trong file , hãy phân tích tương quan giữa 2 biến ca, cr như sau: a) Giữa ca, cr b) Giữa ca, ln(cr) c) Giữa ln(ca), ln(cr) MÔ HÌNH: 2 BIẾN ĐỊNH TÍNH Mô hình này gồm 2 biến phân tích là các biến định tính (thứ tự, không thứ tự). Phương pháp phân tích: - Thống kê mô tả bảng chéo (crosstabs) giữa 2 biến >> nhận xét ban đầu về sự tương quan. - Kiểm định Khi-bình phương (Chi-square) hay phân tích tương quan (Correlate) >> kết luận: 2 biến phụ thuộc hay độc lập. - Phân tích độ đo phụ thuộc (nếu có): Symmetric measure. SPSS: Analyze\Descriptive Statistics\Crosstabs MÔ HÌNH: 2 BIẾN ĐỊNH TÍNH Kiểm định Chi-square H0: Hai biến độc lập với nhau Chú ý: - Kiểm định Chi-square đạt hiệu quả nếu có dưới 20%have expected count less than 5. - Nếu 2 biến là định tính có thứ tự thì có thể dùng phân tích hệ số tương quan Spearman đánh giá sự phụ thuộc). MÔ HÌNH: 2 BIẾN ĐỊNH TÍNH Độ đo phụ thuộc: - Nếu có 1 biến là định tính không thứ tự >> Contigency coefficient, Phi and Cramer’s - Nếu 2 biến là định tính thứ tự >> Gamma, Somers’d Symmetric measure: đo mức độ phụ thuộc nếu có của hai biến phân tích. Kiểm định độ đo phụ thuộc H0: Độ đo phụ thuộc bằng 0 THỰC HÀNH Bài toán: trong file , hãy phân tích tương quan các vấn đề sau: a) Mức độ thỏa mãn (giá cả, đa dạng, tổ chức, dịch vụ, chất lượng) của khách hàng có phụ thuộc vào cửa hàng? b) Mức độ thỏa mãn dịch vụ có ảnh hưởng đến mức độ thỏa mãn sự đa dạng không? c) Đánh giá ảnh hưởng mức độ thỏa mãn dịch vụ đến mức độ thỏa mãn sự đa dạng trên từng cửa hàng.
đang nạp các trang xem trước