TAILIEUCHUNG - Bài giảng Xử lý dữ liệu trong sinh học với phần mềm Excel - Bài 4: Hồi quy tương quan
Bài giảng cung cấp cho người học các kiến thức: Hồi quy tương quan, phân tích đồ thị, phân tích số liệu, thống kê phân tích,. Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu. chi tiết nội dung tài liệu. | Bài 4 HỒI QUY TƢƠNG QUAN Nếu có cặp biến ngẫu nhiên X, Ythì để đánh giá mối quan hệ tuyến tính giữa X và Y ta tính hệ số tƣơng quan rXY . Hệ số tƣơng quan lý thuyết đƣợc định nghĩa là XY = E{( X EX )(Y EY )} E{( X = EX )(Y DX .DY X EY ) } Y với E là ký hiệu của kỳ vọng toán học, D là phƣơng sai, là độ lệch chuẩn Trong xử lý số liệu sau khi thu thập số liệu ta để n cặp số liệu thành 2 cột hay hai hàng (nên để 2 cột vì thuận tiên cho các thao tác sau nàyn). Nếu tính trực tiếp có thể dùng công thức sau: n n ( xi Phƣơng sai của X s2 X = x) xi2 2 i 1 (n i 1 = 1) ( n 1) n n y)2 ( yi Phƣơng sai của Y s2 Y = nx 2 i 1 yi2 = ( n 1) ny 2 i 1 (n 1) n n ( xi Hiệp phƣơng sai XY covar (X,Y) = x )( yi i 1 (n 1) y) xi yi = nx y i 1 (n 1) Trong các công thức trên có thể tính tổng bằng hàm Sum(dãy số), tính tổng bình phƣơng bằng hàm Sumsq (dãy số), tổng các tich số bằng hàm Sumproduct (dãy1, dãy 2) Nếu dùng hàm định sẵn thì s2X = var(dãyX) s2Y = var(dãyY) Hiệp phƣơng sai = Covar(dãyX, dãyY) Hệ số tƣơng quan rXY = Covar(X,Y)/(sX sY) hoặc hàm định sẵn Correl(dãyX, dãyY) Hệ số tƣơng quan dƣơng kết luận tƣơng quan thuận, âm kết luận tƣơng quan nghịch Để kiểm định giả thiết r n 2 H0: XY = 0 đối thiết H1: XY 0 có thể tính Ttn = sau đó 1 r2 so với Tlt = Tinv( /2, n-2) tức là giá trị trong bảng Student ở mức ý nghĩa với n - 2 bậc tự do. Tiếp theo là tìm đƣờng hồi quy tuyến tính Y theo X, đƣờng thẳng này có phƣơng trình Y = a + bX a là tung độ gốc, b là hệ số góc b tính theo công thức b = r sY / sX a= y -ax Dùng hàm định sẵn thì a = Intercept(dãy Y, dãy X), b = Slope(dãy Yd, dãy X) Cũng có thể dùng hàm Linest (Dãy Y, dãy X, 0,1) để tìm đầy đủ a, b, r2 , các sai số . NDHien Khi có một bảng nhiều biến thì nên vào Data Analysis để tính một bảng các hệ số tƣơng quan giữa các biến bằng mục Correlation, tính một bảng các phƣơng sai và hiệp phƣơng sai bằng mục Covariance và tìm hồi quy tuyến tính hoặc bội tuyến tính bằng mục Regression, hai
đang nạp các trang xem trước