Giới thiệu

Covariance (Hiệp phương thơm sai) và Correlation (Hệ số tương quan) là nhì định nghĩa trong lĩnh vực Tỷ Lệ thống kê. Cả nhì khái niệm này phần đa nói về quan hệ thân nhị đổi thay với nhau, tốt có thể nói rằng nhì chỉ số này dùng để làm miêu tả sự dựa vào thân nhì biến hóa.

Bạn đang xem: Correlation coefficient là gì

Covariance là gì?

Covariance trình bày quan hệ giữa nhì trở nên với nhau, hoàn toàn có thể là đồng vươn lên là (positive covariance) hoặc nghịch đổi mới (negative sầu covariance).

Định nghĩa : Cho 2 phát triển thành tình cờ X, Y cùng với kì vọng mu_X cùng mu_Y covariance của X, Y được xem bởi phương pháp :

Cov(X,Y) = E((X - mu_X )(Y - mu_Y))

Các tính chất của Covariance :

Cov(aX + b, cY + d) = acCov(X,Y) cùng với a, b, c, d cho trướcCov(X_1 + X_2, Y) = Cov(X_1, Y) + Cov(X_2, Y)Cov(X, X) = Var(X)Cov(X, Y) = E(XY) - mu_Xmu_YVar(X, Y) = Var(X) + Var(Y) + 2Cov(X, Y)Nếu X, Y độc lập thì Cov(X, Y) = 0.

Xem thêm: Sizzle Là Gì ? Nghĩa Của Từ Sizzle Trong Tiếng Việt

Lưu ý :

Từ 3 cùng 4 ta tất cả Var(X) = E(X^2) - mu^2_x. Nếu X, Y tự do tự 5 hoàn toàn có thể suy ra được Var(X, Y) = Var(X) + Var(Y).Với 6, điều trở lại sai trái, nghĩa là Cov(X, Y) = 0 ko tức là X, Y tự do với nhau. lấy một ví dụ X = <-2 , -1 , 1 , 2> cùng Y = X^2 = <4 , 1, 1 , 4> khi đó Cov(X, Y) = 0

Correlation là gì?

Để trình bày mối quan hệ thân 2 phát triển thành là “mạnh” hay “yếu”, họ sử dụng correlation nắm mang lại covariance.

Định nghĩa : Correlation coefficient của nhị vươn lên là X và Y được tính theo công thức

Cor(X, Y) = ho = fracCov(X, Y)sigma_Xsigma_Y

Các đặc thù của Corelation :

Correlation là Covariance được chuẩn chỉnh hóa của nhì vươn lên là X, YCorrelation biểu lộ một tỉ lệ thành phần, cho nên vì vậy nó không có đơn vị chức năng đo-1 leq ho leq 1 ho = -1 khi và chỉ lúc Y = aX + b và a với ho = 1 lúc và chỉ lúc Y = aX + b và a > 0

Chứng minh đặc thù 3 :

0 leq Var(fracXsigma_X - fracYsigma_Y) = Var(fracXsigma_X) + Var(fracYsigma_Y) - 2Cov(fracXsigma_X, fracYsigma_Y) = 2 - 2 ho Rightarrow ho leq 1.

Tương từ bỏ 0 leq Var(fracXsigma_X + fracYsigma_Y) Rightarrow ho geqslant -1

Biểu diễn quan hệ X, với Y với mức giá trị rho (correlation)


*

So sánh thân covariance và correlation

Cả covariance và correlation hồ hết biểu thị quan hệ thân nhị biến chuyển.Covariance có range trường đoản cú -infty đến +infty . Correlation nằm trong gần đúng từ - 1 đến 1.Covariance thể hiện mối quan lại hệ giữa nhị biến, correlation thể hiện được mối quan liêu hệ giữa hai hoặc nhiều biến.

Ví dụ

Tập dữ liệu view của 2 kênh truyền hình tại 1 thời điểm (20h - 21h thứ năm mỗi tuần) trong một tháng là

X = (50772, 73756, 74251, 77601)Y = (102492, 100406, 97762, 98191)

Ta triển khai tính các thông số cơ bản

Mean_X = (50772 + 73756 + 74251 + 77601)/ 4 = 69095.00Mean Y = 99712.75std_X^2 = ((50772 - Mean_X)^2 +(73756 - Mean_X)^2 +… ) / 4 = 114098405.5 => std_X = 10681.69std_Y = 1892.48

Từ kia ta tính covariance với correlation

Cov(X, Y) = ((50772 - 69095.00) * (102492 - 99712.75) + (73756 - 69095.00) * (100406 - 99712.75) + …) / 4 = -17673758.0Corr (X,Y ) = Cov(X, Y) / (std_X * std_Y) = -17673758.0 / ( 10681.69 * 1892.48) = -0.87
Bài viết liên quan

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *