Covariance

(in Statistics) 두 변수가 함께 변하는 정도.

cov(X,Y)=E[(XE[X])(YE[Y])]\operatorname{cov}(X, Y) = \operatorname{E}{\big[(X - \operatorname{E}[X])(Y - \operatorname{E}[Y])\big]}

또는

cov(X,Y)=Σ(xxˉ)(yyˉ)n1cov(X, Y) = \frac{\Sigma (x - \bar{x})(y - \bar{y})}{n - 1}

해석

양수이면 양의 상관 관계가 있다는 뜻, 음수이면 음의 상관 관계가 있다는 뜻, 0이면 상관 관계가 없다는 뜻이다. 단, 공분산은 데이터의 스케일에 의해 영향을 받기 때문에 그 이외의 의미를 부여하기는 어렵다.

공분산을 그대로 쓰는 경우는 거의 없고 다른 더 유용한 통계량을 계산하기 위한 중간 단계라는 의미가 있다. 예를 들어 일단 공분산을 구하면 스케일에 영향을 받지 않는 값인 피어슨 상관 계수를 구할 수 있다.

External links

2024 © ak