본문 바로가기
K-digital Project/Machine learning_project

머신러닝 딥러닝 전 기초 통계 03_상관, 공분산, 상관계수

by arbor 2022. 12. 4.

통계_상관

 

1. 상관 (Correlation)

      - 확률변수 X,Y의 변화가 서로 관계가 있을 때 상관관계가 있다고 함

      - 선형적 관련성을 파악함

 

 

2. 공분산 (Covariance)

 

 

3. 상관계수 (Correlation Coefficient) - 피어슨 상관계수

- 공분산을 두 변수의 표준편차의 곱으로 나눈 값

- 상관계수의 값은 -1 과1사이에 있다.
-두 양적 변수 간의 '선형적 연관성'의 강도 측정

(데이터가 선형적으로 이루고 있어야지 의미가 있다.)

-단위가 없음 : 그렇기 때문에 다른 단위로 측정이 된 변수끼리도 비교가 가능하다.
-절댓값이 1에 가까울  수록 연관성의 강도가 높다
 

 

사회 인문 과학에서 유의미 한 수 0.3~
보통 0.3~0.7일 때 유의미한 상관 관계가 있다고 한다.