상관분석 : 변수 2개
X1과 X2가 상관관계가 있는지 보는게 상관분석.
Scatter Plot 방향이 기울기가 위쪽으로 올라가면 양의 상관관계, 아래쪽으로 내려가면 음의 상관관계, 동그라미면 상관성이 없음. 변수들간에는 상관관계가 없는게 좋음
몸무게와 키 같은 경우, 키 크면 몸무게가 많이 나갈수 밖에 없음
10C2(10컴비네이션9) = 10x9/2x1(분모는 중복된 데이터) = 45
데이터 평균을 0으로 가지고 온다. x-u(Centering한다)
공분산행렬은 매우매우 중요하다. 아래 그림을 무조건 알아둘것
E 기대값이란 표현이 붙으면
1. Centering
2. 공분산
3. 로 : 상관행렬을 만든다
가설검증은 다 넘기고.
상관분석의 의미를 알아야 한다. p29
로의 범위는
변수간의 선형관계만 본다.
공분산을 매트릭스로 표현 하면?
서열로 만들어서 상관분석을 하면 ? Spear Man(첫번째 피어슨 상관분석, 두번쨰 스피어만, 세번째 켄달 타우 상관분석)
'개발정보 > DataAnalytics' 카테고리의 다른 글
[파이썬] astype 행렬 캐스팅하기 (0) | 2021.04.08 |
---|---|
[데이터마이닝]W05 파이썬 실습 (0) | 2021.04.08 |
[데이터마이닝]W05 (0) | 2021.04.08 |
[데이터마이닝]회귀분석Regression (0) | 2021.04.01 |
[데이터마이닝입문]D03파이썬 제어구조 실습 (0) | 2021.03.25 |
댓글