상관계수
산점도에서 점들이 얼마나 직선에 가까운지를 나타내는 척도
얼마나 직선적인 경향을 나타내는가를 수치로 표현
상관계수 공식
→ 출처 링크 참고
상관계수 코드 예시
from numpy import mean
from numpy import std
from numpy.random import randn
from numpy.random import seed
#seed random number generator
seed(1)
x = 20 * randn(1000) + 100
y = x
plt.scatter(x, y)
plt.show()
Qx = x - mean(x)
Qy = y - mean(y)
r = sum(Qx*Qy) / ((len(Qx) - 1) * std(x)*std(y))
r
seed(1)
x = 20 * randn(1000) + 100
y = -3 * x
plt.scatter(x, y)
plt.show()
Qx = x - mean(x)
Qy = y - mean(y)
r = sum(Qx*Qy) / ((len(Qx) - 1) * std(x)*std(y))
r
#seed random number generator
seed(1)
#prepare data
x = 20 * randn(1000) + 100
y = x + (10 * randn(1000) + 50)
#summarize
print('x: mean=%.3f stdv=%.3f' % (mean(x), std(x)))
print('y: mean=%.3f stdv=%.3f' % (mean(y), std(y)))
#plot
plt.scatter(x, y)
plt.show()
Qx = x - mean(x)
Qy = y - mean(y)
r = sum(Qx*Qy) / ((len(Qx) - 1) * std(x)*std(y))
r
출처
'Study > AI' 카테고리의 다른 글
[AI][ML]Logistic Regression(로지스틱 회귀) (0) | 2022.07.31 |
---|---|
[AI][ML]회귀(Regression) (0) | 2022.07.29 |
[AI][ML]데이터 스케일링 (0) | 2022.07.20 |
로지스틱 회귀 (0) | 2022.06.04 |
[AI]작업 흐름 (0) | 2021.02.09 |