4.1 회귀분석의 평가지표
선형회귀 용어 정리 (통계와 머신러닝)
- 공통
Y는 종속 변수, 결과 변수
X는 독립 변수, 원인 변수, 설명 변수 - 통계학에서 사용하는 선형회귀 식
Y=β0+β1X+ε- β0 : 편향(bias)
- β1 : 회귀 계수
- ε : 오차(error), 모델이 설명하지 못하는 Y 의 변동성
- 머신러닝/딥러닝에서 사용하는 선형회귀 식
Y=wX+b- w : 가중치
- b : 편향(Bias)
- 머싱러닝/딥러닝 모델에서 오차 항은 명시적으로 다루지 않음
회귀 평가 지표 - MSE, RMSE, MAE
- 에러 정의 방법
(1) 에러 = 실제 데이터 - 예측 데이터
(2) 에러를 모두 제곱하여 SUM
(3) 데이터 개수 (n) 만큼 나누기
- 에러 정의 방법 수식
(1) ε=yi−^yi
(2) n∑i=1(yi−^yi)2
(3) n∑i=1(yi−^yi)2n
- MSE (Mean Squared Error)
MSE=n∑i=1(yi−^yi)2n
- RMSE (Root Mean Squared Error)
RMSE=√n∑i=1(yi−^yi)2n
- MAE (Mean Absolute Error)
MAE=1nn∑i=1|yi−^yi|
선형 회귀만의 평가 지표 - R Square
- R Square 정의
R2=SSRSST=SSRSSR+SSE
- 3번 샘플의 설명력
- 3번 데이터 값 SST=(169+5)2,SSR=1692
- 해당 값에 대한 설명력 SST/SSR=94
- 단, 모든 샘플 값에 대해서 위 계산을 수행해야함