2020.09.20
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 42회차 미션
41회차에서 배운 걸 복습해보면, 머신러닝 중에 회귀예측은 모델을 선언하고 '수치값을 예측하는것'이다. MSE는 실제값과 예측값의 오차의 제곱 평균으로, 모델의 성능을 판단하는데 사용되는 평가지표이다. 오늘은 어제 배운 평가지표 MSE에 이어 MAE와 RMSE를 마저 배우고 과적합 되는 것을 방지하기 위해 패널티를 주는 '규제'를 배웠다.
MAE (Mean Absolute Error)은 실제값과 예측값의 차이즉, 오차의의 절대값의 평균이다.
오차값이 -1 그리고 또다른 오차값이 1이되어서 합해서 0이 되는 것을 막기 위해서 하는게 mean absolute error이다.
MSE가 제곱 값이기 때문에 당연히 MSE 값이 MAE 값보다 클 수 밖에 없다. (MAE<MSE)
def my_mae(pred, actual):
return np.abs(pred - actual).mean()
my_mae(pred, actual)
RMSE (Root Mean Squared Error)은 예측값과 실제값의 차이에 대한 제곱에 대하여 평균을 낸 뒤 루트를 씌운 값으로
def my_rmse(pred, actual):
return np.sqrt(my_mse(pred, actual))
my_mae(pred, actual)
으로 값을 얻을 수 있다.
학습이 과대적합되는 것을 방지하고자 penalty를 부여하는것을 규제라고 하는데, L2 규제와 L1규제가 있다.
y는 예측값 x값은 인풋데이터이라고 했을때,
y=w*X +bias
weight 값을 0.1 만큼 패널티를 작게하면 가중치가 증가하기 때문에 규제가 없어진다.
각 가중치의 제곱 합에 규제강도를 곱해서 더해준다 → L2 규제 (L2 Regularization) 를 활용한 모델이 릿지이고,
가중치의 절대값의 합에 곱해서 더해준다.→ L1규제 (L1 Regularization)를 활용한게 라쏘!
그리고 이 둘, L2 규제와 L1규제를 하이브리드한게 Elastic Net이다.
💡오늘 배운 내용 복습
평가지표 MAE RMSE
규제
04. Part1 32강부터 34강까지 수강완료!✊
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 44회차 미션 (0) | 2020.09.22 |
---|---|
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 43회차 미션 (0) | 2020.09.21 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 41회차 미션 (0) | 2020.09.19 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 40회차 미션 (0) | 2020.09.18 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 39회차 미션 (0) | 2020.09.17 |
댓글 영역