2020.09.09
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 31회차 미션
어제 seaborn을 다 마치고, 머신러닝 파트로 넘어왔다. 머신러닝.. 어디서 많이 들어봤는데.. 나와 관련없는, 관심도 없었던 거라 그냥 넘겼던 이 머신러닝을 배우게 되었다..! 통계학 수업시간에 자주 사용한 regression model과 관련있는 것 같기도 하고, 처음 접해보는 개념이라 강사님의 설명을 귀기울여 들었다.
이전에는 사람이 알고리즘을 입력해서 결과를 예측하는 거 였으나, 머신러닝은 맞춰야할 데이터가 주었을때 스스로 학습하여 패턴학습을 하여 결과를 추론하는 것이다. 알고리즘이 패턴학습을 할 수 있게끔 하는것이 머신러닝이다.
강의해서는 지도학습과 비지도학습을 다룰 예정인데, 지도학습은 예를들면, 스팸메일이 있을때 '이게 스팸메일인지 아닌지를 예측할해야할 값이 있으면 데이터를 주고 학습을 시키는 것! 반면에, 맞춰야할 레이블(?), 예측해야할 값이 없고 스스로 다양한방식을 수행하는 것이 비지도학습이었다.
지도학습은
👉크게 회귀와 분류로 나뉘는데, 회귀는 가격, 집값 등 수치형 값을 맞추는 것이고, 분류는 말그대로 분류하는것!이었다.
비지도학습은
👉뉴스를 분류하거나 사용자 관심별로 분류 등 그룹핑을 하는 것이 대표적인 예이다.
👍장점
#다양한 양질의 데이터가 있으면 사람이 짠 알고리즘보다 더 좋은 기능을 발휘할 수 있다.
#지식이 부족해도 가능하다. 예를 들면, 금융!
반면에, 👎단점
#데이터의 의존성이 크기 때문에 쓰레기 데이터를 가지고 있으면 쓰레기가 나온다.
#일반화의 오류에 빠질 수 있다. 통계학에서 공통적으로 범하는 오류로, 나와 비슷한 사람들을 대다수 사람들의 성향을 일반화 시키는 오류에 빠질 수 있다.
#풍부한 양질의 데이터가 필요하다! 오류를 막기위해서!
머신러닝이 성능을 잘발휘할 수 있도록 데이터를 전처리해줘야하고, 적절한 알고리즘을 사용해야한다!
머신러닝의 전체적인 개념을 익히고, 가설함수, 비용, 손실함수를 배웠는데, 손실은 우리가 예측한 값과 실제값은 얼마나 차이가 있느냐를 계산한 것이었다. 따라서 최고의 알고리즘을 구하기 위해서는 손실의 총합이 0 에 가까워야한다.
머신러닝 개념
가설함수, 비용, 손실함수
Part 1 01강 & 02강 수강완료!✊
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 33회차 미션 (0) | 2020.09.11 |
---|---|
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 32회차 미션 (0) | 2020.09.10 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 30회차 미션 (0) | 2020.09.08 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 29회차 미션 (0) | 2020.09.07 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 28회차 미션 (0) | 2020.09.06 |
댓글 영역