상세 컨텐츠

본문 제목

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 31회차 미션

본문

반응형

2020.09.09

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 31회차 미션

어제 seaborn을 다 마치고, 머신러닝 파트로 넘어왔다. 머신러닝.. 어디서 많이 들어봤는데.. 나와 관련없는, 관심도 없었던 거라 그냥 넘겼던 이 머신러닝을 배우게 되었다..! 통계학 수업시간에 자주 사용한 regression model과 관련있는 것 같기도 하고, 처음 접해보는 개념이라 강사님의 설명을 귀기울여 들었다.

 

📍머신러닝의 개념

이전에는 사람이 알고리즘을 입력해서 결과를 예측하는 거 였으나, 머신러닝은 맞춰야할 데이터가 주었을때 스스로 학습하여 패턴학습을 하여 결과를 추론하는 것이다. 알고리즘이 패턴학습을 할 수 있게끔 하는것이 머신러닝이다.

패스트캠퍼스 데이터분석1
강의 캡처

강의해서는 지도학습과 비지도학습을 다룰 예정인데, 지도학습은 예를들면, 스팸메일이 있을때 '이게 스팸메일인지 아닌지를 예측할해야할 값이 있으면 데이터를 주고 학습을 시키는 것! 반면에, 맞춰야할 레이블(?), 예측해야할 값이 없고 스스로 다양한방식을 수행하는 것이 비지도학습이었다.

 

지도학습

👉크게 회귀와 분류로 나뉘는데, 회귀는 가격, 집값 등 수치형 값을 맞추는 것이고, 분류는 말그대로 분류하는것!이었다.

비지도학습

👉뉴스를 분류하거나 사용자 관심별로 분류 등 그룹핑을 하는 것이 대표적인 예이다.

 

🗨️머신러닝의 장점과 단점

👍장점

#다양한 양질의 데이터가 있으면 사람이 짠 알고리즘보다 더 좋은 기능을 발휘할 수 있다.

#지식이 부족해도 가능하다. 예를 들면, 금융!

 

반면에, 👎단점

#데이터의 의존성이 크기 때문에 쓰레기 데이터를 가지고 있으면 쓰레기가 나온다.

#일반화의 오류에 빠질 수 있다. 통계학에서 공통적으로 범하는 오류로, 나와 비슷한 사람들을 대다수 사람들의 성향을 일반화 시키는 오류에 빠질 수 있다.

#풍부한 양질의 데이터가 필요하다! 오류를 막기위해서!

 

패스트캠퍼스 데이터분석2
강의 캡처

 

따라서 우리는 무엇을 해야하나?

머신러닝이 성능을 잘발휘할 수 있도록 데이터를 전처리해줘야하고, 적절한 알고리즘을 사용해야한다!

머신러닝의 전체적인 개념을 익히고, 가설함수, 비용, 손실함수를 배웠는데, 손실은 우리가 예측한 값과 실제값은 얼마나 차이가 있느냐를 계산한 것이었다. 따라서 최고의 알고리즘을 구하기 위해서는 손실의 총합이 0 에 가까워야한다.

패스트캠퍼스 데이터분석3
강의 캡처

 

💡오늘 배운 내용 복습

  1. 머신러닝 개념

  2. 가설함수, 비용, 손실함수

Part 1 01강 & 02강 수강완료!✊

bit.ly/3imy2uN

 

직장인을 위한 파이썬 데이터분석 올인원 패키지 Online. | 패스트캠퍼스

왕초보도 진짜 데이터 분석을 하는 마법의 커리큘럼으로 파이썬 기초부터 다양한 예제를 활용한 분석까지 모두 배울 수 있는 온라인 과정입니다.

www.fastcampus.co.kr

 

반응형

관련글 더보기

댓글 영역