상세 컨텐츠

본문 제목

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 37회차 미션

본문

반응형

2020.09.15

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 37회차 미션

36회차에서는 iris 데이터 세트의 개념과 데이터 시각화 그리고 표본집단을 균등하게 맞춰주는 용도인 stratify를 배웠다. 오늘은-

 

📍 OvR과 OvO

LogisticRegression, 서포트 벡터 머신 (SVM) 과 같은 알고리즘은 2개의 클래스 판별만 가능하다. 예를 들면, 남자인지 여자인지? 생존했는지 아닌지?와 같은!

반면, 3개 이상의 클래스에 대한 판별을 진행하는 경우, 다음과 같은 전략으로 판별하게 되는데, 두가지 방법이 있다.

 

👉one-vs-rest (OvR): K 개의 클래스가 존재할 때, 1개의 클래스를 제외한 다른 클래스를 K개 만들어, 각각의 이진 분류에 대한 확률을 구하고, 총합을 통해 최종 클래스를 판별!

예를 들면, 0,1,2 번 클래스가 있을때, 0번 클래스를 1번 2번 클래스와 1번 클래스를 2번 0번 클래스와 같이 해서 확률을 구하고 어떤 클래스가 가장 괜찮은 걸로 선택!

 

👉one-vs-one (OvO): 4개의 계절을 구분하는 클래스가 존재한다고 가정했을 때, 0vs1, 0vs2, 0vs3, ... , 2vs3 까지 NX(N-1)/2 개의 분류기를 만들어 가장 많이 양성으로 선택된 클래스를 판별하는 건데,

 

대부분 OvsR 전략이 선호되어서 OvR 설명을 많이 해주셨다.

 

📍 LogisticRegression 순서

step 1: 모델 선언
model = LogisticRegression()

step 2: 모델 학습
model.fit(x_train, y_train)

step 3: 예측
prediction = model.predict(x_valid) prediction[:5]

step 4: 평가
(prediction == y_valid).mean() 
👉평가에서 도출된 값으로 모델 성능을 판단할 수 있다. 1.0으로 도출되면, 정확도가 100%인것!

📍 SGD Classifier 분류

sgd = SGDClassifier(random_state=0)
sgd.fit(x_train, y_train)
prediction = sgd.predict(x_valid) 
(prediction == y_valid).mean() -> 데이터가 얼마나 일정한지 확인 가능!

 

SDGDClassifier 과 Regression이 있으니 주의할 것!

패스트캠퍼스 데이터분석1
강의 캡처

📍 하이퍼 파라미터 (hyper-parameter) 튜닝

sgd = SGDClassifier(penalty='l1', random_state=0, n_jobs=-1) 
sgd.fit(x_train, y_train) 
prediction = sgd.predict(x_valid) 
(prediction == y_valid).mean()

 

  • random_ state=0이면, 앞으로 모델을 학습시킬때마다 key값을 고정시켜준다.
  • n_jobs= -1은 CPU 코어를 얼마나 사용할지? -1은 CPU 코어를 모두 사용으로 설정하는 것으로, 학습속도가 빠르다.
  • 결과값: 결과값은 모델 성능을 보여주는 값으로, elastic 규제와 하이퍼 값을 다양하게 시도해본 다음에 이 정확도를 높이도록해야한다!

패스트캠퍼스 데이터분석2
강의 캡처
패스트캠퍼스 데이터분석3
강의 캡처

💡오늘 배운 내용 복습

  1. LogisticRegression

  2. SGD Classifier

  3. 하이퍼 파라미터 (hyper-parameter) 튜닝

04. Part 1 18강부터 21강까지 수강완료!✊

https://bit.ly/3imy2uN

 

직장인을 위한 파이썬 데이터분석 올인원 패키지 Online. | 패스트캠퍼스

왕초보도 진짜 데이터 분석을 하는 마법의 커리큘럼으로 파이썬 기초부터 다양한 예제를 활용한 분석까지 모두 배울 수 있는 온라인 과정입니다.

www.fastcampus.co.kr

 

반응형

관련글 더보기

댓글 영역