2020.09.15
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 37회차 미션
36회차에서는 iris 데이터 세트의 개념과 데이터 시각화 그리고 표본집단을 균등하게 맞춰주는 용도인 stratify를 배웠다. 오늘은-
LogisticRegression, 서포트 벡터 머신 (SVM) 과 같은 알고리즘은 2개의 클래스 판별만 가능하다. 예를 들면, 남자인지 여자인지? 생존했는지 아닌지?와 같은!
반면, 3개 이상의 클래스에 대한 판별을 진행하는 경우, 다음과 같은 전략으로 판별하게 되는데, 두가지 방법이 있다.
👉one-vs-rest (OvR): K 개의 클래스가 존재할 때, 1개의 클래스를 제외한 다른 클래스를 K개 만들어, 각각의 이진 분류에 대한 확률을 구하고, 총합을 통해 최종 클래스를 판별!
예를 들면, 0,1,2 번 클래스가 있을때, 0번 클래스를 1번 2번 클래스와 1번 클래스를 2번 0번 클래스와 같이 해서 확률을 구하고 어떤 클래스가 가장 괜찮은 걸로 선택!
👉one-vs-one (OvO): 4개의 계절을 구분하는 클래스가 존재한다고 가정했을 때, 0vs1, 0vs2, 0vs3, ... , 2vs3 까지 NX(N-1)/2 개의 분류기를 만들어 가장 많이 양성으로 선택된 클래스를 판별하는 건데,
대부분 OvsR 전략이 선호되어서 OvR 설명을 많이 해주셨다.
step 1: 모델 선언
model = LogisticRegression()
step 2: 모델 학습
model.fit(x_train, y_train)
step 3: 예측
prediction = model.predict(x_valid) prediction[:5]
step 4: 평가
(prediction == y_valid).mean()
👉평가에서 도출된 값으로 모델 성능을 판단할 수 있다. 1.0으로 도출되면, 정확도가 100%인것!
sgd = SGDClassifier(random_state=0)
sgd.fit(x_train, y_train)
prediction = sgd.predict(x_valid)
(prediction == y_valid).mean() -> 데이터가 얼마나 일정한지 확인 가능!
SDGDClassifier 과 Regression이 있으니 주의할 것!
sgd = SGDClassifier(penalty='l1', random_state=0, n_jobs=-1)
sgd.fit(x_train, y_train)
prediction = sgd.predict(x_valid)
(prediction == y_valid).mean()
LogisticRegression
SGD Classifier
하이퍼 파라미터 (hyper-parameter) 튜닝
04. Part 1 18강부터 21강까지 수강완료!✊
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 39회차 미션 (0) | 2020.09.17 |
---|---|
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 38회차 미션 (0) | 2020.09.16 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 36회차 미션 (0) | 2020.09.14 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 35회차 미션 (0) | 2020.09.13 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 34회차 미션 (0) | 2020.09.12 |
댓글 영역