2020.09.06
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 28회차 미션
27회차에서 박스플롯, 막대그래프, 선그래프, area그래프를 각각 실습해봤다. 전에 배운 Matplotlib 에선 처음 배운 개념이라 여러 강에 걸쳐 실습을 해봤는데, seaborn에서는 이미 다 배운개념이라 살짝 다른 부분만 짚고가면 되서 한 강에 실습을 다 끝냈다. 스스로 복습하기도 쉬웠고~
오늘 강의에서는 seaborn을 이용해서 실제 데이터를 가지고 실습을 해봤다. 오늘 사용한 데이터는 타이타닉 승객 데이터인데, 영화나 역사에서 봤던 사건의 데이터라 느낌이 새로웠다...ㅎ
이 데이터를 바탕으로 Matplotlib에 없는(?) seaborn 전용 그래프를 하나씩 실습해봤다.
카운트 플롯은 말그대로 항목별 갯 수를 세어주는 그래프로, 해당 column을 구성하고 있는 value들을 구분하여 보여준다.
👉sns.countplot(x="x축에 올 값", hue="기준", palette='팔레트', data='데이터') plt.show()
여기서, 눕혀진 그래프를 그리고 싶다면, 따로 다른 항목을 추가할 필요없이 x를 y로 바꾸면 끝-
👉sns.countplot(y="y축에 올 값", hue="기준", palette='팔레트', data='데이터') plt.show()
distplot은 히스토그램 그래프와 kde플롯을 통합한 그래프로, 데이터의 분포와 밀도를 확인할 수 있다.
sns.distplot(x) plt.show()
타이타닉 데이터를 이용해서 실습을 해보면,
sns.countplot(x="class", hue="who", data=titanic)
plt.show()
class별로 성인 남성, 성인 여성, 어린이 탑승객을 보여주는 그래프를 그릴 수 있었는데, 3등석에 탑승한 성인 남성이 1등석이나 2등석에 탑승한 성인 남성보다 3배 이상 높은 걸 한눈에 볼 수 있었다. 전체적으로 탑승객의 수를 비교하면 3등석>1등석>2등석 순으로 많았다.
countplot, distplot 그래프 실습
Part 1 20강-21강 수강완료!✊
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 30회차 미션 (0) | 2020.09.08 |
---|---|
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 29회차 미션 (0) | 2020.09.07 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 27회차 미션 (0) | 2020.09.05 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 26회차 미션 (0) | 2020.09.04 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 25회차 미션 (0) | 2020.09.03 |
댓글 영역