2020.09.07
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 29회차 미션
26회차에서 Matplotlib에는 없는 countplot과 distplot을 배우고 타이타닉 데이터를 예제로 실습을 해보았다. 이름만 countplot과 distplot이지, 빈도수 그래프를 코딩식으로 뽑아주는 것, 히스토그램st한 그래프를 뽑는 것이었다. 오늘은 이에 이어서 러그플롯rugplot, 히트맵heatmap, 바이올린플롯violinplot, 조인트플롯jointplot을 실습해봤다.
rug는 rugplot이라고도 불리우며, 데이터 위치를 x축 위에 작은 선분(rug)으로 나타내어 데이터들의 위치 및 분포를 보여준다. 위에서 본 히스토그램 그래프는 구간에 들어있는 데이터가 몇 개 있는지만 볼 수 있지만, 이 러그플롯은 데이터의 위치가 막대로 나타나 어디에 있는지도 보여준다.
sns.distplot(x, rug=True, hist=False, kde=True)
plt.show()
데이터 위치를 표시하는 rug가 없는 히스토그램보다 부드러운 곡선을 kde 그래프를 출력하고싶으면
sns.distplot(x, rug=False, hist=False, kde=True)
plt.show()
Seaborn을 처음 배우기시작할 때, 알록달록한 게 가장 배우고 싶었던 그래프였다. 히트맵 그래프는 데이터 상관관계를 보고자할 때 많이 사용되는 그래프이다. annot=True를 하면, 값의 숫자를 함께 표기할 수 있다.
sns.heatmap(데이터 명, annot=True)
plt.show()
어제 다뤘던 타이타닉 실습예제로 heatmap을 그려보면,
sns.heatmap(titanic.corr(), annot=True, cmap="YlGnBu")
plt.show()
생존자- 탑승권 가격의 상관관계 value가 0.26로 가장 높게 나왔는데, 탑승권 가격이 높을 수록 생존자가 많은 것을 알 수 있다. 반면에, 성인 남성과 생존자의 상관관계 value가 -0.56으로, 성인남자의 생존률이 가장 낮음을 한눈에 볼 수 있었다.
rug, ked,histogram 그래프 실습
heatmap 그래프 실습
Part 1 22강-23강 수강완료! ✊
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 31회차 미션 (0) | 2020.09.09 |
---|---|
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 30회차 미션 (0) | 2020.09.08 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 28회차 미션 (0) | 2020.09.06 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 27회차 미션 (0) | 2020.09.05 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 26회차 미션 (0) | 2020.09.04 |
댓글 영역