상세 컨텐츠

본문 제목

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 29회차 미션

본문

반응형

2020.09.07

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 29회차 미션

26회차에서 Matplotlib에는 없는 countplot과 distplot을 배우고 타이타닉 데이터를 예제로 실습을 해보았다. 이름만 countplot과 distplot이지, 빈도수 그래프를 코딩식으로 뽑아주는 것, 히스토그램st한 그래프를 뽑는 것이었다. 오늘은 이에 이어서 러그플롯rugplot, 히트맵heatmap, 바이올린플롯violinplot, 조인트플롯jointplot을 실습해봤다.

 

러그플롯 rugplot

rug는 rugplot이라고도 불리우며, 데이터 위치를 x축 위에 작은 선분(rug)으로 나타내어 데이터들의 위치 및 분포를 보여준다. 위에서 본 히스토그램 그래프는 구간에 들어있는 데이터가 몇 개 있는지만 볼 수 있지만, 이 러그플롯은 데이터의 위치가 막대로 나타나 어디에 있는지도 보여준다.

sns.distplot(x, rug=True, hist=False, kde=True)

plt.show()

패스트캠퍼스 데이터분석1
실습 캡처

데이터 위치를 표시하는 rug가 없는 히스토그램보다 부드러운 곡선을 kde 그래프를 출력하고싶으면

sns.distplot(x, rug=False, hist=False, kde=True)

plt.show()

 

패스트캠퍼스 데이터분석2
실습 캡처

히트맵 heatmap

Seaborn을 처음 배우기시작할 때, 알록달록한 게 가장 배우고 싶었던 그래프였다. 히트맵 그래프는 데이터 상관관계를 보고자할 때 많이 사용되는 그래프이다. annot=True를 하면, 값의 숫자를 함께 표기할 수 있다.

패스트캠퍼스 데이터분석3
실습 캡처

sns.heatmap(데이터 명, annot=True)

plt.show()

 

어제 다뤘던 타이타닉 실습예제로 heatmap을 그려보면,

sns.heatmap(titanic.corr(), annot=True, cmap="YlGnBu")
plt.show()

 

생존자- 탑승권 가격의 상관관계 value가 0.26로 가장 높게 나왔는데, 탑승권 가격이 높을 수록 생존자가 많은 것을 알 수 있다. 반면에, 성인 남성과 생존자의 상관관계 value가 -0.56으로, 성인남자의 생존률이 가장 낮음을 한눈에 볼 수 있었다.

 

💡오늘 배운 내용 복습

  1. rug, ked,histogram 그래프 실습

  2. heatmap 그래프 실습

Part 1 22강-23강 수강완료! ✊

bit.ly/3imy2uN

 

직장인을 위한 파이썬 데이터분석 올인원 패키지 Online. | 패스트캠퍼스

왕초보도 진짜 데이터 분석을 하는 마법의 커리큘럼으로 파이썬 기초부터 다양한 예제를 활용한 분석까지 모두 배울 수 있는 온라인 과정입니다.

www.fastcampus.co.kr

 

반응형

관련글 더보기

댓글 영역