상세 컨텐츠

본문 제목

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 30회차 미션

본문

반응형

2020.09.08

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 30회차 미션

29회차 rug플롯, histogram 그래프, ked 그래프, heatmap을 그려보고, 타이타닉 예제로도 실습해봤다. 오늘은 seaborn의 또다른 그래프들, violinplot, jointplot, implot, replot 그래프를 실습했다. implot, replot 그래프는 약간 복잡하게 느껴졌다.

 

🎻 바이올린플롯 violinplot

바이올린플롯도 말그대로 '바이올린'처럼 생긴 그래프로, 양쪽 끝 뾰족한 부분이 데이터의 최소값과 최대값을 나타내고, 뚱뚱한 부분은 데이터 분포를 나타낸다. x, y축을 지정해줌으로써 바이올린을 분할하여 비교 분포를 볼 수 있고, 여기에 hue 옵션을 추가하면, 단일 column에 대한 바이올린 모양의 비교를 할 수 있다.

x, y축을 지정해줌으로써 바이올린을 분할하여 비교 분포를 볼 수 있고, 여기에 hue 옵션을 추가하면, 단일 column에 대한 바이올린 모양의 비교를 할 수 있다.

sns.violinplot(x='데이터')

plt.show()

패스트캠퍼스 데이터분석2
실습 캡처

주어진 데이터로 실습을 해보면,

sns.violinplot(x="day", y="total_bill", hue="smoker", data=tips, palette="muted", split=True)
plt.show()

대체적으로 흡연자보다 비흡연자가 팁을 주는 경우가 많았고, 최대값과 최솟값의 차이가 주중보다는 주말이 더 큰 것을 한눈에 볼 수 있었다. 바이올린 플롯은 최대값, 최솟값, 빈도수, hue 옵션을 추가해서 비교까지 세가지 정보를 한 그래프안에 다 그려놨네요~ 사실 hue 옵션을 사용하지 않으면 바이올린이 대칭이기 때문에 비교 분포의 큰 의미는 없습니다.

 

📊 조인트플롯 jointplot

scatter(산점도)와 histogram(분포)을 동시에 Joint해서 그려주는 그래프이고,숫자형 데이터만 표현할 수 있다.

sns.jointplot(x="x축 데이터", y="y축 데이터", height=크기, data=데이터파일)

plt.show()

패스트캠퍼스 데이터분석1
실습 캡처

(tip, total_tip) 조합의 분포도를 볼 수 있는 산점도와, 오른쪽에는 tip의 빈도수 분포도를 나타낸 히스토그램과 윗부분에는 total bill의 빈도수 분포드를 그린 히스토그램을 동시에 볼 수 있었다.

패스트캠퍼스 데이터분석0
실습 캡처

💡오늘 배운 내용 복습

  1. replot, jointplot 그리기

  2. pairplot, violinplot, lmplot 그리기

Part 1 24강- 28강 수강완료

bit.ly/3imy2uN

 

직장인을 위한 파이썬 데이터분석 올인원 패키지 Online. | 패스트캠퍼스

왕초보도 진짜 데이터 분석을 하는 마법의 커리큘럼으로 파이썬 기초부터 다양한 예제를 활용한 분석까지 모두 배울 수 있는 온라인 과정입니다.

www.fastcampus.co.kr

 

반응형

관련글 더보기

댓글 영역