2020.09.08
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 30회차 미션
29회차 rug플롯, histogram 그래프, ked 그래프, heatmap을 그려보고, 타이타닉 예제로도 실습해봤다. 오늘은 seaborn의 또다른 그래프들, violinplot, jointplot, implot, replot 그래프를 실습했다. implot, replot 그래프는 약간 복잡하게 느껴졌다.
바이올린플롯도 말그대로 '바이올린'처럼 생긴 그래프로, 양쪽 끝 뾰족한 부분이 데이터의 최소값과 최대값을 나타내고, 뚱뚱한 부분은 데이터 분포를 나타낸다. x, y축을 지정해줌으로써 바이올린을 분할하여 비교 분포를 볼 수 있고, 여기에 hue 옵션을 추가하면, 단일 column에 대한 바이올린 모양의 비교를 할 수 있다.
x, y축을 지정해줌으로써 바이올린을 분할하여 비교 분포를 볼 수 있고, 여기에 hue 옵션을 추가하면, 단일 column에 대한 바이올린 모양의 비교를 할 수 있다.
sns.violinplot(x='데이터')
plt.show()
주어진 데이터로 실습을 해보면,
sns.violinplot(x="day", y="total_bill", hue="smoker", data=tips, palette="muted", split=True)
plt.show()
대체적으로 흡연자보다 비흡연자가 팁을 주는 경우가 많았고, 최대값과 최솟값의 차이가 주중보다는 주말이 더 큰 것을 한눈에 볼 수 있었다. 바이올린 플롯은 최대값, 최솟값, 빈도수, hue 옵션을 추가해서 비교까지 세가지 정보를 한 그래프안에 다 그려놨네요~ 사실 hue 옵션을 사용하지 않으면 바이올린이 대칭이기 때문에 비교 분포의 큰 의미는 없습니다.
scatter(산점도)와 histogram(분포)을 동시에 Joint해서 그려주는 그래프이고,숫자형 데이터만 표현할 수 있다.
sns.jointplot(x="x축 데이터", y="y축 데이터", height=크기, data=데이터파일)
plt.show()
(tip, total_tip) 조합의 분포도를 볼 수 있는 산점도와, 오른쪽에는 tip의 빈도수 분포도를 나타낸 히스토그램과 윗부분에는 total bill의 빈도수 분포드를 그린 히스토그램을 동시에 볼 수 있었다.
replot, jointplot 그리기
pairplot, violinplot, lmplot 그리기
Part 1 24강- 28강 수강완료
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 32회차 미션 (0) | 2020.09.10 |
---|---|
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 31회차 미션 (0) | 2020.09.09 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 29회차 미션 (0) | 2020.09.07 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 28회차 미션 (0) | 2020.09.06 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 27회차 미션 (0) | 2020.09.05 |
댓글 영역