2020.08.29
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 20회차 미션
어제 일반적으로 가장 많이 쓰이고, 엑셀이나 파워포인트로 발표나 자료를 준비하면서 많이 썼던 꺾은선 그래프와 막대그래프를 파이썬에서 어떻게 출력하는지 배웠는데 오늘은 추가적으로 파이썬에서 출력할 수 있는 그래프를 배웠다.
📊 히스토그램 Histogram
히스토그램은 가로축에는 분포, 세로축에는 빈도를 시각화하여 보여주는 그래프이다.
df2.plot(kind='hist')
📈 커널밀도 그래프
커널밀도 그래프도 히스토그램과 같이 분포-빈도를 시각화하여 보여주는 그래프이지만, 히스토 그램처럼 막대기 그래프가 아니라 부드러운 라인형태를 띤다.
df2.plot(kind='kde)
📊 box: 박스 플롯
강사님께서 아웃라이어 개념도 설명하셨는데, 통계값에 영향을 줄 수 있거나, 아웃라이어가 많이 나타나는 경우 데이터가 잘 수집됐는지 보기 위해 사용하는 것으로 이해했다. 박스 그래프는 대학교 통계시간에 배웠던 개념과 같아서 바로 이해했다. df2.plot(kind='box')
📈 Hexbin
hexbin은 고밀도 산점도 그래프인데, x와 y 키 값을 넣어 주어야 한다. 예를 들면, x에 연도,y에 분양가를 넣어주고 싶다면? df.plot(kind='hexbin, x=' 연도',y='분양가',gridsize=20)
gridsize 정해서 동그라미 점을 크게 혹은 작게 그래프로 나타날 수 있다.
📊 scatter: 산점도 그래프
위에서 배운 Hexbin 그래프처럼 산점도 그래프라 똑같이 x,y값을 모두 numeric한 값으로 넣어 코딩을 해줘야한다.
df,plot(x='월',y='분양가',kind='scatter')
📈 파이그래프
4000여개의 데이터를 가지고 파이그래프를 그리면 이렇게 되는구나...! 레코드판 같이 생긴 처음 봤다.
df.groupby('연도')['분양가'].plot(kind='pie')
📊 Area
면적 그래프는 처음 들어본 그래프이지만, 라인 그래프에 면적을 채운 그래프라 그리 생소한 그래프도 아니었다.
df..plot(kind='area')
df.groupby('월')['분양가'].count().plot(kind='area')
어제에 이어 그래프 2번째 02. 파트1 33부터 35번까지 수강완료!✊
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 22회차 미션 (0) | 2020.08.31 |
---|---|
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 21회차 미션 (2) | 2020.08.30 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 19회차 미션 (0) | 2020.08.28 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 18회차 미션 (0) | 2020.08.27 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 17회차 미션 (0) | 2020.08.26 |
댓글 영역