상세 컨텐츠

본문 제목

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 20회차 미션

본문

반응형

2020.08.29

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 20회차 미션

어제 일반적으로 가장 많이 쓰이고, 엑셀이나 파워포인트로 발표나 자료를 준비하면서 많이 썼던 꺾은선 그래프와 막대그래프를 파이썬에서 어떻게 출력하는지 배웠는데 오늘은 추가적으로 파이썬에서 출력할 수 있는 그래프를 배웠다.

 

📊 히스토그램 Histogram

히스토그램은 가로축에는 분포, 세로축에는 빈도를 시각화하여 보여주는 그래프이다.

df2.plot(kind='hist')

 

📈 커널밀도 그래프

커널밀도 그래프도 히스토그램과 같이 분포-빈도를 시각화하여 보여주는 그래프이지만, 히스토 그램처럼 막대기 그래프가 아니라 부드러운 라인형태를 띤다.

df2.plot(kind='kde)

 

📊 box: 박스 플롯

강사님께서 아웃라이어 개념도 설명하셨는데, 통계값에 영향을 줄 수 있거나, 아웃라이어가 많이 나타나는 경우 데이터가 잘 수집됐는지 보기 위해 사용하는 것으로 이해했다. 박스 그래프는 대학교 통계시간에 배웠던 개념과 같아서 바로 이해했다. df2.plot(kind='box')

 

📈 Hexbin

hexbin은 고밀도 산점도 그래프인데, x와 y 키 값을 넣어 주어야 한다. 예를 들면, x에 연도,y에 분양가를 넣어주고 싶다면? df.plot(kind='hexbin, x=' 연도',y='분양가',gridsize=20)

gridsize 정해서 동그라미 점을 크게 혹은 작게 그래프로 나타날 수 있다.

패스트캠퍼스 데이터분석1
강의 캡처

 

📊 scatter: 산점도 그래프

위에서 배운 Hexbin 그래프처럼 산점도 그래프라 똑같이 x,y값을 모두 numeric한 값으로 넣어 코딩을 해줘야한다.

df,plot(x='월',y='분양가',kind='scatter')

 

📈 파이그래프

4000여개의 데이터를 가지고 파이그래프를 그리면 이렇게 되는구나...! 레코드판 같이 생긴 처음 봤다.

df.groupby('연도')['분양가'].plot(kind='pie')

패스트캠퍼스 데이터분석2
실습 캡처

 

📊 Area

면적 그래프는 처음 들어본 그래프이지만, 라인 그래프에 면적을 채운 그래프라 그리 생소한 그래프도 아니었다.

df..plot(kind='area')

df.groupby('월')['분양가'].count().plot(kind='area')

패스트캠퍼스 데이터분석3
강의 캡처

💡오늘 배운 내용 복습

  1. histogram, kde, hexbin 그래프
  2. box plot그래프와 아웃라이어 없애기
  3. are, pie, scatter 그래프 출력하는 방법

어제에 이어 그래프 2번째 02. 파트1 33부터 35번까지 수강완료!✊

 

bit.ly/3imy2uN

 

직장인을 위한 파이썬 데이터분석 올인원 패키지 Online. | 패스트캠퍼스

왕초보도 진짜 데이터 분석을 하는 마법의 커리큘럼으로 파이썬 기초부터 다양한 예제를 활용한 분석까지 모두 배울 수 있는 온라인 과정입니다.

www.fastcampus.co.kr

반응형

관련글 더보기

댓글 영역