상세 컨텐츠

본문 제목

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 49회차 미션

본문

반응형

2020.09.27

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 49회차 미션

48회차에서 국내 인기채널 순위를 순서대로 시각화하기 위해 colaboratory 환경을 설정하고, 데이터를 불러와 필요한 데이터만 추려냈다. 오늘은 이에 이어 group을 해줘서 조회수 100위를 순서대로 막대그래프📊를 그려봤다.

 

👉 groupby로 묶어서 합계

파이썬 개념을 배우면서 강사님께서 데이터 시각화를 위해 groupby 코딩을 많이 쓴다고 하셨는데 이번 실습 예제에서 이렇게 한번 써본다..ㅎㅎ

채널에 속한 각각 동영상의 조회수를 합하기 위해

df_chanel_view_sum = df_drop_sorted.groupby(df['channel_title']).sum()
df_chanel_view_sum

을 하고나서,

 

👉 조회수를 내림차순으로 정렬하기

df_chanel_view = df_chanel_view_sum.sort_values(by='views', ascending=False)
df_chanel_view

조회 합계가 높은 순서에서 낮은 순서로 보기 위해서 내림차순으로 정렬해줬다.

 

👉 조회수 TOP 100 채널 순서대로 나열

df_chanel_view = df_chanel_view[:100]
df_chanel_view

그리고 [:100]을 해서 100위안에 속한 채널만 뽑아봤고,

 

👉 인덱스 붙이기

df_chanel_view = df_chanel_view.reset_index()
df_chanel_view

인덱스가 없어서 인덱스를 따로 붙여줬다.

이렇게 '조회수가 높은 채널 100개'를 순서대로 보기 위한 데이터 정리가 끝났다.

 

👉 데이터 시각화

sns.barplot(x='channel_title', y='views', data=df_chanel_view

조회수가 높은 순서대로 보기 위해 막대그래프barplot을 선택했고, 먼저 x 축에는 채널 명, 그리고 y축에는 조회수를 입력하고 뽑아봤는데..

패스트캠퍼스 데이터분석1
강의 캡처

채널명이 너무 길어서 x축에 넣으면 너무 촘촘하게 보여서

x축과 y축을 바꿔서 입력하고, 크기를 크게 설정해서 다시 출력했다.

plt.figure(figsize=(20,100))
sns.barplot(x='views', y='channel_title', data=df_chanel_view[:100])

패스트캠퍼스 데이터분석2
강의 캡처

이렇게 보니 조금 길어지긴 했지만, 채널 이름을 전체까지 볼 수 있고, 조회수가 높은 채녈 100위를 순서대로 보기가 편했다. 음.. 우리나라 유튜브 채녈 100위안에는 엔터테이먼트 관련? 방탄소년단이나 블랙핑크의 동영상을 업로드한 채널이 확실히 조회수가 높았다.

패스트캠퍼스 데이터분석3
강의 캡처

💡오늘 배운 내용 복습

유튜브 동영상 조회수 높은 100위 순서대로 데이터 시각화

07. Part4 04강 & 05강 수강완료!✊

https://bit.ly/3imy2uN

 

직장인을 위한 파이썬 데이터분석 올인원 패키지 Online. | 패스트캠퍼스

왕초보도 진짜 데이터 분석을 하는 마법의 커리큘럼으로 파이썬 기초부터 다양한 예제를 활용한 분석까지 모두 배울 수 있는 온라인 과정입니다.

www.fastcampus.co.kr

 

반응형

관련글 더보기

댓글 영역