2020.09.27
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 49회차 미션
48회차에서 국내 인기채널 순위를 순서대로 시각화하기 위해 colaboratory 환경을 설정하고, 데이터를 불러와 필요한 데이터만 추려냈다. 오늘은 이에 이어 group을 해줘서 조회수 100위를 순서대로 막대그래프📊를 그려봤다.
👉 groupby로 묶어서 합계
파이썬 개념을 배우면서 강사님께서 데이터 시각화를 위해 groupby 코딩을 많이 쓴다고 하셨는데 이번 실습 예제에서 이렇게 한번 써본다..ㅎㅎ
채널에 속한 각각 동영상의 조회수를 합하기 위해
df_chanel_view_sum = df_drop_sorted.groupby(df['channel_title']).sum()
df_chanel_view_sum
을 하고나서,
👉 조회수를 내림차순으로 정렬하기
df_chanel_view = df_chanel_view_sum.sort_values(by='views', ascending=False)
df_chanel_view
조회 합계가 높은 순서에서 낮은 순서로 보기 위해서 내림차순으로 정렬해줬다.
👉 조회수 TOP 100 채널 순서대로 나열
df_chanel_view = df_chanel_view[:100]
df_chanel_view
그리고 [:100]을 해서 100위안에 속한 채널만 뽑아봤고,
👉 인덱스 붙이기
df_chanel_view = df_chanel_view.reset_index()
df_chanel_view
인덱스가 없어서 인덱스를 따로 붙여줬다.
이렇게 '조회수가 높은 채널 100개'를 순서대로 보기 위한 데이터 정리가 끝났다.
👉 데이터 시각화
sns.barplot(x='channel_title', y='views', data=df_chanel_view
조회수가 높은 순서대로 보기 위해 막대그래프barplot을 선택했고, 먼저 x 축에는 채널 명, 그리고 y축에는 조회수를 입력하고 뽑아봤는데..
채널명이 너무 길어서 x축에 넣으면 너무 촘촘하게 보여서
x축과 y축을 바꿔서 입력하고, 크기를 크게 설정해서 다시 출력했다.
plt.figure(figsize=(20,100))
sns.barplot(x='views', y='channel_title', data=df_chanel_view[:100])
이렇게 보니 조금 길어지긴 했지만, 채널 이름을 전체까지 볼 수 있고, 조회수가 높은 채녈 100위를 순서대로 보기가 편했다. 음.. 우리나라 유튜브 채녈 100위안에는 엔터테이먼트 관련? 방탄소년단이나 블랙핑크의 동영상을 업로드한 채널이 확실히 조회수가 높았다.
유튜브 동영상 조회수 높은 100위 순서대로 데이터 시각화
07. Part4 04강 & 05강 수강완료!✊
패스트캠퍼스 데이터분석 강의 챌린지 참여 후기 (1) | 2020.10.13 |
---|---|
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 50회차 미션 (0) | 2020.09.28 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 48회차 미션 (0) | 2020.09.26 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 47회차 미션 (0) | 2020.09.25 |
[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 46회차 미션 (0) | 2020.09.24 |
댓글 영역