상세 컨텐츠

본문 제목

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 16회차 미션

본문

반응형

2020.08.25

[패스트캠퍼스 수강 후기] 데이터분석 강의 100% 환급 챌린지 16회차 미션

5차에서 두개의 데이터파일을 병합 하는 방법으로 concat과 merge를 배웠다. 생소한 개념이라 식을 반복적으로 봐서 이해했고, 자꾸 오류가 떴는데.. 오늘은 다시 쉬운 개념으로 돌아왔다. 한번은 어렵고, 한번은 쉬운 개념으로 배우는 게 확실히 꾸준히 공부할 수 있게 하는 것 같다.

 

📍type을 변경(astype)

데이터 타입을 변경하기위해서는 먼저 df.info() 원래 어떤 타입인지 확인해야한다. 그리고 원하는 타입으로 변경하면 되는데,

실습 캡처 화면처럼 오류가 뜨는 경우가 있다. 데이터에 결측값이 있는 경우, 데이터로 변환할 수 없기 때문에 먼저 14회차에서 배운 df.fillna(값)으로 결측값을 채워주고 나서

패스트 캠퍼스 데이터분석1
실습 캡처

데이터타입을 바꾸면!!

df['시리즈 이름'].astype(바꾸고 싶은 데이터 타입)

된다.

 

⏪복습

  • object: 일반 문자열 타입
  • float: 실수
  • int: 정수
  • category: 카테고리
  • datetime: 시간

object, float,int 이 데이터 타입은 여러번 정리했지만 자꾸 까먹는다...ㅎ

 

📅datetime 타입

pd.to_datetime(df['시리즈'])으로 생년월일, 연도 표기의 데이터 타입을 datetime타입으로 변경할 수 있다.

이 datetime(dt)타입은

dt.year로, 해당 년도만 뽑고 싶을 때, dt.month로 해당 월만, dt.day로 해당 일을 알아서 뽑아주기 때문에 연도별로, 월별로, 요일별로 통계를 돌릴 수 있다.

패스트 캠퍼스 데이터분석2
실습 캡처

dayofweek→ 태어난 날짜가 무슨 요일인지 알려준다.( 월요일: 0 화요일: 1, 수요일: 2, 목요일: 3, 금요일: 4, 토요일: 5, 일요일: 6)

weekofyear→ 태어난 날이 몇 주인지 알려준다.

 

📁apply 함수

👉함수식

남자/여자 문자열 함수를 숫자로 바꾸고 싶은 경우?

df.loc[df[성별]=='남자','성별']==1

df.loc[df[성별]=='여자','성별']==0

 

그룹의 숫자가 많아질 경우 처리하는 데 불편할 수 있어,

연산하는 방법을 열로 하면?

 

def male_or_female(x):

if x == '남자':

return 1

elif x == '여자':

return 0

 

👉lambda 사용

lambda는 1줄로 작성하는 간단 함수식으로, 위의 함수식처럼 return을 별도로 쓸필요 없다. apply의 함수식을 간단한 계산식으로 나타낸 것을 lambda라고 이해했다.

 

위의 예제와 같이 남자를 1로, 여자를 0으로 정의하고 슾다면,

f=lamda //x: 1 //if x=='남자' else 0

x가 남자인 경우에 x를 1로, 그렇지 않으면 0으로 한다.

그리고 df[성별].apply(f)로 함수를 출력해주면 끄읏-

 

👉값을 Map

dic 형태로 맵핑 my_map={'남자':1, '여자':0} 을 할 수 있다.

패스트 캠퍼스 데이터분석3
강의 캡처

💡오늘 배운 내용 복습

  1. 데이터를 다른 타입이나 dateitime으로 변경하기
  2. 데이터 apply법 3가지 1) 함수식 사용, 2) lambda식 사용 3) Map

어제는 어려웠지만 오늘은 쉽고 간단하게 클리어할 수 있었다! 02. 파트1 21부터 24번까지 수강완료!✊

 

https://bit.ly/3imy2uN

 

직장인을 위한 파이썬 데이터분석 올인원 패키지 Online. | 패스트캠퍼스

왕초보도 진짜 데이터 분석을 하는 마법의 커리큘럼으로 파이썬 기초부터 다양한 예제를 활용한 분석까지 모두 배울 수 있는 온라인 과정입니다.

www.fastcampus.co.kr

 

반응형

관련글 더보기

댓글 영역