본문 바로가기
데이터분석/시계열

데이터분석 시계열다룰때 전처리함수

by dohunNewte 2023. 3. 12.
반응형

type을 datatime으로만들면 시간 덧셈이 가능하다.

import datetime

date= datetime.date(year=2023, month=2, day=12)

td = datetime.timedelta(days= 5, hours=5)

print(date+td)

 

시계열데이터로 변환해주는 방법

pd.to_datetime(tweet['created_at'] //데이터프레임)

pd.to_datetime(df, errors='coerce') #에러를 na값으로 바꿔라!

 

시계열을 index로 바꾸기!

crime_df = crime.set_index('REPORTED_DATE')

 

index를 바꾼후 sort하면 시간별로 데이터프레임 정렬

crime_df.sort_index(ascending = True)

 

사이의 시간대 sort

crime_df.loc['2017-01-01':'2017-01-12'].sort_index()

 

between_time_sort

crime_df.between_time('10:00','15:00').sort_index()

 

원하는 시간만 추출

crime_df_sr= crime_df.at_time('17:12').sort_index()

 

resample

#월별, 일별, 주별 값을 계산

//년도별
crime_df.resample('Y').sum()

 

년도별로 볼때 max값만 가져오고 싶을때

crime_df.resample('Y').max()

 

 

 

728x90

댓글