在数据处理时,需要将某一天的数据按照小时聚合。例如聚合当天8点内的数据,并取平均值获得求和等。可以使用Pandas resample()函数对时间序列数据进行重采样。
df_sales.resample('2H').sum()#将数据集中的数据按2小时求和
注意,这里需要时间(time)那一列为索引,如果时间那一列不是索引的话会报错。
将time那一列设置为索引的代码:
df_sales=df_sales.set_index('time')
#获取指定时间段内的数据
drange = pd.date_range('2016-08-01 00:00:00', '2016-09-01 00:00:00',
freq='10min')
#这个只能获取到时间序列信息,不能获取到这一行其他列的信息。例如00:00:00的信息为3,使用这行代
码获得不了3这个数据
更多操作见原文章