在处理时间序列数据时,经常需要根据不同的时间间隔重新整理和汇总数据。Pandas 的 resample
方法提供了一种方便的方式来重采样时间序列数据。
resample
方法可以按照指定的频率(如每 3 天)对时间序列数据进行重采样,并应用聚合函数(如求和)。# 准备数据和示例代码的运行结果,用于案例 65
# 示例数据
data_timeseries_resampling = {
'DateTime': pd.date_range(start='2023-01-01', periods=6, freq='D'),
'Value': [10, 20, 15, 30, 25, 40]
}
df_timeseries_resampling = pd.DataFrame(data_timeseries_resampling)
df_timeseries_resampling.set_index('DateTime', inplace=True)
# 重采样时间序列数据
resampled_data = df_timeseries_resampling.resample('3D').sum()
df_timeseries_resampling, resampled_data
在这个示例中,我们对时间序列数据每三天进行了一次重采样,并计算了这三天的总和。
原始时间序列数据 (df_timeseries_resampling
):
Value
DateTime
2023-01-01 10
2023-01-02 20
2023-01-03 15
2023-01-04 30
2023-01-05 25
2023-01-06 40
重采样后的数据 (resampled_data
):
Value
DateTime
2023-01-01 45
2023-01-04 95
这个结果展示了重采样后的数据,每个时间段的值是该时期内所有值的总和。重采样是在时间序列分析中处理数据的一个重要技巧,它有助于识别趋势和模式。