时间序列重采样是处理时间序列数据的一种常用方法。它允许你按照不同的时间频率对数据进行重新采样和聚合。在 Pandas 中,这可以通过 resample
方法轻松完成。
resample
方法可以根据不同的时间频率(如月、季度、年等)重组和汇总数据。# 准备数据和示例代码的运行结果,用于案例 36
# 示例数据
data_resample_time_series = {
'Date': pd.date_range(start='2023-01-01', periods=6, freq='M'),
'Sales': [200, 220, 250, 300, 310, 330]
}
df_resample_time_series = pd.DataFrame(data_resample_time_series)
df_resample_time_series.set_index('Date', inplace=True)
# 时间序列重采样
resampled_data = df_resample_time_series.resample('Q').mean()
df_resample_time_series, resampled_data
在这个示例中,我们将原始按月数据重新采样为按季度数据,并计算了每个季度的平均销售额。
原始时间序列 (df_resample_time_series
):
Sales
Date
2023-01-31 200
2023-02-28 220
2023-03-31 250
2023-04-30 300
2023-05-31 310
2023-06-30 330
重采样后的数据 (resampled_data
):
Sales
Date
2023-03-31 223.333333
2023-06-30 313.333333
这个结果显示了按季度重新采样的平均销售额。时间序列重采样是分析时间序列数据时的一种重要工具。