时间序列数据分析是数据科学中的一个重要领域。Pandas 提供了处理时间序列的强大功能,包括滚动窗口计算。滚动窗口计算可以用于平滑时间序列数据,识别趋势和模式。
rolling
方法可以对数据集应用滚动窗口计算。例如,你可以计算滚动平均或滚动标准差。# 准备数据和示例代码的运行结果,用于案例 29
# 示例数据
data_time_series = {
'Date': pd.date_range(start='2023-01-01', periods=6, freq='M'),
'Sales': [200, 220, 250, 300, 310, 330]
}
df_time_series = pd.DataFrame(data_time_series)
# 设置日期为索引
df_time_series.set_index('Date', inplace=True)
# 滚动窗口计算
rolling_average = df_time_series.rolling(window=2).mean()
df_time_series, rolling_average
在这个示例中,我们首先将日期设置为 DataFrame 的索引。然后,我们计算了一个窗口大小为 2 个月的滚动平均。
原始时间序列 (df_time_series
):
Sales
Date
2023-01-31 200
2023-02-28 220
2023-03-31 250
2023-04-30 300
2023-05-31 310
2023-06-30 330
滚动平均 (rolling_average
):
Sales
Date
2023-01-31 NaN
2023-02-28 210.0
2023-03-31 235.0
2023-04-30 275.0
2023-05-31 305.0
2023-06-30 320.0
这个结果展示了时间序列数据的滚动平均计算,有助于平滑短期波动,突出长期趋势。