Pandas实战100例 | 案例 65: 重采样时间序列数据

发布时间:2024年01月16日

案例 65: 重采样时间序列数据

知识点讲解

在处理时间序列数据时,经常需要根据不同的时间间隔重新整理和汇总数据。Pandas 的 resample 方法提供了一种方便的方式来重采样时间序列数据。

  • 时间序列重采样: 使用 resample 方法可以按照指定的频率(如每 3 天)对时间序列数据进行重采样,并应用聚合函数(如求和)。
示例代码
# 准备数据和示例代码的运行结果,用于案例 65

# 示例数据
data_timeseries_resampling = {
    'DateTime': pd.date_range(start='2023-01-01', periods=6, freq='D'),
    'Value': [10, 20, 15, 30, 25, 40]
}
df_timeseries_resampling = pd.DataFrame(data_timeseries_resampling)
df_timeseries_resampling.set_index('DateTime', inplace=True)

# 重采样时间序列数据
resampled_data = df_timeseries_resampling.resample('3D').sum()

df_timeseries_resampling, resampled_data


在这个示例中,我们对时间序列数据每三天进行了一次重采样,并计算了这三天的总和。

示例代码运行结果

原始时间序列数据 (df_timeseries_resampling):

            Value
DateTime         
2023-01-01     10
2023-01-02     20
2023-01-03     15
2023-01-04     30
2023-01-05     25
2023-01-06     40

重采样后的数据 (resampled_data):

            Value
DateTime         
2023-01-01     45
2023-01-04     95

这个结果展示了重采样后的数据,每个时间段的值是该时期内所有值的总和。重采样是在时间序列分析中处理数据的一个重要技巧,它有助于识别趋势和模式。

文章来源:https://blog.csdn.net/PoGeN1/article/details/135616546
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。