在处理时间序列数据时,基于日期时间索引选择特定日期范围的数据是一项常见的任务。当 DataFrame 的索引是 datetime 类型时,你可以使用 loc
方法来选择特定的日期或日期范围。
loc
方法,可以通过指定日期范围来选择数据。如果 DataFrame 的索引是 datetime 类型的,这种选择方式尤其直接和强大。# 准备数据和示例代码的运行结果,用于案例 80
# 示例数据
data_datetime_index_based_selection = {
'DateTime': pd.date_range(start='2023-01-01', periods=5, freq='D'),
'Value': [100, 200, 300, 400, 500]
}
df_datetime_index_based_selection = pd.DataFrame(data_datetime_index_based_selection)
df_datetime_index_based_selection.set_index('DateTime', inplace=True)
# 基于日期时间索引的选择
selected_dates = df_datetime_index_based_selection.loc['2023-01-02':'2023-01-04']
df_datetime_index_based_selection, selected_dates
在这个示例中,我们选择了日期范围从 ‘2023-01-02’ 到 ‘2023-01-04’ 的数据。
原始带有日期时间索引的 DataFrame (df_datetime_index_based_selection
):
Value
DateTime
2023-01-01 100
2023-01-02 200
2023-01-03 300
2023-01-04 400
2023-01-05 500
选择特定日期范围的数据 (selected_dates
):
Value
DateTime
2023-01-02 200
2023-01-03 300
2023-01-04 400
这个结果展示了如何基于日期时间索引选择特定日期范围的数据。这种方法在时间序列分析和数据处理中非常重要,尤其是当需要分析或比较特定时间段的数据时。