在数据分析的早期阶段,对数据进行初步的探索是非常重要的。这包括查看数据的基本信息、统计摘要、以及数据的形状。
查看数据的基本信息
# 显示 DataFrame 的基本信息,包括列名、非空值数量、数据类型等
df.info()
获取数据的统计摘要
# 显示数值型列的统计摘要,包括计数、均值、标准差、最小值、四分位数、最大值
df.describe()
查看数据的形状
# 显示 DataFrame 的行数和列数
print(df.shape)
查看列名
# 显示所有列名
print(df.columns)
查看前几行数据
# 显示前五行数据
print(df.head())
查看后几行数据
# 显示后五行数据
print(df.tail())
代码解释:
df.info()
提供了 DataFrame 的概览,包括每列的名称、非空值数量和数据类型。df.describe()
显示数值型列的统计摘要。df.shape
返回一个包含行数和列数的元组。df.columns
显示所有列的名称。df.head()
和 df.tail()
分别显示 DataFrame 的前五行和后五行数据。这些操作有助于快速了解数据集的基本情况,是数据分析的重要初步步骤。