python读取excel数据 附实战代码

发布时间:2023年12月18日

在Python中,可以使用pandas库来读取Excel文件中的数据。下面是一个简单的例子:

import pandas as pd

# 读取Excel文件
df = pd.read_excel('example.xlsx')

# 显示前5行数据
print(df.head())

在上面的代码中,我们首先导入了pandas库,并使用pd.read_excel()函数来读取名为example.xlsx的Excel文件。读取的数据将被存储在一个名为df的DataFrame对象中。然后,我们使用df.head()函数来显示前5行数据。

如果需要读取特定的工作表或单元格数据,可以在read_excel()函数中使用参数进行指定。例如:

# 读取Excel文件的特定工作表
df = pd.read_excel('example.xlsx', sheet_name='Sheet1')

# 读取Excel文件的特定单元格数据
data = pd.read_excel('example.xlsx', sheet_name='Sheet1', header=None, index_col=0)

在上面的代码中,我们使用sheet_name参数来指定要读取的工作表的名称。如果要读取多个工作表,可以将它们作为列表传递给sheet_name参数。此外,我们还使用header=Noneindex_col参数来指定要读取的单元格范围和索引列。

除了读取Excel文件的内容,我们还可以进行更多的操作,例如修改单元格的值、添加新的单元格或工作表、删除单元格或工作表等。下面是一些示例代码:

# 修改单元格的值
df.at[0, 'A'] = 'new value'

# 添加新的单元格
df.iloc[0, 2] = 'new value'

# 添加新的工作表
new_data = pd.DataFrame({'B': [1, 2, 3], 'C': [4, 5, 6]})
writer = pd.ExcelWriter('example.xlsx', engine='xlsxwriter')
new_data.to_excel(writer, sheet_name='Sheet2')
writer.save()

# 删除单元格
df.dropna(axis=0, how='all', inplace=True)

# 删除工作表
writer = pd.ExcelWriter('example.xlsx', engine='xlsxwriter')
df.to_excel(writer, sheet_name='Sheet1')
writer.save()

在上面的代码中,我们使用df.at[]函数来修改特定单元格的值。使用df.iloc[]函数可以添加新的单元格。使用pd.ExcelWriter类可以创建新的工作表并保存更改。使用df.dropna()函数可以删除包含空值的单元格。最后,使用pd.ExcelWriter类将DataFrame对象保存到Excel文件中时,可以指定要保存的工作表名称。

除了对单元格和工作表的修改,我们还可以使用pandas库进行更高级的数据处理和分析。以下是一些示例代码:

# 计算每行的和
row_sums = df.sum(axis=1)

# 计算每列的平均值
col_means = df.mean(axis=0)

# 根据某列的值对数据进行排序
sorted_data = df.sort_values('C')

# 按照某列的值将数据分组并计算每组的平均值
grouped_data = df.groupby('B').mean()

在上面的代码中,我们使用df.sum()函数和df.mean()函数分别计算每行和每列的和以及平均值。使用df.sort_values()函数可以根据特定列的值对数据进行排序。使用df.groupby()函数可以将数据按照特定列的值分组,并使用df.mean()函数计算每组的平均值。

这些只是pandas库的一些基本用法,它还提供了更多的功能和操作来处理和分析Excel文件中的数据。

文章来源:https://blog.csdn.net/luxiaol/article/details/135045229
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。