Python办公自动化实例，批量处理Excel数据

发布时间：2024年01月17日

Python批量处理Excel数据表很简单，只要掌握os和pandas这两个包，使用遍历的方法即可批量数据合并，这里举例多种场景下使用Python批量操作处理Excel表，下面的代码只要稍作修改，即可满足各种应用场景。

案例一：将不同工作簿合并到一个Excel中

做数据分析日常最多的就是跟表格打交道，做数据处理和数据合并是必须的，比如，有几百个Excel工作簿，如果手动的Ctrl+C、Ctrl+V这样重复的复制粘贴汇总表格，效率极其慢，使用Python只需8行代码即可批量合并。

import os 
path=r'C:\Desktop\数据合并'  

listdir=os.listdir(path) 
df=pd.read_excel(path+'\\'+ listdir[0])#导入第一个数据表  

for filename in listdir[1:]:
     dfi=pd.read_excel(path+'\\'+ filename) #导入除第一个数据表外其他数据表
     df=pd.concat([df,dfi],sort=False) #数据纵向合并

df.to_excel(r'C:\Desktop\学生成绩数据合并.xlsx',index=False)

案例二：将不同sheet表合并到一个Excel中

同样的道理，如果一个Excel表中有多个不同的sheet表，将其汇总到一个sheet表中，如果复制、粘贴，需要耗时很长时间，使用Python写个程序只有8行代码，10秒不到，就将多个sheet表中的数据合并到一个Excel表中。

import pandas as pd
path=r'C:\Desktop\数据合并\不同科目成绩表.xlsx' 
sheet_names=pd.ExcelFile(path).sheet_names 
df=pd.read_excel(path,sheet_name=0)#导入第一个sheet表  

for sheetname in sheet_names[1:]:
     dfi=pd.read_excel(path,sheetname) #导入除第一个sheet表外其他sheet表
     df=pd.concat([df,dfi],sort=False) #数据纵向合并

df.to_excel(r'C:\Desktop\学生成绩不同sheet表数据合并.xlsx',index=False)

案例三：Excel批量创建多个工作簿

有时候，创建多个Excel工作簿也是工作必须的，常规操作就是右键新建Excel工作簿，然后右键重命名，如果要创建一个全国各个省份的Excel工作簿，手动创建效率很慢，使用下面的几行代码即可批量创建新的工作簿。

from openpyxl import Workbook 
import os 
os.mkdir(r'C:\Desktop\批量创建文件夹')#创建一个新的文件夹  

name_list = ["湖南","湖北","河南","河北","山东","山西","广东","广西","贵州","陕西"]  

for name in name_list:
     wb = Workbook()
     wb.save(filename = f"C:\Desktop\批量创建文件夹\{name}.xlsx")

案例四：将Excel文件拆分到不同sheet表

某次考试有一个包含所有科目考试成绩的表格，要将每一科的学生成绩分别创建一个sheet表保存各科的成绩，Excel的做法是先在总表中筛选出来各个科目的成绩，然后创建一个新的sheet表，重命名后复制粘贴，使用Python只需4行代码即可批量拆分。

import pandas as pd 
df=pd.read_excel(r'C:\Desktop\学生成绩表.xlsx')

for i in df['科目'].unique():
     df[df['科目']==i].to_excel(f"C:\Desktop\数据拆分\{i}.xlsx",index=False)

案例五：将Excel文件拆分到不同工作簿

还是上面的案例数据，只不过这次将总成绩表按照不同的科目拆分为不同的工作簿，相对于表格的复制粘贴，这里只需要6行代码就可以实现复杂的Excel操作，轻轻松松实现Excel表格自动化功能。

import pandas as pd 
df=pd.read_excel(r'C:\Desktop\数据拆分\学生成绩表.xlsx') 
writer=pd.ExcelWriter(r'C:\Desktop\不同科目成绩表.xlsx')  

for i in df['科目'].unique():
     df[df['科目']==i].to_excel(writer,sheet_name=i,index=False)

writer.save()

案例六：Python批量生成合同

如果要生成一份电子合同，常规做法是在Word中先设置一份电子版合同，对于空白项用下划线标识出来，然后手动填写文字，使用Python可以写程序批量生成合同，这样节省了大量的人工时间成本，大大提高了办公效率。

import pandas as pd 
from openpyxl.utils.dataframe import dataframe_to_rows 
from docxtpl import DocxTemplate  

df = pd.read_excel(r'C:\Users\尚天强\Desktop\各高校空调合同.xlsx') 
df["签约日期"] = df["签约日期"].apply(lambda x:x.strftime("%Y-%m-%d")) 
datas = []  

for row in dataframe_to_rows(df,index=False,header=False):
     data = {"甲方": row[0],
             "乙方": row[1],
             "产品名称": row[2],
             "产品价格": row[3],
             "保修期": row[4],
             "签约日期": row[5]}
     datas.append(data)

for data in datas:
     tpl = DocxTemplate(r'C:\Users\尚天强\Desktop\各高校安装空调合同书.docx')
     tpl.render(data)
     tpl.save(r'C:\Users\尚天强\Desktop\合同生成\{}的空调安装合同.docx'.format(data['甲方']))

     print('{}的空调安装安装合同已生成'.format(data['甲方']))

使用Python程序批量生成电子版合同，生成结果如下，打开任意的一个合同书，我们看到已经在原有的下划线处插入了合同数据。

以上不管是Excel文件处理，还是Word文件处理，Python都可以轻松处理，限于篇幅原因无法一一例举，感兴趣可以关注我，持续分享数据分析知识，相信对你的数据分析能力有所提升，以上代码在运行中遇到问题，可在评论区留言，解决你的代码问题~

本文首发于公众号：大话数据分析，专注于数据分析的实践与分享，掌握Python、SQL、PowerBI、Excel等数据分析工具，擅长运用技术解决企业实际问题，欢迎一同探索数据的世界，解锁业务背后的秘密。

文章来源:https://blog.csdn.net/weixin_42684533/article/details/135640816
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！