媳妇工作中经常用到excel处理,想用python处理excel更高效,所以自学了python,觉得python比Java还是简单多了,没有变量类型声明,比Java也就多了元组,各种库很丰富。
需求是: 汇总两个excel中?列,放到一个新的excel中,不允许有重复的列内容
代码编辑器:pycharm社区版本(根本不需要专业版,专业版很多功能用不到)
环境:conda(直接下载python也行,只不过需要pip下载很多库,这个conda默认包含很多库,只是减少了下载的麻烦)
为了演示方便,两个excel文件跟python脚本放到一起,两个excel内容都是产品、数量列,其中2.xlsx包含了1.xlsx中的内容
代码中引入pandas处理框架,读取2个excel的产品列内容,然后把内容放到一个列表里面,然后把列表赋值给一个新的excel,利用to_excel自动生成新的文档
import pandas as pd
df1 = pd.read_excel('1.xlsx')
df2 = pd.read_excel('2.xlsx')
result2=df2["产品"]
result1= df1["产品"]
my_list = []
for i in result1.values:
if i not in my_list:
my_list.append(i)
for i in result2.values:
if i not in my_list:
my_list.append(i)
data1={'产品':my_list}
df = pd.DataFrame(data1)
df.to_excel('zss2024.xlsx')
调试代码如下
生成的新excel也会是在同级目录下