使用python将批量pdf转换为word

发布时间:2024年01月12日

?当你看pdf,想直接将其转换为word复制粘贴时,这时可能会想到使用wps转换,或者直接在浏览器搜索pdf免费转换word,但是很多都不是免费的,或者就是需要绑定自己的微信账号、电话号码,这极有可能造成信息泄露,这时候python就可以帮上你的忙。

第一步:安装相关的包

pip install pdf2docx  -i https://pypi.douban.com/simple/

?第二步:创建存放pdf的文件夹,可以将pdf批量存放到一个文件夹下面

第三步:执行程序

from pdf2docx import Converter
import os

def convert_pdf_to_docx(pdf_path, docx_path):
    cv = Converter(pdf_path)
    cv.convert(docx_path, start=0, end=None)
    cv.close()


def batch_convert_pdfs_to_docx(input_folder, output_folder):
    # 检查输出文件夹是否存在,如果不存在则创建
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    # 遍历输入文件夹中的所有PDF文件
    for pdf_file in os.listdir(input_folder):
        if pdf_file.endswith(".pdf"):
            pdf_path = os.path.join(input_folder, pdf_file)

            # 构建输出Word文档的路径,保留文件名但更改扩展名
            docx_file = os.path.splitext(pdf_file)[0] + ".docx"
            docx_path = os.path.join(output_folder, docx_file)

            # 将PDF转换为Word文档
            convert_pdf_to_docx(pdf_path, docx_path)
            print(f"Converted: {pdf_path} -> {docx_path}")


if __name__ == "__main__":
    input_folder = "D://OOO//pdf"  # 输入PDF文件夹路径 要输入文件夹的路径,在文件夹下面放上pdf文件
    output_folder = "D://OOO//pdf"  # 输出Word文档文件夹路径

    batch_convert_pdfs_to_docx(input_folder, output_folder)

?效果对比:整体效果还是有点不太行

?随后我找了几个效果还不错的网站,大家可以去试试:

https://www.pdfpai.com/pdf-to-word
https://www.ilovepdf.com/zh-cn/pdf_to_word
文章来源:https://blog.csdn.net/weixin_53660567/article/details/135547368
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。