《码农说》公众号的第13篇文章我们暖暖来袭。
今天分享主题:一款最初由100%ChatGPT开发的PDF处理应用程序,Stirling-PDF。
工具的源代码,我已经下载好了,公众号内回复:0108
即可下载,不想下载的直接按照资料部署即可。
理由1:部署非常简单,如果基于Docker部署,5分钟搞定。因为是本地化部署,不用担心数据安全问题;
理由2:体验ChatGPT的强大之处;工具用好了,能让我们有更多的时间摸鱼,太牛掰了;
理由3:基于主流的技术架构,我们可以方便进行二次开发;
查看和修改PDF-使用自定义查看排序和搜索功能查看多页PDF。加上页面上的编辑功能,如注释、绘制和添加文本和图像。
用于合并/拆分/旋转/移动PDF及其页面的完整交互式GUI。
将多个PDF合并到一个结果文件中。
按指码将PDF拆分为多个文件,或将所有页面提取为单个文件。
将PDF页面重新组织为不同的顺序。
以90度为增量旋转PDF。
删除页面。
多页布局(将PDF格式设置为多页页面)。
按设置%缩放页面内容大小。
裁剪PDF。
。。。
将PDF转换为图像和从图像转换PDF。
将任何常用文件转换为PDF(使用LibreOffice)。
将PDF转换为Word/Powerpoint/其他(使用LibreOffice)。
将HTML转换为PDF。
…
添加和删除密码。
更改/设置PDF权限。
添加水印。
认证/签署PDF。
…
添加/生成/写入签名。
检测并删除空白页。
比较2个PDF并显示文本差异。
将图像添加到PDF中。
压缩PDF以减小其文件大小(使用OCRMyPDF)。
从PDF中提取图像。
从扫描中提取图像。
添加页码。
下面提供了2种安装方式,实际都是用Docker启动容器。推荐大家用Docker安装。
docker run
Step1: 创建数据卷
docker volume create s_pdf_trainingData
继续执行下面命令
docker volume create s_pdf_extraConfigs
继续执行下面命令
docker volume create s_pdf_logs
Step2:运行docker run
, 启动容器
docker run -d -p 8686:8080 -v s_pdf_trainingData:/usr/share/tesseract-ocr/5/tessdata -v s_pdf_extraConfigs:/configs -v s_pdf_logs:/logs -e DOCKER_ENABLE_SECURITY=false --name stirling-pdf frooodle/s-pdf:latest
docker compose
Step1: 编写脚本,脚本文件名compose.yaml
version: '3.3'
services:
stirling-pdf:
image: frooodle/s-pdf:latest
ports:
- '8686:8080'
volumes:
- s_pdf_trainingData:/usr/share/tesseract-ocr/5/tessdata
- s_pdf_extraConfigs:/configs
- s_pdf_logs:/logs/
# - /location/of/customFiles:/customFiles/
environment:
- DOCKER_ENABLE_SECURITY=false
volumes:
s_pdf_trainingData:
s_pdf_extraConfigs:
s_pdf_logs:
Step2: 编写一个执行脚本
Window上:run.bat
,该文件和compose.yml
放在同一目录下,文件内容如下
docker compose up -d
Linux Or macOS上:run.sh
, 该文件和compose.yml
也放在同一目录下,文件内容如下
#!/bin/bash
docker compose up -d
然后修改该文件可执行权限
chmod +x run.sh
Step3:参照下面说明,执行完脚本,启动容器即可。
Windows上,直接双击run.bat
即可启动;
Linux Or MacOS上,执行下面的脚本,启动容器。
./run.sh
Step1:打开浏览器,输入http://localhost:8686/
默认是英文的,下图画框部分是提供的功能。
Step2:改成中文,如下图操作即可
Step3:修改完语言后,界面如下,提供的功能很全
Step4: 更多的功能,大家安装后自己体验吧。
大家好!我是老码农。今天就分享到这里。
关注《码农说》,期待未来能与更多的同学有深入的交流,一同学习技术,共同成长。