17K star！Github上最好用的OCR文字识别开源项目，可离线使用！

发布时间：2024年01月17日

最近基哥在整理项目文档，大量的图片资料需要通过OCR来转录成文字版保存。我习惯性地来到Github上，想找找有没有趁手的开源工具。

不负众望，经过我一番寻找，还是找到了一款好用的免费，开源，可批量的离线的OCR软件——Umi-OCR！目前在Github已经超过了17K Star。

产品简介

Umi-OCR是基于PaddleOCR开发的，支持截图OCR 、?批量OCR 、二维码等功能。项目所有代码开源免费，解压即用，适用于 Windows7 x64 及以上的电脑系统。

安装方法

1、软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上，解压文件。

2、软件无需安装。

3、解压后，点击 Umi-OCR.exe 即可启动程序。

Umi-OCR 支持的界面多国语言。

首次打开软件时，将会按照你的电脑的系统设置，自动切换语言，如果需要手动切换语言。

同时支持主题颜色、字体大小等UI界面自定义设置。

功能亮点

Umi-OCR 的功能非常丰富实用，下来由基哥给大家讲解一下：

截图OCR：可以通过拖拽上传图片或者复制图片链接，当然最方便的肯定是直接屏幕截图了，截图完成后会自动进行OCR识别，在右边可以查看识别记录，支持编辑、复制、粘贴文本，相当方便。

段落合并：可以整理OCR完成后文本排版和顺序，使文本更适合阅读和使用。这个功能是真的强，以往的软件识别完成后都是断断续续的，排版还得调很久，这个段落功能直接帮你处理好，可以最大程度地保留原文本的排版结构。

批量OCR：支持批量导入本地图片并识别，几百张图片都可以，如果实在太多，还可以设置完成后自动关机。支持?txt / jsonl / md / csv(Excel) 等多种格式，

忽略区域：批量OCR中的一种非常有用的功能，适用于排除图片中的不想要的文字，比如我这张网站截图，我不需要识别网址，那就给他拖拽出一个深灰色的框，这样软件就不会忽略这个区域了。

这个功能真的太爽了！进一步减少了OCR识别后再手动删除文本的繁杂操作。

二维码：可截图/粘贴/拖入本地图片来识别二维码的内容，同时也支持输入文本创建新的二维码，非常方便！

文章来源:https://blog.csdn.net/hardworkman/article/details/135649620
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！