17K star!Github上最好用的OCR文字识别开源项目,可离线使用!

发布时间:2024年01月17日

最近基哥在整理项目文档,大量的图片资料需要通过OCR来转录成文字版保存。我习惯性地来到Github上,想找找有没有趁手的开源工具。

不负众望,经过我一番寻找,还是找到了一款好用的免费,开源,可批量的离线的OCR软件——Umi-OCR!目前在Github已经超过了17K Star。

图片

产品简介

Umi-OCR是基于PaddleOCR开发的,支持截图OCR 、?批量OCR 、二维码等功能。项目所有代码开源免费,解压即用,适用于 Windows7 x64 及以上的电脑系统。

安装方法

1、软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上,解压文件。

2、软件无需安装。

3、解压后,点击 Umi-OCR.exe 即可启动程序。

图片

Umi-OCR 支持的界面多国语言。

首次打开软件时,将会按照你的电脑的系统设置,自动切换语言,如果需要手动切换语言。

同时支持主题颜色、字体大小等UI界面自定义设置。

功能亮点

Umi-OCR 的功能非常丰富实用,下来由基哥给大家讲解一下:

截图OCR:可以通过拖拽上传图片或者复制图片链接,当然最方便的肯定是直接屏幕截图了,截图完成后会自动进行OCR识别,在右边可以查看识别记录,支持编辑、复制、粘贴文本,相当方便。

图片

段落合并:可以整理OCR完成后文本排版和顺序,使文本更适合阅读和使用。这个功能是真的强,以往的软件识别完成后都是断断续续的,排版还得调很久,这个段落功能直接帮你处理好,可以最大程度地保留原文本的排版结构。

图片

批量OCR:支持批量导入本地图片并识别,几百张图片都可以,如果实在太多,还可以设置完成后自动关机。支持?txt / jsonl / md / csv(Excel) 等多种格式,

图片

忽略区域:批量OCR中的一种非常有用的功能,适用于排除图片中的不想要的文字,比如我这张网站截图,我不需要识别网址,那就给他拖拽出一个深灰色的框,这样软件就不会忽略这个区域了。

这个功能真的太爽了!进一步减少了OCR识别后再手动删除文本的繁杂操作。

图片

二维码:可截图/粘贴/拖入本地图片来识别二维码的内容,同时也支持输入文本创建新的二维码,非常方便!

图片

文章来源:https://blog.csdn.net/hardworkman/article/details/135649620
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。