最近基哥在整理项目文档,大量的图片资料需要通过OCR来转录成文字版保存。我习惯性地来到Github上,想找找有没有趁手的开源工具。
不负众望,经过我一番寻找,还是找到了一款好用的免费,开源,可批量的离线的OCR软件——Umi-OCR!目前在Github已经超过了17K Star。
Umi-OCR是基于PaddleOCR开发的,支持截图OCR 、?批量OCR 、二维码等功能。项目所有代码开源免费,解压即用,适用于 Windows7 x64 及以上的电脑系统。
1、软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上,解压文件。
2、软件无需安装。
3、解压后,点击 Umi-OCR.exe 即可启动程序。
Umi-OCR 支持的界面多国语言。
首次打开软件时,将会按照你的电脑的系统设置,自动切换语言,如果需要手动切换语言。
同时支持主题颜色、字体大小等UI界面自定义设置。
Umi-OCR 的功能非常丰富实用,下来由基哥给大家讲解一下:
截图OCR:可以通过拖拽上传图片或者复制图片链接,当然最方便的肯定是直接屏幕截图了,截图完成后会自动进行OCR识别,在右边可以查看识别记录,支持编辑、复制、粘贴文本,相当方便。
段落合并:可以整理OCR完成后文本排版和顺序,使文本更适合阅读和使用。这个功能是真的强,以往的软件识别完成后都是断断续续的,排版还得调很久,这个段落功能直接帮你处理好,可以最大程度地保留原文本的排版结构。
批量OCR:支持批量导入本地图片并识别,几百张图片都可以,如果实在太多,还可以设置完成后自动关机。支持?txt / jsonl / md / csv(Excel) 等多种格式,
忽略区域:批量OCR中的一种非常有用的功能,适用于排除图片中的不想要的文字,比如我这张网站截图,我不需要识别网址,那就给他拖拽出一个深灰色的框,这样软件就不会忽略这个区域了。
这个功能真的太爽了!进一步减少了OCR识别后再手动删除文本的繁杂操作。
二维码:可截图/粘贴/拖入本地图片来识别二维码的内容,同时也支持输入文本创建新的二维码,非常方便!