这个开源项目是提取视频中字幕的开源项目,提取视频中的关键帧,检测视频帧中文本的所在位置,识别视频帧中文本的内容。
不知道大家有没有做笔记的习惯,这个开源项目就很方便的把你一个视频中的字幕提取出来,方便记录关键内容。
开源地址:https://github.com/YaoFANGUK/video-subtitle-extractor
这个开源项目也是关于记录关键信息的场景,如果视频或者某个图片中有你感兴趣的关键信息,你又懒得打字记录下来,这个开源的截屏 OCR 可以帮助你。
只需要对视频中的 PPT 截屏,就能提取出 PPT 中的文字,方便记录下来。不要问为什么不直接保持图片,这个看个人习惯,我更喜欢可编辑的内容。
开源地址:https://github.com/amebalabs/TRex
开源地址:https://github.com/schappim/macOCR
另外一个是语音转文字的仓库,里面包含了很多借助 Google API 进行语音转文字的示例。有时候,我懒得看视频,就一键把语音转成文字,保存下来慢慢看。
开源地址:https://github.com/opensourceteams/google-sdk-speech-to-text
开源地址:https://github.com/PaddlePaddle/PaddleSpeech
?
原文链接: