文章首发于公众号【小白书签】:https://mp.weixin.qq.com/s/eC_Zf74jcvvYzULCaEelEQ
以下工具适合在电脑上使用,如果电脑装有 QQ 的话,其实也可以使用 QQ 自带的“屏幕识别”功能来实现 OCR 效果,其默认快捷键是“Ctrl+Alt+O”。不方便使用 QQ 的环境,或追求更强大的功能,亦或者需要离线识别,请继续往下看 ↓↓↓
OCR 软件
Umi-OCR
免费、开源、可批量的离线 OCR 软件,适用于 Windows x64 、Linux x64 系统。
Umi-OCR 文字识别工具具有如下特点:
- 免费:本项目所有代码开源,完全免费。
- 方便:无需安装,解压即用,离线运行,无需网络。
- 功能:截图 OCR / 批量 OCR / PDF 识别 / 二维码 / 公式识别
- 高效:自带高效率的离线 OCR 引擎,内置多种语言识别库。
- 精准:除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。
PandaOCR.Pro
PandaOCR.Pro 专业版是 PandaOCR 的重构版。
相对于 PandaOCR,主要做了以下优化增强:
- 重构了整个程序,优化了程序逻辑,所以理论上它应该更稳定,更简洁和更快速
- 保留了 PandaOCR 的大部分功能,同时也精简了少许可能会影响性能且不太常用的功能
- 增加了调用本地接口高级功能,专为开发者准备
- 增加了多种离线 OCR 引擎调用能力,满足各种识别需求
- 增加了一些朋友需要的按 OCR 位置进行排版的功能,虽然目前还只是实验性,但日后还有优化空间
- 优化了行首缩进功能,旧版强行在行首添加多个空格蹩脚实现,现在改由编辑框原生显示,提升识别速度且更美观
- 优化了边角触发截图,解决在旧版中容易误触发的问题
- 优化了程序界面,使之看上去更精简干净,且基本保留了旧版的样式和操作方式,老人们可以无缝切换
- 优化了截图组件,现在你可以在截图时快速选择应该使用哪类引擎识别,如搜图,扫码,上传图床或识别公式,而不用在程序界面频繁切换
- 优化了设置操作,多数设置可直接在程序界面中切换或修改,减少频繁手工编辑配置文件,为新手在使用上提供便利
- 优化了预览弹窗,并可以调整弹窗本身、弹窗文字、弹窗按钮的位置或样式
- 优化了图像编码,专业版使用更好的 GDI 转码图像,解决在旧版中因转码两次导致图像质量降低而影响文字识别或漏字
- 修复了 PandaOCR 上恢复焦点窗口时常失效的老问题
TTime
严格来说 TTime 是一款简洁高效的输入、截图、划词翻译软件,不过它同样拥有 OCR 功能(截图 OCR、静默截图 OCR)。
- 截图翻译:按下截图翻译快捷键(默认 Alt + W),截取需要翻译的区域 截图翻译
- 划词翻译:选中需要翻译的文本之后,按下划词翻译快捷键即可(默认 Alt + E) 划词翻译
- 输入翻译:按下输入翻译快捷键(默认 Alt + Q),输入需要翻译的文本,Enter 键翻译 输入翻译
- 悬浮球翻译:选中需要翻译的文本之后,点击悬浮球图标即可 (默认关闭,需要自行在设置中开启) 悬浮球翻译
- 截图 OCR:按下此快捷键将会根据你截图区域进行文字识别 截图 OCR
- 截图静默 OCR:按下此快捷键将会根据你截图区域进行文字识别,识别的内容自动写入剪贴板不会打开 OCR 窗口
下载地址
其中 Windows Umi-OCR 分为:Rapid 引擎插件版 和 Paddle 引擎插件版。
Rapid 引擎插件版——速度稍慢,内存占用低,适合低配机器,兼容性好。
Paddle 引擎插件版——性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动 CPU。
https://pan.quark.cn/s/69e81ee4f137
https://drive.uc.cn/s/4c08af0ae41f4
https://www.123pan.com/s/hieA-6qsxH
https://pan.baidu.com/s/12DGGcoThMuqniT1kShcr6w?pwd=ba6j
https://url26.ctfile.com/d/948726-40859895-e77f15?p=210201 (访问密码: 210201)
评论0