全站导航
Umi-OCR文字识别工具电脑多语言版是一款强大而高效的免费OCR软件,专为Windows操作系统设计,支持多种语言的识别,并提供批量处理功能。该工具无需网络即可进行文字识别,用户可以将识别后的文字导出为多种文件格式,拥有多个字符识别库,以满足不同用户的需求。如果你有需求,快来下载并体验吧!
快速开始
启动主程序后,您可以将任意的图片或文件夹拖入窗口中的白色区域,或点击左上角的“浏览”按钮手动选择图片。
如果拖入的是文件夹,程序将自动加载该文件夹中所有符合支持格式的图片文件。
点击右上角的“开始任务”按钮,程序会开始识别并显示进度条。
在任务进行过程中,您可以随时点击“终止任务”来停止当前任务,但下一次开始时,识别将从头开始。
点击“识别内容”选项卡查看输出的文字,或直接进入第一张图片所在的文件夹查看识别后的txt文件。
在“识别内容”选项卡,您还可以一键复制所有文本内容到剪贴板。
基础设置
点击“设置”选项卡,您可以配置相关参数。大部分设置会自动保存,除非更改了输出目录或文件名等。
要忽略某些区域内的文字,您可以点击“添加区域”按钮,配置忽略区域。具体操作方式请参考后续说明。
如果需要清空已设置的所有忽略区域,可以点击“清空区域”按钮。
在配置忽略区域后,上方的提示会显示当前忽略区域的生效分辨率。
输出设置:
如果不希望生成本地文件,可以取消“将识别内容写入本地文件”选项,只能在“识别内容”选项卡中查看输出结果。
若勾选“输出调试信息”,程序将额外输出运行状态信息。
勾选“忽略无文字的图片”后,若图片中没有文字或文字被忽略区域遮挡,图片名称将不会出现在输出文件中。
如果希望生成适合浏览的Markdown文件,可取消勾选相关选项。
在v1.2版本中,新增了两种输出风格:纯文本.txt文件和Markdown风格.md文件,后者可在浏览器中以图文并茂的形式展示。
v1.2.2版本新增了任务完成后自动用系统默认编辑器打开输出文件或文件夹的功能(不生成本地文件时无效)。
输出目录和文件名:您可以在设置中指定输出文件的存储位置和文件名。
若输出目录和文件名未设置,程序会自动将输出文件保存在第一张图片的父目录,文件名为 [转文字]_{父目录}.txt。
点击“清空表格”按钮不仅会清空图片列表,还会重置输出目录和文件名设置,以便重新选择新的保存路径。
识别器设置:
您可以配置当前使用的OCR识别程序路径,及允许加载的图片后缀格式。
在大多数情况下,默认设置即可正常使用。
忽略区域功能
“忽略区域”是Umi-OCR的一大特色功能,能帮助用户在处理图片时排除干扰因素。例如,可以在批量识别视频截图时,排除水印或在游戏截图中去除UI干扰,从而提高识别精度。
忽略区域指的是图片上特定位置和大小的矩形区域,完全位于这些区域内的文字块将被排除。
在“设置”选项卡中,点击“添加忽略区域”按钮,进入设置页面。
将图片拖入窗口,您可以预览图片,并调整忽略区域的设置。您可以切换不同图片来调整忽略区域。
绘制忽略区域:点击“+忽略区域”按钮,在图片上按住左键拖动,绘制出矩形区域。您可以撤销或重新绘制区域。
完成设置后,点击“完成”返回主窗口,开始识别任务。如不需要应用该区域设置,可以点击右上角的“X”取消。
以下为简单示例:
排除视频截图中的水印:
打开忽略区域设置窗口,拖入一张视频截图。程序会自动识别出文字区域并用虚线框起来。若右上角有水印,点击“+忽略区域”并框住水印区域,点击“完成”后返回主界面开始任务。
排除游戏截图中的UI:
假设有两类游戏截图,分别为A类(对话模式)和B类(历史文本模式)。这两类截图的文字位置不同,您可以分别设置忽略区域来排除UI干扰。
对于A类截图,选择“+忽略区域1”,绘制矩形框住底端UI区域;对于B类截图,绘制矩形框住需要保留的文本区域,并用“+忽略区域2”排除两侧UI区域。
完成设置后,点击“完成”并返回主窗口,开始任务。
批量识别:支持批量导入并同时处理多张图片,大大提升了工作效率。
忽略指定区域:通过设定忽略区域,可以屏蔽水印、UI等干扰内容,提高识别准确率。
多种导出格式:支持输出为txt、md、jsonl等多种文件格式,方便用户后续处理。
即时截屏识别:提供即时截屏功能,可以快速识别屏幕上的文字内容,方便实时使用。
多语言支持:内置简体中文和英文识别库,用户还可以根据需要导入繁体中文、日文、韩文、俄文、德文、法文等语言库,满足不同语言的需求。
UMI-OCR最新版支持水印设置:
1.点击“设置”选项,进入“添加忽略区域”窗口。
2.拖入带有水印的图片进行预览。
3.程序会自动识别文字区域,并用虚线框出。若不想识别某个区域,可以点击“忽略区域”并框住它。
4.点击“完成”返回主窗口,开始任务。
其他特点:
免费开源:Umi-OCR是完全开源的软件,用户可自由使用和修改。
离线运行:无需网络连接,保证隐私安全并提供便捷的OCR体验。
高效快速:基于PaddleOCR-json C++引擎,处理速度通常优于在线OCR服务。
精准识别:使用PPOCR-v3模型,能够高效识别常规文字,并在复杂背景下也能保持较高准确率。
后处理功能:支持忽略区域、排版整理等功能,确保输出的文本干净、整齐。
1.19 MB
应用工具10.0
8.0MB
应用工具10.0
7.39 MB
应用工具10.0
60.5MB
应用工具10.0
59M
应用工具10.0
35MB
应用工具10.0
Umi-OCR
文字识别工具
Copyright © 2019- bestyouhu.com All Rights Reserved
本站所有来自互联网,版权归原著所有。如有侵权,敬请来信告知我们将及时撤销。
健康游戏提示:抵制不良游戏,拒绝盗版游戏,注意自我保护,谨防受骗上当,适度游戏益脑,沉迷游戏伤身,合理安排时间,享受健康生活