umiocr识别工具

umiocr识别工具

版本:v2.1.5
类别:系统工具
大小:128m
时间:2025-04-23

游戏介绍

最新版本的umiocr github离线版供应屏幕截图或拖入图片转换为文本的作用;可进行批量导入文档辨认笔墨,并能拔除pdf、xps等规格文件;生成二维码或识读条形码等多种操纵。无需登录和付费,彻底免费运用!

numi-ocr识别软件介绍

umiocr最新版本的作用之一是批量导入土产图片,并辨认此中的文本内容,将其输出到软件面板或土产txt文件中。除了拔除一般图片,该软件还还有忽略特定地区的特点,特殊适用于拔除含水印的视频截图、游戏截图等拥有ui/按钮的图像。用户能够经过配置来扫除指定地区内不指望被辨认的笔墨,比方提取字幕文本而不滋扰到水印或其他ui元素。这款软件的策划初衷是为了协助大量影视和游戏截图的收拾整顿和查找,尤其是需求从这些图片中提取台词或字幕时尤其有效。在拔除大量截图后,用户能够将每个图片转换成笔墨,并运用ctrl+f作用快捷定位特定的笔墨信息,从而大大提高了工作效率。

umiocr识别工具功能

免费:本项目一切代码开源,彻底免费。

便利:解压即用,离线运转,无需网络。

高效:自带高效率的离线ocr引擎,内置多种语言辨认库。

灵便:支持命令行、http接口等外部挪用方法。

作用:截图ocr / 批量ocr / pdf辨认 / 二维码 / 公式辨认

umiocr官方下载安装教程

弹出解压序幕,发起放到c盘之外;

解压达成后,去解压序幕,点击 umi-ocr.exe 便可启动程序。

软件宣布包下载为.7z.exe自解压包,解压后,运转umiocr.exe便可;

umiocr使用说明

按住右键,绘制多个矩形框。这些地区内的笔墨将在使命中被忽略。

文档辨认:

单栏-保存缩进:适用于解析代码截图,保存行首缩进和行中空格。

支持规格:jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff。

支持使命达成后自动关机/待机。

um-ocr支持多种言语界面,在初次运用时依据电脑系统言语自动切换。

对扫描件进行ocr,或提取原有文本。可输出为 双层可搜索pdf 。

请尽可能将矩形框画得大一些,彻底包裹住水印一切可能涌现的位置。

截图ocr:张开这一页后,就能够用快捷键唤起截图,辨认图中的笔墨。

也支持在别处复制图片,粘贴到umi-ocr进行辨认。

要是要辨认像素超大的长图或大图,请调整:页面的配置→笔墨辨认→限度图象边长→调高数值。

单栏-按自然段换行/老是换行/无换行:与上述相似,不外 不区分多栏规划。

此计划可自动拔除横排与竖排的笔墨排版,且无需依附ocr引擎。

没有数量上限,可一次性导入几百张图片进行使命。

二维码

一键添加快捷方法或配置开机自启。

右侧的辨认记实栏,能够编纂笔墨,许可划选多个记实复制。

全局配置

文本后拔除

忽略地区

全局配置:在这里能够调整软件的全局参数。经常使用作用如下:

支持规格:pdf, xps, epub, mobi, fb2, cbz。

左边的图片预览栏,可直接用鼠标划选复制。

切换界面主题。umi含有多个亮/暗主题。

标签页

- 在ocr技艺中,对文本进行排版解析可提升读取尝试,并优化信息通报成效。

截图/粘贴/拖入土产图片,读取此中的二维码、条形码。

扫码:

输入文本,生成二维码图片。

多栏-老是换行:每段语句都进行换行。

批量ocr:这一页用于批量导入土产图片进行辨认。

关于 ocr文本后拔除 - 忽略地区: 批量ocr中的一种特别作用,适用于扫除图片中的不想要的笔墨。

生成码:

支持一图多码。

如上方样例,图片顶部和右下角存在多个水印 / logo。要是批量辨认这类图片,水印会对辨认了局造成滋扰。

文档辨认

关于 公式辨认 作用

支持设定 忽略地区 ,可用于扫除页眉页脚的笔墨。

界面言语

细致,惟独处于忽略地区内的全部文本块(而不是单个字符)会被忽略。如图所示,黄色边框的深色矩形是一个忽略地区。那么惟独key_mouse才会被忽略。但是,pubsub_connector.py、pubsub_service.py 这两个文本块得以保存。

在批量辨认页的右栏配置中可进入忽略地区编纂器。

切换ocr插件。

多栏-无换行:强制将一切语句归并到同一行。

aztec,codabar,code128,code39,code93,databar,databarexpanded,datamatrix,ean13,ean8,itf,linearcodes,matrixcodes,maxicode,microqrcode,pdf417,qrcode,upca,upce

衬着器:软件界面默许支持显卡加速衬着。要是在你的机械上涌现截屏闪动、ui错位的状况,请调整界面和表面 → 衬着器 ,体验切换到不一样衬着计划,或封闭硬件加速。

可配置使命达成后 自动关机/休眠 。

多栏-按自然段换行:适合大部分情形,自动辨认多栏规划,按自然段划定规矩进行换行。

支持19种协定和纠错品级等参数。

不做拔除:ocr引擎的原始输出,默许每段语句都进行换行。

截图ocr

要是需求手动切换言语,请参考下图,全局配置→言语/language 。

调整界面笔墨的巨细和字体。

批量ocr

支持19种协定,如下:

含有特别作用 忽略地区 。

变动界面言语。umi支持繁中、英语、日语等言语。

留存辨认了局的支持规格:txt, jsonl, md, csv(excel)。

标签栏左上角可切换置顶窗;右上角能锁定标签,防误触封闭。

与截图ocr一样,支持文本后拔除作用,收拾整顿ocr文本的排版和次序。

umi-ocr v2 由一系列灵便好用的标签页构成。您可遵照本人的爱好,张开需求的标签页。

更新内容

修复:linux版本截图时,体系任务栏推移顶层窗口,以致截图位置偏移。

修复:文档辨认提取pdf自带的文本内容时,未思索页面扭转的影响。

新增:调整二维码生成相关参数后,自动革新二维码生成。

修复:文档辨认生成单层pdf时,未写入原pdf自带的文本内容。

新增日记作用:运用命令行启动 umi-ocr 后可检察及时日记。初级日记(error及以上)存储在指定序幕,并可在全局配置中调整留存级别。

修复:linux版本截图后,主窗口的位置与操纵前不一致。

新增:大部分标签页能手动切换阁下/高低双栏模式。

windows 版本更新第三方依附库:pymupdf 1.24.11 ,fonttools 4.56.0 ,pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0

新增ui言语:俄语

修复:ocr了局展示列表的一些显现bug和鼠标划选bug。

修复:http接口 /api/doc/download 参数 ignore_blank 的同伴。

新增:命令行指令 --reload ,用于从新加载配置文件。

新增:esc键隐蔽主窗口。

修复:调整标签页次序或删除标签页后,未及时留存次序信息。

优化:图片和文档的异步加载机制。加载超出个文件后仍能流利进行,及时预览进度。