提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:况鱼杰|2019-11-13 15:56:09.367|阅读 4532 次
概述:OCR(光学字符识别)会扫描基于图像的文档,识别文本,然后在文本上插入不可见的文本层。本文章将会介绍如何使用PDF-XChange Editor对文档执行OCR。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
相关链接:
PDF-XChange Editor能替代Adobe Reader功能,比任何其他免费的PDF阅读器、查看器和编辑器更小,但功能更加丰富,支持用户在评价模式尝试使用PDF-Xchange免费提供的扩展功能。
OCR
OCR(光学字符识别)会扫描基于图像的文档,识别文本,然后在文本上插入不可见的文本层。文本层包含与文档中识别的文本相同的文本,这意味着可以通过不可见的文本层有效地搜索和选择文档中基于图像的原始文本,这是OCR的主要优势。但是,应注意,文档文本无法以与普通的基于文本的文档相同的方式进行编辑-尽管它是不可见的文本层,但它仍然是基于图像的文档。
请按照以下步骤执行OCR:
单击功能区工具栏中的Convert,然后单击子菜单中的OCR页面。将打开OCR页面对话框:
页面范围选项如下:
选择All即所有页面应用为OCR文档。
选择Current Page仅对当前页面进行OCR。
使用Pages确定在其上执行OCR处理的文档的特定页面。页面范围设置在下文详细说明。
使用Subset选项选择所有页面,仅奇数页或仅偶数页。
识别选项确定OCR流程的语言和准确性。如果所需的语言在下拉菜单中不可用,请单击More Languages以获取更多选项。提高精度会增加过程花费的时间,反之亦然。此外,应注意,如果执行操作的文档具有瑕疵,则将精度设置为较高可能会导致输出异常。这是因为该软件将搜索到更大的深度,并且可能尝试将瑕疵识别为文本。
输出选项确定OCR流程中输出信息的格式。选择创建新的可搜索PDF或保留原始内容并根据需要添加文本层。
创建新的可搜索PDF将复制当前文件并创建一个新的PDF,在其中执行OCR过程。如果您希望使当前文件不受该过程的影响,但是想测试结果,则是一个不错的选择。
保留原始内容,添加文本层将完全按照其暗示的方式运行。保留原始内容,并在其上方放置OCR文字层。此方法不会创建新文档,而是通过添加可搜索文本来更改当前文档。
Quality设置确定新的PDF文档的分辨率,以dpi(每英寸的点数)为单位。
选择Auto Deskew选项以自动纠偏文档。(去歪斜是一个有用的功能,可以矫正歪斜拍摄或扫描的图像)。
最后,单击确定以应用OCR文档。
在许多PDF-XChange Editor对话框中都可以使用页面范围设置。确定页面范围时,请注意以下几点:
使用逗号分隔各个页面。
使用连字符确定页面范围。
如果要定义多个页面范围,请使用逗号分隔页面范围。
在页码前使用破折号确定从文档开头到指定页面的所有页面。例如-7定义了从文档开始到第七页的所有页面。
在页码后使用破折号确定从指定页面到文档末尾的所有页面。例如7-定义了从第七页到文档末尾的所有页面。
是不是非常简单,如果您有如上的问题,那么就可以采用一下这个方法,但是如果还有其他的问题也可以在评论区留言,我们会及时回复的。
PDF-Tools,PDF-XChange Standard、PDF-XChange Editor等产品均已更新至最新版本,感兴趣的朋友可以点击此处,根据自己的需要下载使用。
想要购买PDF-XChange Editor正版授权的朋友,或者获取更多该产品相关信息的朋友可以点击
关注慧聚IT微信公众号 ☟☟☟,了解产品的最新动态及最新资讯。
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn
文章转载自:本文将演示如何使用DevExpress WPF Grid控件实现列和带的固定,欢迎下载最新版组件体验!
在本文中,我们将探讨如何通过使用 JxBrowser 和 Quill.js 将现代富文本编辑器嵌入到 Java 桌面应用程序中,来克服 Swing、JavaFX 和 SWT 中内置编辑器的局限性。
Word 文档中的批注通常用于协作审阅和反馈。这些批注可能包含文本和图片,它们为文档改进提供了重要的参考信息。本文将演示如何使用 Spire.Doc for Java 在 Java 中提取 Word 文档中的批注文本和图片。
本文主要介绍如何使用DevExpress WinForms Data Grid组件实现列重新排序,欢迎下载最新版组件体验!
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@cahobeh.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢