提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:胡涛|2022-10-20 09:57:29.703|阅读 101 次
概述:本文主要介绍如何使用leadtools自动识别和处理表单,欢迎查阅~
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
相关链接:
LEADTOOLS 是一个综合工具包的集合,用于将识别、文档、医疗、成像和多媒体技术整合到桌面、服务器、平板电脑、网络和移动解决方案中,是一项企业级文档自动化解决方案,有捕捉,OCR,OMR,表单识别和处理,PDF,打印捕获,归档,注释和显示功能。利用业界领先的图像处理技术,能够智能识别文件,可以用来识别任何类型的扫描或传真形式的图像。
本教程展示了如何LEADDocument使用 LEADTOOLS SDK 在 C# .NET Core 应用程序中向 a 添加页面和从中删除页面。
概括 | AutoFormsEngine本教程介绍如何使用C# .NET Core 控制台应用程序中的高级类识别和处理表单。 |
完成时间 | 30分钟 |
视觉工作室项目 | |
平台 | C# .NET Core 控制台应用程序 |
IDE | 视觉工作室 2019、2022 |
开发许可证 | 下载 LEADTOOLS |
在学习从 LEADDocument中添加和删除页面 - C# .NET Core 教程之前,通过查看添加引用和设置许可教程来熟悉创建项目的基本步骤。
从添加引用和设置许可证教程中创建的项目的副本开始。如果您没有该项目,请按照该教程中的步骤创建它。
所需的参考资料取决于项目的目的。可以通过 NuGet 包添加引用。
本教程需要以下 NuGet 包:
有关您的应用程序需要哪些 DLL 文件的完整列表,请参阅您的应用程序中包含的文件。
许可证解锁项目所需的功能。它必须在调用任何工具包函数之前设置。有关详细信息,包括针对不同平台的教程,请参阅设置运行时许可证。
有两种类型的运行时许可证:
创建项目、添加参考和许可证集后,就可以开始编码了。
在解决方案资源管理器中,打开Program.cs. 将以下语句添加using到Program.cs.
【C#】
using System; using System.IO; using Leadtools; using Leadtools.Codecs; using Leadtools.Document; using Leadtools.Forms.Auto; using Leadtools.Forms.Processing; using Leadtools.Forms.Recognition; using Leadtools.Ocr;
将以下全局变量添加到Program类中。
【C#】
static AutoFormsEngine autoEngine; static RasterCodecs codecs; static IOcrEngine ocrEngine; static DiskMasterFormsRepository formsRepository;
Program向名为的类添加一个新方法InitFormsEngines()。调用set license调用下面的InitFormsEngines()方法里面的Main()方法,如下图。
【C#】
static void Main(string[] args) { if (!SetLicense()) Console.WriteLine("Error setting license"); else Console.WriteLine("License file set successfully"); InitFormsEngines(); }
将以下代码添加到InitFormsEngines()方法中以初始化AutoFormsEngine、RasterCodecs、IOcrEngine和DiskMasterFormsRepository对象。
static void InitFormsEngines() { codecs = new RasterCodecs(); ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD); ocrEngine.Startup(codecs, null, null, @"C:\LEADTOOLS22\Bin\Common\OcrLEADRuntime"); formsRepository = new DiskMasterFormsRepository(codecs, @"C:\LEADTOOLS22\Resources\Images\Forms\MasterForm Sets\OCR"); autoEngine = new AutoFormsEngine(formsRepository, ocrEngine, null, AutoFormsRecognitionManager.Default | AutoFormsRecognitionManager.Ocr, 30, 80, true); Console.WriteLine("Engines initialized successfully!"); }
在Program类中添加两个名为RecognizeAndProcessForm()和的新方法ShowProcessedResults(AutoFormsRunResult runResult)。在方法之后调用RecognizeAndProcessForm()方法内部的方法,如下一节所示。在方法的底部调用方法,作为重载传递,如下所示。MainInitFormsEngines()ShowProcessedResults()runResultRecognizeAndProcessForm()
将以下代码添加到RecognizeAndProcessForm()方法中,以根据主表单识别给定表单并处理表单以提取所需信息。
static void RecognizeAndProcessForm() { try { string resultMessage = "Form not recognized"; string formToRecognize = @"C:\LEADTOOLS22\Resources\Images\Forms\Forms to be Recognized\OCR\W9_OCR_Filled.tif"; AutoFormsRunResult runResult = autoEngine.Run(formToRecognize, null); if (runResult != null) { FormRecognitionResult recognitionResult = runResult.RecognitionResult.Result; resultMessage = $@"This form has been recognized as a {runResult.RecognitionResult.MasterForm.Name} with {recognitionResult.Confidence}% confidence."; } Console.WriteLine("Recognition Results:"); Console.WriteLine(resultMessage); Console.WriteLine("========================================================================="); ShowProcessedResults(runResult); } catch (Exception ex) { Console.WriteLine(ex.Message); } }
将以下代码添加到ShowProcessedResults()方法中,以将方法的处理结果显示RecognizeAndProcessForm()到控制台。
// Output Processed Results private static void ShowProcessedResults(AutoFormsRunResult runResult) { if (runResult == null) return; string resultsMessage = ""; try { foreach (FormPage formPage in runResult.FormFields) foreach (FormField field in formPage) if (field != null) resultsMessage = $"{resultsMessage}{field.Name} = {(field.Result as TextFormFieldResult).Text}\n"; } catch (Exception ex) { Console.WriteLine(ex.Message); } if (string.IsNullOrEmpty(resultsMessage)) { Console.WriteLine("Field Processing Results"); Console.WriteLine("No fields were processed"); Console.WriteLine("Press any key to exit . . ."); Console.ReadKey(true); } else { Console.WriteLine("Field Processing Results:"); Console.WriteLine(resultsMessage); Console.WriteLine("Press any key to exit . . ."); Console.ReadKey(true); } }
LEADTOOLS SDK 随附并安装的是样本主表单集和样本填写表单,用于识别和处理。本教程使用这些示例。示例文件安装在<INSTALL_DIR>\LEADTOOLS22\Resources\Images\Forms.
static void Main(string[] args) { if (!SetLicense()) Console.WriteLine("Error setting license"); else Console.WriteLine("License file set successfully"); InitFormsEngines(); RecognizeAndProcessForm(); autoEngine.Dispose(); if (ocrEngine != null && ocrEngine.IsStarted) ocrEngine.Shutdown(); }
如果您想使用内存流加载表单,请在下面的RecognizeAndProcessForm()方法中添加以下代码string formToRecognize = @"C:\LEADTOOLS22\Resources\Images\Forms\Forms to be Recognized\OCR\W9_OCR_Filled.tif";:
【C#】
using (var stream = File.OpenRead(formToRecognize)) { var options = new LoadDocumentOptions(); using (var document = DocumentFactory.LoadFromStream(stream, options)) { // Console commands to double check that the document was loaded properly Console.WriteLine(document.DocumentId); Console.WriteLine("Document loaded"); } }
按F5或选择Debug -> Start Debugging运行项目。
如果正确执行了这些步骤,则会出现控制台并显示以下数据结果:
在此示例中,使用了 W-9 表格。它被正确识别,置信度为 98%(其中 0 表示没有置信度,100% 表示完全置信度)。
以上便自动识别和处理表单 - C# .NET Core ,如果您还有其他疑问,欢迎咨询我们或者加入我们官方技术交流群。
欢迎下载|体验更多LEADTOOL产品
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn
在处理电子表格时,尤其是在专业和数据导向型环境中,正确设置 Excel 单元格内的数字格式至关重要。本文将介绍如何使用 Spire.XLS for Java 设置 Excel 单元格的数字格式,帮助轻松创建精美且结构清晰的电子表格。
从 Visual Paradigm 17.2 版开始,您可以创建自己的项目模板并与团队共享。这样团队成员就可以轻松创建符合团队标准的新项目。本文将指导您完成为团队创建项目模板的过程。
本文主要介绍如何使用DevExpress WinForms Data Grid组件实现固定列,欢迎下载最新版组件体验!
长期以来,Navicat 的数据库管理和开发工具一直都有将协同合作融合到设计理念中。本文将重点介绍如何使用 Navicat Premium 17 共享数据库对象。
20多年的老牌图像处理控件,支持TWAIN扫描、200多种图像效果、150多种图像格式…
LEADTOOLS Document Suite Developer ToolkitLEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。
LEADTOOLS Document Imaging Developer Toolkit多语言的文档图像处理控件,支持光符识别处理、条形码扫描识别等。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@cahobeh.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢