彩票走势图

LEADTOOLS 入门教程: 使用 OCR 将图像转换为可搜索的 PDF - C# .NET Core

翻译|使用教程|编辑:胡涛|2022-12-02 14:18:59.450|阅读 108 次

概述:本教程展示了如何使用 LEADTOOLS SDK 在 C# .NET Core 应用程序中设置 LEAD OCR 引擎以对光栅化图像进行 OCR。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

相关链接:

慧都年终大促

LEADTOOLS是一个综合工具包的集合,用于将识别、文档、医疗、成像和多媒体技术整合到桌面、服务器、平板电脑、网络和移动解决方案中,是一项企业级文档自动化解决方案,有捕捉,OCR,OMR,表单识别和处理,PDF,打印捕获,归档,注释和显示功能。利用业界领先的图像处理技术,能够智能识别文件,可以用来识别任何类型的扫描或传真形式的图像。

LEADTOOLS 最新下载

本教程展示了如何使用 LEADTOOLS SDK 在 C# .NET Core 应用程序中设置 LEAD OCR 引擎以对光栅化图像进行 OCR。

概述
概括 本教程介绍如何使用 LEAD OCR 引擎在 C# .NET Core 控制台应用程序中将光栅图像转换为可搜索的 PDF。
完成时间 30分钟
视觉工作室项目
平台 C# .NET Core 控制台应用程序
集成开发环境 视觉工作室 2019、2022
开发许可 LEADTOOLS
用另一种语言试试
  • C# :.NET 框架(控制台)、. NET 核心、.NET 框架(WinForms)
  • 苹果:macOS
  • C API:C DLL (Windows)
  • Java
所需知识

在使用文件观察器转换文件 - C# .NET Core教程之前,通过查看添加引用和设置许可证教程熟悉创建项目的基本步骤。

创建项目并添加 LEADTOOLS 引用

从添加引用和设置许可证教程中创建的项目副本开始。如果您没有该项目,请按照该教程中的步骤创建它。

所需的参考取决于项目的目的。可以通过 NuGet 包添加引用。

本教程需要以下 NuGet 包:

  • Leadtools.Document.Sdk

有关您的应用程序需要哪些 DLL 文件的完整列表,请参阅中的文件。

设置许可证文件

许可证解锁项目所需的功能。它必须在调用任何工具包函数之前设置。有关详细信息,包括针对不同平台的教程,请参阅设置运行时许可证。

有两种类型的运行时许可证:

  • 评估许可证,在下载评估工具包时获得。它允许评估工具包。
  • 部署许可证。如果需要部署许可证文件和开发人员密钥,请参阅获取许可证。

笔记

添加 LEADTOOLS NuGet 引用和设置许可证在添加引用和设置许可证教程 中有更详细的介绍。

添加 IOcrEngine 并转换为可搜索的 PDF 代码

创建项目、添加参考和设置许可证后,就可以开始编码了。

在解决方案资源管理器中,打开Program.cs。将以下语句添加到using顶部的块中Program.cs。

【C#】

using System;
using System.IO;
using Leadtools;
using Leadtools.Document.Writer;
using Leadtools.Ocr;

在Main()方法内部,在设置的许可证代码下方,创建两个名为input和的新字符串output。将input字
符串值设置为光栅化图像文件路径。将output字符串值设置为您希望将创建的可搜索 PDF 保存到的
文件路径。出于本教程的目的,使用了以下文件路径中的示例图像:C:\LEADTOOLS22\Resources\Images\OCR1.TIF

【C#】

static void Main(string[] args)
{
if (!SetLicense())
Console.WriteLine("Error setting license");
else
Console.WriteLine("License file set successfully");

string input = @"C:\LEADTOOLS22\Resources\Images\OCR1.TIF";
string output = @"C:\LEADTOOLS22\Resources\Images\OCR1.PDF";

OCR(input, output);
}

Program向名为的类添加一个新方法OCR(string inputFile, string outputFile)。OCR()在字符串值下方的方法内调用方法Main(),如上所示。将下面的代码添加OCR()到初始化IOcrEngine、OCR 光栅图像并将图像导出到可搜索的 PDF 文档的方法中。

【C#】

static void OCR(string inputFile, string outputFile)
{
using (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD))
{
// Startup the LEADTOOLS OCR Engine
ocrEngine.Startup(null, null, null, null);
// Run the AutoRecognizeManager and specify PDF format
ocrEngine.AutoRecognizeManager.Run(inputFile, outputFile, DocumentFormat.Pdf, null, null);
Console.WriteLine($"OCR output saved to {outputFile}");
}
}

运行项目

按F5或选择Debug -> Start Debugging运行项目。

如果步骤正确,应用程序将运行并将目录中的所有 JPEG 文件Images转换为 TIFF,并将目录中的所有 TIFF 文件转换Images为可搜索的 PDF。所有转换后的文件应输出到此文件夹:<INSTALL_DIR>\LEADTOOLS22\Resources\Images\Converted

以上便是使用文档转换器转换文件 - .NET Core ,如果您还有其他疑问,欢迎咨询我们或者加入我们官方技术交流群。


欢迎下载|体验更多LEADTOOL产品

您还可以加入产品技术交流Q群:731259648


标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP