彩票走势图

PDF处理控件Aspose.PDF功能演示:从PDF的表格中提取数据

翻译|使用教程|编辑:胡涛|2022-02-21 15:08:12.040|阅读 568 次

概述:在工作生活中,我们经常可能会需要将PDF数据进行提取,以便对数据进行相关操作,鉴于此需求,本文将介绍如何使用 Java 从 PDF 表中提取数据!

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

相关链接:

在本文档中,我们将快速帮助您使用 Visual Studio 完成一个关于 Spire.Doc 的简单演示。在开始之前,请确保您的计算机上安装了 Spire.Doc for .NET 和 Visual Studio(2008 或更高版本)。

Spire.Doc for .NET最新下载

Aspose.PDF for Java最新下载

1. 在 Visual Studio 中,依次单击File、New、Project,如果要创建 C# 项目,请选择Visual C#、Windows并选择Windows Forms Application并将项目命名为HelloWorld,单击OK。如果要创建Visual Basic项目,请选择Visual Basic、Windows Forms Application并将项目命名为HelloWorld,单击OK。  

PDF是当今主流的文档格式之一,它支持文本、图形、表格、注释和一系列其他元素。在某些情况下,您可能需要从 PDF 文档(例如发票)的表格中提取数据,为了实现这一点,本文将介绍使用Aspose.PDF for Java从PDF 中的表格中提取数据。

Java API 从 PDF 中的表中提取数据:
Aspose.PDF for Java 是一个功能丰富的 API,用于创建和操作 PDF 文档,我们将使用此 API 从 PDF 文档中的表格中提取数据。您可以 下载 API 的 JAR 或使用以下 Maven 配置将其安装在您的 Java 应用程序中。

<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>//repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>21.9</version>
</dependency>

使用 Java 从 PDF 中的表格中提取数据:
以下是使用 Java 从 PDF 中的表中提取数据的步骤:

  • 首先,使用Document类加载 PDF 文档。
  • 使用Document.getPages()集合循环浏览 PDF 中的页面。
  • 在每次迭代中,初始化TableAbsorber对象并使用TableAbsorber.visit(Page)方法访问选定的页面。
  • 在嵌套循环中,遍历TableAbsorber.getTableList()集合中的表列表。
  • 对于集合中的每个AbsorbedTable,遍历AbsorbedTable.getRowList()中的行集合。
  • 对于集合中的每个AbsorbedRow,遍历AbsorbedRow.getCellList()中的单元格集合。
  • 最后,循环遍历每个 AbsorbedCell 的TextFragment集合并打印文本。

从 PDF 页面的特定区域提取表格:
以下是使用 Java 从 PDF 中页面的特定部分提取表格的步骤:

  • 首先,使用Document类加载 PDF 文档。
  • 然后,从Document.getPages()集合中选择所需的页面。
  • 提取页面的 Square 注释。
  • 在每次迭代中,初始化TableAbsorber对象并使用TableAbsorber.visit(Page)方法访问选定的页面。
  • 在嵌套循环中,遍历TableAbsorber.getTableList()集合中的表列表。
  • 检查吸收的表格是否在所需的页面区域中。
  • 对于集合中的每个AbsorbedTable ,使用AbsorbedTable.getRowList()遍历行集合。
  • 对于集合中的每个AbsorbedRow ,使用AbsorbedRow.getCellList()遍历单元格集合。
  • 最后,循环遍历每个 AbsorbedCell 的TextFragment集合并打印文本。

更多ASPOSE文档管理控件


标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
相关产品
Aspose.PDF for Java

Aspose.PDF for Java是一种轻量级的处理API,可用代码处理PDF文档。

Aspose.PDF for .NET

PDF文档创建组件,无需Adobe Acrobat,也可以在任何平台上操作PDF文档。

Aspose.Pdf.Kit for Java

Aspose.PDF.Kit是一个无图形用户界面的处理PDF文档的.NET控件,它使.NET开发者能管理已有的PDF文件。

Aspose.Pdf for Android via Java

Aspose.Pdf for Android是一款功能丰富的PDF文档创建和操作组件。

Aspose.Total

Aspose.Total 能为.NET和JAVA应用程序增加图表、电子邮件、拼写检查、条码、流程、文件格式管理等功能。

title
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP