彩票走势图

PDFlib TET PDF IFilter新版来袭,国际化的路线带给您不一样的体验!

原创|产品更新|编辑:龚雪|2015-12-08 15:43:18.000|阅读 244 次

概述:TET PDF IFilter能够从PDF文档中提取文本和元数据,并使其可用于Windows操作系统上的搜索和检索软件。最新发布的版本中进行了功能的改进和优化,越发国际化的路线给我们不一样的全新体验!

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

TET PDF IFilter能够从PDF文档中提取文本和元数据,并使其可用于Windows操作系统上的搜索和检索软件。最新发布的版本中进行了功能的改进和优化,越发国际化的路线给我们不一样的全新体验!

接受PDF格式输入

TET PDF IFilter支持所有PDF输入的相关特点:

  • 所有的PDF版本升级至Acrobat DC Acrobat,包括ISO 32000-1和32000-2
  • 受保护的PDF文件不需要密码就可以打开文档
  • 损坏的PDF文档可以被修复

Unicode的处理

TET PDF IFilter支持各种Unicode处理步骤,可用于提高提取文本的质量:

  • 折叠保存,删除或替换字符,例如从无关文本中删除标点符号和字符
  • 使用一个等效序列或更多其它字符分解替换一个字符,例如替换较窄的,宽的或者垂直的日文字符,或者使用拉丁上标变形字体
  • 文本可以转换为所有的四个Unicode规范化形式,例如发出NFC形式匹配数据库需求

国际化

  • 为了让TET PDF IFilter完全支持中文、日文和韩文。所有的CJK编码都能识别;支持所有的垂直写作模式
  • 文本中语言和区域表示的自动检测,提高了微软的分词和源算法的结果,这对东亚文本来说非常重要
  • 它支持从右到左的语言,例如希伯来和阿拉伯语。语境特征的形式是比较规范化的,文本时按逻辑顺序排列的

<TET PDF IFilter 最新版下载>

PDF不只包含页面

TET PDF IFilter把PDF文档作为一个包含了比普通网页更多信息的容器。TET PDF IFilter能在PDF文档中索引所有相关项目:

  • 页面内容
  • 文本中的书签
  • 元数据(见下文)
  • 嵌入的PDF文件和PDF包/组合递归处理,使所有嵌入到PDF文档中的文本可以被搜索到

XMP文件元数据和文件信息

TET PDF IFilter中先进的元数据实现和对Windows系统的元数据属性的支持。它索引XMP元数据以及标准或自定义文档信息条目。元数据索引可以在几个级别上进行配置:

  • 文档信息条目,都柏林核心领域和其它常见的XMP属性映射到等效的Windows,如标题、主题、作者
  • TET PDF IFilter添加实用的PDF特定伪属性。例如页面大小,PDF/A的一致性水平,字体名称
  • 所有相关的预定义的XMP属性可以被搜索到
  • 用户定义的XMP属性可以被搜索到,例如公司具体的分类属性,PDF/A扩展模式

购买最新版TET PDF IFilter<>,即可拥有最新正版授权!


标签:PDF

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP