彩票走势图

用Aspose在Hadoop上处理Binary文件格式

原创|行业资讯|编辑:龚雪|2013-11-01 09:11:17.000|阅读 149 次

概述:Aspose for Hadoop project的第一个版本已经发布,它让开发人员能够处理若干文件格式。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

Apache Hadoop有通过其灵活的分布式文件系统(HDFS)跨节点奖大数据归档的强大能力。这个大数据解决方案还有着MapReduce Framework的技术支持,使开发人员能通过其APIs分析已归档的大数据。大数据可能是结构化或者非结构化的,并且可能以任意文件格式呈现。请记住,Aspose for Hadoop project的第一个版本已经发布,它让开发人员能够处理若干文件格式。以下就是初始版本所支持的文件格式:

  • Microsoft Word (DOC)
  • WordprocessingML (DOCX, XML)
  • Rich Text Format (RTF)
  • HTML, XHTML and MHTML
  • OpenDocument (ODT)
  • Microsoft Excel (XLS)
  • SpreadsheetML (XLSX, XML)
  • OpenDocument Spreadsheet (ODS)
  • PresentationML (PPTX, XML)
  • Outlook Emails (MSG)

使用Aspose for Hadoop project,Hadoop开发人员能够任意上述格式中解析文本,接下来文本可以被用于MapReduce分析算法或者取决于用户事件的任意目的。

  • com.aspose.hadoop.core——提供Aspose for Java wrapper类来从上述格式中解析文本。包裹包含几个类来覆盖Hadoop输入格式,从而使二进制序列文件可以被创建。
  • com.aspose.hadoop.examples——为创建和转换二进制序列文件提供映射实例。

标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn

文章转载自:慧都控件网

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP