彩票走势图

Word处理控件Aspose.Words功能演示:使用 C++ 以编程方式将 Word 转换为 HTML 、MHTML

翻译|使用教程|编辑:胡涛|2023-01-31 11:35:34.653|阅读 86 次

概述:本文介绍如何使用 C++ 以编程方式将 Word 转换为 HTML 、MHTML,欢迎查阅

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

相关链接:

aspose下载

Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务。API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word。此外,

Aspose API支持流行文件格式处理,并允许将各类文档导出或转换为固定布局文件格式和最常用的图像/多媒体格式。

Aspose.words 最新下载

HTML 格式之所以流行,是因为几乎所有计算机环境都支持它。WORD 到 HTML 或 MHTML 的转换在需要使用 C++ 在 Web 应用程序中显示此类文件等情况下很有用。Aspose.Words for C++ API 因其特性和效率而成为最佳选择。您可以通过将 Microsoft Word 文件 (DOC/DOCX) 转换为 HTML 或 MHTML 格式的功能来丰富您的 C++ 应用程序。以下是本文的大纲,我们将在其中详细探讨 Word 转换:

一、C++ Microsoft Word 文件转换器 API – 安装

我们需要安装 Aspose.Words for C++ API 来转换 Microsoft Word (DOCX/DOC) 文件。您可以轻松地从NuGet库安装 API或在控制台上使用以下命令安装它。

Install-Package Aspose.Words.Cpp -Version 20.8.0
二、使用 C++ 将 Word (DOCX/DOC) 转换为 HTML

当您想要呈现内容以便在浏览器中显示时,Word 到 HTML 的转换很有用。您的 C++ 应用程序可以通过以下步骤快速执行转换:

  1. 加载源字文件
  2. 以 HTML 格式保存文档

下面的代码显示了如何使用 C++ 将 word 转换为 HTML:

// Load the document from
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Save the word document in HTML format
doc->Save(u"Document_out.html", SaveFormat::Html);
三、使用 C++ 将 Word 转换为带有嵌入式字体的 HTML

word 文件 (DOCX/DOC) 可能包含某些平台可能不支持的自定义字体。在这种情况下,字体在输出结果中可能会出现乱码。但是,Aspose.Words for C++ API 允许您使用 Base64 编码将字体资源嵌入到 HTML 中。您可以设置 ExportFontsAsBase64 属性,该属性将在输出 HTML 文件中嵌入字体。您需要按照以下步骤来实现这些要求:

  1. 加载源 DOCX 文件
  2. 设置ExportFontsAsBase64属性
  3. 保存输出的 HTML 文件

以下代码片段显示了如何使用 C++ 将 Word 转换为带有嵌入式字体的 HTML:

// Load source DOCX file
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// Initialize HtmlSaveOptions object
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// Save output HTML
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

此外,如果您使用记事本编辑 HTML 文件,或在浏览器中查看源代码,您会注意到文件中嵌入了 Base64 字体。以下屏幕截图显示了输出 HTML 文件的示例:

将 Word 转换为 HTML

四、使用 C++ 中的往返信息将 Word 转换为 HTML

Microsoft Word 文档可以包含很多信息和功能,而这些信息和功能在 HTML 文件格式中是不支持的。有时您需要将 Word 转换为 HTML,然后再转换回 Word 格式。为了确保这些转换之间的最大保真度,一些被称为“往返信息”的信息可以由 Aspose.Words for C++ API 额外保存。让我们按照以下步骤来测试这样的转换:

  1. 加载源 DOCX 文件
  2. 将ExportRoundtripInformation设置为 true
  3. 保存输出的 HTML 文件

下面的代码片段显示了如何使用 C++ 将 Word 转换为带有往返信息的 HTML:

// Load input DOCX file
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// Set HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// Save output HTML file
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);
五、在 C++ 中将 Word 转换为 MHTML

MHTML 文件格式很受欢迎,因为它包含单个输出文件中的所有内容。您可以使用 C++ 通过以下步骤将 Word 文件 (DOCX/DOC) 转换为 MHTML 格式:

  1. 加载源 DOCX 文件
  2. 以 MHTML 格式保存输出

下面的代码片段显示了如何使用 C++ 将 Word 转换为 MHTML:

// Load the document into Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Save output in MHTML format.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

以上便是使用 C++ 以编程方式将 Word 转换为 HTML 、MHTML ,要是您还有其他关于产品方面的问题,欢迎咨询我们,或者加入我们官方技术交流群。


欢迎下载|体验更多Aspose产品

点此获取更多Aspose产品信息 或 加入Aspose技术交流群(761297826

标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP