将带有(有序)列表的 docx 转换为 html
convert docx with (ordered) list to html
我正在尝试将具有多层有序列表的大型 docx 文档转换为 html。 (请参阅此处的文档示例:http://docdro.id/X1oyfBv 您应该下载它)
我尝试了以下方法,包括:
在线转换器,例如 html-cleaner 和 index.html(仅识别列表的一层)
另存为 html - 这会创建一个可怕的文件,但仍然无法识别 ol 结构。
将文件保存为 zip,然后打开 xml 文件,但我没有看到从 w:... 标签中获取 ol 结构的简单方法
将其保存到 google 文档和 运行 Omar Alzabir 的脚本
http://omaralzabir.com/wp-content/uploads/2014/05/GoogleDocsEmail.jpg
顺便说一句。如果我创建一个带有多层有序列表的 word 文件并转换它,它确实会将其识别为 ol's。但是,即使我 'un-list' 并再次列出,现有文件也不会被识别为 ol 的。所以可能原始文档的创建方式有问题 (?)
非常感谢任何建议:) 或关于为什么会出现此问题的指示
您可以使用 pandoc
: https://github.com/jgm/pandoc
这是一个开源的通用命令行工具,用于转换基于标记源的文档文件。
你可以像这样使用它:
pandoc -o output.html input.docx
您是在问如何以 HTML 格式保存带有多级有序列表的 Word 文档吗?
Word-HTML 在其多级有序列表中存在错误。对于列表项,缩进往往不正确且不一致。有一个例子 here.
Word-HTML 在其多级无序列表中也有类似的错误。例如 here.
我最近在 Word 的 HTML 中编写了一个 Python 程序来修复这些错误。该程序是 WordWebNav (WWN) 的一部分,它是免费和开源的。
WWN 是一款将 Microsoft-Word 文档转换为可用网页的应用程序。它在 Word-HTML 网页中添加了一些缺失的功能(例如导航窗格),并修复了 Word-HTML.
中的错误
我正在尝试将具有多层有序列表的大型 docx 文档转换为 html。 (请参阅此处的文档示例:http://docdro.id/X1oyfBv 您应该下载它)
我尝试了以下方法,包括:
在线转换器,例如 html-cleaner 和 index.html(仅识别列表的一层)
另存为 html - 这会创建一个可怕的文件,但仍然无法识别 ol 结构。
将文件保存为 zip,然后打开 xml 文件,但我没有看到从 w:... 标签中获取 ol 结构的简单方法
将其保存到 google 文档和 运行 Omar Alzabir 的脚本 http://omaralzabir.com/wp-content/uploads/2014/05/GoogleDocsEmail.jpg
顺便说一句。如果我创建一个带有多层有序列表的 word 文件并转换它,它确实会将其识别为 ol's。但是,即使我 'un-list' 并再次列出,现有文件也不会被识别为 ol 的。所以可能原始文档的创建方式有问题 (?)
非常感谢任何建议:) 或关于为什么会出现此问题的指示
您可以使用 pandoc
: https://github.com/jgm/pandoc
这是一个开源的通用命令行工具,用于转换基于标记源的文档文件。
你可以像这样使用它:
pandoc -o output.html input.docx
您是在问如何以 HTML 格式保存带有多级有序列表的 Word 文档吗?
Word-HTML 在其多级有序列表中存在错误。对于列表项,缩进往往不正确且不一致。有一个例子 here.
Word-HTML 在其多级无序列表中也有类似的错误。例如 here.
我最近在 Word 的 HTML 中编写了一个 Python 程序来修复这些错误。该程序是 WordWebNav (WWN) 的一部分,它是免费和开源的。
WWN 是一款将 Microsoft-Word 文档转换为可用网页的应用程序。它在 Word-HTML 网页中添加了一些缺失的功能(例如导航窗格),并修复了 Word-HTML.
中的错误