在 r 中合并/合并多个 HTML 文档

Combine / merge multiple HTML documents in r

我有一个包含多个 html 文件的文件夹,我想将这些文件合并到 R 中的一个文件中。可以合并为一个长文件或(理想情况下)一个更花哨的文件 table 的内容。

这是为了创建非常简单的文件来重现问题。

library(tableHTML)
   
   x=data.frame(x=c(1,2,3))
   y=data.frame(y=c(4,5,6))
   
   
   
   tableHTML::write_tableHTML(tableHTML(x), "x.html") 
   
   tableHTML::write_tableHTML(tableHTML(y), "y.html")

我发现这个包 http://richardhooijmaijers.github.io/R3port/ 具有 html_combine 功能。但是,当我尝试下面的代码时,说这不是原始 html 文件是行不通的。

  library(R3port) 
   
   
   html_combine(
     combine = getwd(), #or whichever folder the html files are stored at
     out = "to.html",
     toctheme = TRUE,
     css = paste0(system.file(package = "R3port"), "/style.css"),
     clean = 0
   )

我收到此错误:Error in html_combine(combine = getwd(), out = "to.html", toctheme = TRUE, : no raw html files to combine

我对 HTML 的经验很少,正在寻找有关使用此软件包或任何其他工具来完成任务的指导。结合到 pdf 应该也能工作(我能够使用 adobe 软件做到这一点,但需要通过 R 找到一种方法来自动化脚本)。

谢谢

似乎包 R3port 的函数 html_combine 要求文件具有 rawhtml 扩展名。您可以像这样保存 rawhtml 而不是 html 文件:


library(tableHTML)
library(R3port) 

x=data.frame(x=c(1,2,3))
y=data.frame(y=c(4,5,6))



tableHTML::write_tableHTML(tableHTML(x), "x.rawhtml") 

tableHTML::write_tableHTML(tableHTML(y), "y.rawhtml")

然后使用html_combine得到输出:

html_combine(
  out = "to.html",
  toctheme = TRUE,
  css = paste0(system.file(package = "R3port"), "/style.css"),
  clean = 0
)

结果是这样的: