使用 nokogiri ruby 编辑 html 文档中的 img 标签

Edit img tags in html document with nokogiri ruby

我想使用 nokogiri 编辑 html 文档中的 img 标签。

例如,我目前在文档中有以下 img 标记:

<img src="image1.jpg">

图片命名不一致。我想做的是将上面的 img 转换成下面的:

<img src="/User/account/folder1/folder2/image1.jpg">

例如,我将 /User/account/folder1/folder2/ 存储在一个变量中。

文档在每个文档中可以包含 1 到 20 个图像标签,但路径始终相同。

在转换结束时,我想采用修改后的 html 并将其存储到变量中

  doc = Nokogiri::HTML(open(file))

我可以打开该文档,但我不确定如何进一步迭代它。

有人可以帮忙吗?

最终实现了我想要的:

page = Nokogiri::HTML(open(file))
  page.css('img').each do |div|
    image = div.attribute("src")
    div.set_attribute("src", ("#{absolute_path}""#{image}") )
    puts div.attribute("src")
  end

  amended_page = page.to_html

值得注意的是 absolute_path 是一个在此之外的变量集,通常类似于 User/account/folder/