使用 nokogiri ruby 编辑 html 文档中的 img 标签
Edit img tags in html document with nokogiri ruby
我想使用 nokogiri 编辑 html 文档中的 img
标签。
例如,我目前在文档中有以下 img
标记:
<img src="image1.jpg">
图片命名不一致。我想做的是将上面的 img
转换成下面的:
<img src="/User/account/folder1/folder2/image1.jpg">
例如,我将 /User/account/folder1/folder2/
存储在一个变量中。
文档在每个文档中可以包含 1 到 20 个图像标签,但路径始终相同。
在转换结束时,我想采用修改后的 html 并将其存储到变量中
doc = Nokogiri::HTML(open(file))
我可以打开该文档,但我不确定如何进一步迭代它。
有人可以帮忙吗?
最终实现了我想要的:
page = Nokogiri::HTML(open(file))
page.css('img').each do |div|
image = div.attribute("src")
div.set_attribute("src", ("#{absolute_path}""#{image}") )
puts div.attribute("src")
end
amended_page = page.to_html
值得注意的是 absolute_path
是一个在此之外的变量集,通常类似于 User/account/folder/
我想使用 nokogiri 编辑 html 文档中的 img
标签。
例如,我目前在文档中有以下 img
标记:
<img src="image1.jpg">
图片命名不一致。我想做的是将上面的 img
转换成下面的:
<img src="/User/account/folder1/folder2/image1.jpg">
例如,我将 /User/account/folder1/folder2/
存储在一个变量中。
文档在每个文档中可以包含 1 到 20 个图像标签,但路径始终相同。
在转换结束时,我想采用修改后的 html 并将其存储到变量中
doc = Nokogiri::HTML(open(file))
我可以打开该文档,但我不确定如何进一步迭代它。
有人可以帮忙吗?
最终实现了我想要的:
page = Nokogiri::HTML(open(file))
page.css('img').each do |div|
image = div.attribute("src")
div.set_attribute("src", ("#{absolute_path}""#{image}") )
puts div.attribute("src")
end
amended_page = page.to_html
值得注意的是 absolute_path
是一个在此之外的变量集,通常类似于 User/account/folder/