无法收集分页
Can't collect pagination
while page <= last_page
pagination=("https://www.petsonic.com/snacks-huesos-para-perros/?=#{page}")
puts pagination
doc2=Nokogiri::HTML(Curl.get(pagination).body_str)
links=doc2.xpath('//a[@class="product-name"]/@href')
links.each do |url|
doc3=Nokogiri::HTML(Curl.get(url).body_str)
name1=doc3.xpath('//h1[@class="product_main_name"]').text
puts name1
end
page +=1
end
但是,由于某种原因,它从第一页收集信息 4 次,而不是从所有 4 页收集信息。
可能是什么问题?
编辑:我在 pagination=("https://www.petsonic.com/snacks-huesos-para-perros/?p=#{page}")
中错过了 'p'
结案
这是一个简单的错字。只需更换
pagination=("https://www.petsonic.com/snacks-huesos-para-perros/?=#{page}")
与
pagination=("https://www.petsonic.com/snacks-huesos-para-perros/?p=#{page}")
注意查询参数中的 p
。
while page <= last_page
pagination=("https://www.petsonic.com/snacks-huesos-para-perros/?=#{page}")
puts pagination
doc2=Nokogiri::HTML(Curl.get(pagination).body_str)
links=doc2.xpath('//a[@class="product-name"]/@href')
links.each do |url|
doc3=Nokogiri::HTML(Curl.get(url).body_str)
name1=doc3.xpath('//h1[@class="product_main_name"]').text
puts name1
end
page +=1
end
但是,由于某种原因,它从第一页收集信息 4 次,而不是从所有 4 页收集信息。 可能是什么问题?
编辑:我在 pagination=("https://www.petsonic.com/snacks-huesos-para-perros/?p=#{page}")
结案
这是一个简单的错字。只需更换
pagination=("https://www.petsonic.com/snacks-huesos-para-perros/?=#{page}")
与
pagination=("https://www.petsonic.com/snacks-huesos-para-perros/?p=#{page}")
注意查询参数中的 p
。