Ruby Nokogiri 抓取数据URL
Ruby Nokogiri Scraping data URL
这里我要的是eng_tid的id。那么我应该怎么做才能获得这个 ID 代码
<a data-gt="{"engagement":{"eng_type":"1","eng_src":"2","eng_tid":"100016034050254","eng_data":[]}}" href="https://www.facebook.com/thokchom.tombung?fref=pb&hc_location=profile_browser" data-hovercard="/ajax/hovercard/user.php?id=100016034050254&extragetparams=%7B%22hc_location%22%3A%22profile_browser%22%7D" data-hovercard-prefer-more-content-show="1">Thokchom Tombung</a>
require 'open-uri'
require 'nokogiri'
require 'json'
require 'csv'
page = Nokogiri::HTML(open("index.html"))
links = page.css('li._5i_q').css("a[data-gt]").children.map {|name| name.text }
puts links
CSV.open('fileId.csv', 'w') do |csv|
csv << links
end
通过这两行你可以从 data-hovercard
id
param:
得到 eng_tid
page = Nokogiri::HTML(open(Rails.root + "app/views/home/index.html"))
@id = page.css("a").map {|element| element["data-hovercard"][/id=([^&]*)/].gsub('id=', '')}
这是 rails 网络项目上的 github 示例 ruby,它将向您显示在索引页上提取的 url 号码:https://github.com/nezirz/nokogiri_Whosebug_answer
因此您需要将此项目克隆到您的电脑 git clone git@github.com:nezirz/nokogiri_Whosebug_answer.git
和 运行 项目文件夹 bundle install
中,最后 rails s
然后您将在网站上看到所请求的编号,因此您可以将此代码用作示例并根据您的需要进行管理。
这里我要的是eng_tid的id。那么我应该怎么做才能获得这个 ID 代码
<a data-gt="{"engagement":{"eng_type":"1","eng_src":"2","eng_tid":"100016034050254","eng_data":[]}}" href="https://www.facebook.com/thokchom.tombung?fref=pb&hc_location=profile_browser" data-hovercard="/ajax/hovercard/user.php?id=100016034050254&extragetparams=%7B%22hc_location%22%3A%22profile_browser%22%7D" data-hovercard-prefer-more-content-show="1">Thokchom Tombung</a>
require 'open-uri'
require 'nokogiri'
require 'json'
require 'csv'
page = Nokogiri::HTML(open("index.html"))
links = page.css('li._5i_q').css("a[data-gt]").children.map {|name| name.text }
puts links
CSV.open('fileId.csv', 'w') do |csv|
csv << links
end
通过这两行你可以从 data-hovercard
id
param:
eng_tid
page = Nokogiri::HTML(open(Rails.root + "app/views/home/index.html"))
@id = page.css("a").map {|element| element["data-hovercard"][/id=([^&]*)/].gsub('id=', '')}
这是 rails 网络项目上的 github 示例 ruby,它将向您显示在索引页上提取的 url 号码:https://github.com/nezirz/nokogiri_Whosebug_answer
因此您需要将此项目克隆到您的电脑 git clone git@github.com:nezirz/nokogiri_Whosebug_answer.git
和 运行 项目文件夹 bundle install
中,最后 rails s
然后您将在网站上看到所请求的编号,因此您可以将此代码用作示例并根据您的需要进行管理。