解析正在使用 Mechanize 进行身份验证的页面
Parse pages being authenticated with Mechanize
我需要从页面中解析一个元素,该元素只有在我在网站上进行身份验证后才能出现。
认证页面为/lws/wp-login.php
这是我尝试过的方法,但没有用:
require 'rubygems'
require 'mechanize'
agent = Mechanize.new
agent.user_agent_alias = 'Windows Mozilla'
agent.add_auth('http://example.com/lws/wp-login.php', 'login', 'pass')
agent.get('http://example.com/assimil-pour-mieux-connaitre-le-chinois/') do |page|
puts page.parser.css("p[style='text-align: center;'] strong")[0]
end
您编写的代码将使用用户名和密码对您进行基本身份验证。如果你想为你的抓取创建一个会话,你需要在 /lws/wp-login.php
上用 Mechanize 填写表格然后解析其他页面。请务必在请求之间存储您的 cookie。
我需要从页面中解析一个元素,该元素只有在我在网站上进行身份验证后才能出现。
认证页面为/lws/wp-login.php
这是我尝试过的方法,但没有用:
require 'rubygems'
require 'mechanize'
agent = Mechanize.new
agent.user_agent_alias = 'Windows Mozilla'
agent.add_auth('http://example.com/lws/wp-login.php', 'login', 'pass')
agent.get('http://example.com/assimil-pour-mieux-connaitre-le-chinois/') do |page|
puts page.parser.css("p[style='text-align: center;'] strong")[0]
end
您编写的代码将使用用户名和密码对您进行基本身份验证。如果你想为你的抓取创建一个会话,你需要在 /lws/wp-login.php
上用 Mechanize 填写表格然后解析其他页面。请务必在请求之间存储您的 cookie。