如何解析基于 JavaScript 的页面

How to parse a JavaScript-based page

我无法从使用 JavaScript 提供的页面中获取 Ontario Coronavirus's HTML。我在 Ruby.

中使用 Nokogiri

Ruby 检索到的站点更像是一个 warning/explanation 页面,它说我的浏览器需要 JavaScript。

<h1>JavaScript is required to view this site</h1> <p>Ontario.ca needs JavaScript to function properly and provide you with a fast,
stable experience. Please enable JavaScript or check your browser's settings.</p>...Outdated browsers lack safety features that keep your information secure

我尝试使用 JSON 解析页面,结果相同。该页面作为 stringIO 对象返回,并且 .string 也具有相同的结果。

我如何获取此页面以及以这种方式提供的任何其他页面?我认为这是 JavaScript 服务站点的反复出现的问题。

您需要为此使用 Watir gem,因为它是通过 ajax 加载的。 而且,他们好像有一个API,你可能也想看看这个。