动态网站抓取不在 C# 中挑选项目
Dynamic website scraping not picking items in C#
我想抓取以下网页。但是,selenium 和 puppeteersharp 等动态网站抓取库不会抓取此页面 table 上显示的项目(见图)。
https://www2.asx.com.au/markets/trade-our-cash-market/todays-announcements
None 上面的库在标题栏下列出了 href,尽管如果我尝试保存此页面的屏幕截图,我只能看到很少的 table 行。
解决这个问题的最佳方法是什么?
为什么这些完善的库不能在此页面上运行?
您在此处抓取的内容在 iframe 中。
要访问它,您必须切换到该 iframe。
请参阅 示例如何使用 BeautifulSoup.
切换到 iframe
在 iframe 中使用 Selenium 抓取的示例。
和 puppeteersharp
我想抓取以下网页。但是,selenium 和 puppeteersharp 等动态网站抓取库不会抓取此页面 table 上显示的项目(见图)。
https://www2.asx.com.au/markets/trade-our-cash-market/todays-announcements
None 上面的库在标题栏下列出了 href,尽管如果我尝试保存此页面的屏幕截图,我只能看到很少的 table 行。
解决这个问题的最佳方法是什么?
为什么这些完善的库不能在此页面上运行?
您在此处抓取的内容在 iframe 中。
要访问它,您必须切换到该 iframe。
请参阅
切换到 iframe