为什么 "I've got what I need" 按钮有时在 import.io 中不起作用?
Why does the "I've got what I need" button sometimes not work in import.io?
我正在使用 import.io 并尝试基于此页面创建爬虫:
http://www.flashscore.com/match/IeHoEHvJ/#match-statistics;0
选择单行(每页一行)并添加一些列并对其进行训练后,我想单击按钮 "I've got what I need!" 以继续训练另一个类似的页面。但是点击按钮是不可能的,就好像程序在等我训练更多,即使没有必要(我已经在其他网站上成功完成了这个过程,但由于某种原因这个页面不起作用).
知道为什么这不起作用吗?
请看下面import.io我尝试点击按钮失败时的截图:
http://puu.sh/j5Vlm/fcc322549a.png
更新:收到来自 import.io facebook 群组的回复。由于 robots.txt,构建爬虫可能无法正常工作。但是构建一个 Extractor 似乎可行,只需要找到一种简单的方法来收集所有链接以在提取器中使用。
您尝试抓取的网站可能受到 robots.txt 文件的保护,因此 Facebook 群组告诉您我建议您尝试使用 Extractor。
解决方案有点棘手,但应该可行。
创建一个提取器以从 the page you want data from 中获取您需要的数据。我做到了并且成功了。
创建提取器以获取 links:(我的在此处:5ef25069-f0cc-4ac7-9184-b2a035277403)用于 this page
然后将数据集下载为 CSV 格式,使用电子表格处理器将其打开并在 link 的末尾添加此文本字符串:#match-statistics;0
最后复制link的列表,返回import.io。在第一个 API 上选择功能批量提取并粘贴 URL 列表。
它应该有效 ;)
我正在使用 import.io 并尝试基于此页面创建爬虫: http://www.flashscore.com/match/IeHoEHvJ/#match-statistics;0
选择单行(每页一行)并添加一些列并对其进行训练后,我想单击按钮 "I've got what I need!" 以继续训练另一个类似的页面。但是点击按钮是不可能的,就好像程序在等我训练更多,即使没有必要(我已经在其他网站上成功完成了这个过程,但由于某种原因这个页面不起作用).
知道为什么这不起作用吗?
请看下面import.io我尝试点击按钮失败时的截图: http://puu.sh/j5Vlm/fcc322549a.png
更新:收到来自 import.io facebook 群组的回复。由于 robots.txt,构建爬虫可能无法正常工作。但是构建一个 Extractor 似乎可行,只需要找到一种简单的方法来收集所有链接以在提取器中使用。
您尝试抓取的网站可能受到 robots.txt 文件的保护,因此 Facebook 群组告诉您我建议您尝试使用 Extractor。
解决方案有点棘手,但应该可行。
创建一个提取器以从 the page you want data from 中获取您需要的数据。我做到了并且成功了。
创建提取器以获取 links:(我的在此处:5ef25069-f0cc-4ac7-9184-b2a035277403)用于 this page
然后将数据集下载为 CSV 格式,使用电子表格处理器将其打开并在 link 的末尾添加此文本字符串:
#match-statistics;0
最后复制link的列表,返回import.io。在第一个 API 上选择功能批量提取并粘贴 URL 列表。
它应该有效 ;)