Importxml 函数 (googlesheets) 不适用于 Skillshare 网站?
Importxml function (googlesheets) not working for Skillshare website?
我今天来这里是因为我在 Googlesheets 中使用 ImportXML 函数时遇到一个奇怪的问题。
我正在尝试从 2 个网站的不同配置文件中提取 href(facebook、twitter、youtube 等...):udemy.com 和 skillshare.com。
我从 udemy 个人资料中获得了我的目标,但没有从 skillshare 个人资料中获得成功。
在尝试了很多次之后(即使是奇怪的 xpaths_query 组合),我认为问题可能有 2 个原因:1. 网站闪烁我(这可能吗?,2. 我的 xpath_query不好)...但是我仍然认为解决方案非常直接,但我看不出我可能遗漏了什么。
请访问my Googlesheet with a couple of samples以获得更好的理解,您可以按顺序找到更多详细信息,那里...
看看这些例子:
好结果 > 对于 Udemy,我使用了以下 google sheet 函数
=IMPORTXML("https://www.udemy.com/user/saddam-kassim-2/"; "//div[@class='instructor-profile--social-links--3Kub5']/一个/@href")
N/A 结果 > 对于 Skillshare,我使用了以下 google sheet 函数
=IMPORTXML("https://www.skillshare.com/user/sridhar"; "//div[@class='user-information-social-links']/a /@href")
这些是 html 代码片段:
UDEMY SAMPLE HTML
非常感谢您的想法和建议。我究竟做错了什么?我可以尝试什么?
提前致谢!
链接在加载后由脚本填充,因此我们不能仅使用 XPATH。数据也位于初始文档的第三个脚本标签中。使用第一个 Skillshare URL,我们可以构造以下公式:
=ArrayFormula(
IFNA(
REGEXEXTRACT(
SPLIT(
REGEXEXTRACT(
REGEXEXTRACT(
INDEX(
IMPORTXML(
"https://www.skillshare.com/user/profkarim",
"//script"
),
3
),
"socialLinks.*sections"
),
"(\{.*\})"
),
"},{",
0,
1
),
"""url"":""?(.*?)""?,"
)
)
)
我今天来这里是因为我在 Googlesheets 中使用 ImportXML 函数时遇到一个奇怪的问题。
我正在尝试从 2 个网站的不同配置文件中提取 href(facebook、twitter、youtube 等...):udemy.com 和 skillshare.com。
我从 udemy 个人资料中获得了我的目标,但没有从 skillshare 个人资料中获得成功。
在尝试了很多次之后(即使是奇怪的 xpaths_query 组合),我认为问题可能有 2 个原因:1. 网站闪烁我(这可能吗?,2. 我的 xpath_query不好)...但是我仍然认为解决方案非常直接,但我看不出我可能遗漏了什么。
请访问my Googlesheet with a couple of samples以获得更好的理解,您可以按顺序找到更多详细信息,那里...
看看这些例子: 好结果 > 对于 Udemy,我使用了以下 google sheet 函数
=IMPORTXML("https://www.udemy.com/user/saddam-kassim-2/"; "//div[@class='instructor-profile--social-links--3Kub5']/一个/@href")
N/A 结果 > 对于 Skillshare,我使用了以下 google sheet 函数
=IMPORTXML("https://www.skillshare.com/user/sridhar"; "//div[@class='user-information-social-links']/a /@href")
这些是 html 代码片段: UDEMY SAMPLE HTML
非常感谢您的想法和建议。我究竟做错了什么?我可以尝试什么? 提前致谢!
链接在加载后由脚本填充,因此我们不能仅使用 XPATH。数据也位于初始文档的第三个脚本标签中。使用第一个 Skillshare URL,我们可以构造以下公式:
=ArrayFormula(
IFNA(
REGEXEXTRACT(
SPLIT(
REGEXEXTRACT(
REGEXEXTRACT(
INDEX(
IMPORTXML(
"https://www.skillshare.com/user/profkarim",
"//script"
),
3
),
"socialLinks.*sections"
),
"(\{.*\})"
),
"},{",
0,
1
),
"""url"":""?(.*?)""?,"
)
)
)