如何提取 <a> 的 "href" 属性并将其粘贴到 Google sheet 中?
How to extract the "href" attribute of <a> and paste it in a Google sheet?
我想从以下页面中提取 HTML 锚点的(Link 此处 )"href" 属性:
https://tvm.liga.nu/cgi-bin/WebObjects/nuLigaTENDE.woa/wa/teamPortrait?team=2368692&championship=K%C3%B6ln-Leverkusen+Winter+2019%2F2020&group=18
然后放到我的googlesheet.
我为此页面尝试了几个 xpath 表达式,但每次都是 "N/A"。
简单的 xpath 仍然不起作用,例如
importxml("https://tvm.liga.nu/cgi-bin/WebObjects/nuLigaTENDE.woa/wa/teamPortrait?team=2368692&championship=K%C3%B6ln-Leverkusen+Winter+2019%2F2020&group=18";"//tr")
我做错了什么?
感谢 Tanaike 所做的一切努力。
我稍微更改了脚本,因为结果是基于纯 html 的,需要更改以便可以单击 link。
function getWebsite(url, searchText, baseURL)
{
var html = UrlFetchApp.fetch(url);
var text = html.getContentText();
var re = new RegExp('(?<=<a href=")(.*)(?=">.*' + searchText +')',"g");
var link = text.match(re)[0];
if (link !== null)
{
var link = text.match(re);
link = link.replace(/&/g,"&");
link = link.replace(/"/g,"\"");
return baseURL + link;
}
else { return "not found"; }
}
我想从以下页面中提取 HTML 锚点的(Link 此处 )"href" 属性:
https://tvm.liga.nu/cgi-bin/WebObjects/nuLigaTENDE.woa/wa/teamPortrait?team=2368692&championship=K%C3%B6ln-Leverkusen+Winter+2019%2F2020&group=18
然后放到我的googlesheet.
我为此页面尝试了几个 xpath 表达式,但每次都是 "N/A"。
简单的 xpath 仍然不起作用,例如
importxml("https://tvm.liga.nu/cgi-bin/WebObjects/nuLigaTENDE.woa/wa/teamPortrait?team=2368692&championship=K%C3%B6ln-Leverkusen+Winter+2019%2F2020&group=18";"//tr")
我做错了什么?
感谢 Tanaike 所做的一切努力。
我稍微更改了脚本,因为结果是基于纯 html 的,需要更改以便可以单击 link。
function getWebsite(url, searchText, baseURL)
{
var html = UrlFetchApp.fetch(url);
var text = html.getContentText();
var re = new RegExp('(?<=<a href=")(.*)(?=">.*' + searchText +')',"g");
var link = text.match(re)[0];
if (link !== null)
{
var link = text.match(re);
link = link.replace(/&/g,"&");
link = link.replace(/"/g,"\"");
return baseURL + link;
}
else { return "not found"; }
}