在 Google Apps 脚本中条纹 HTML 标签
Stripe HTML tags in Google Apps Script
我正在寻找从 Google Apps 脚本中的内容中剥离 HTML 标签的快速方法。
现在我正在使用这些函数来HTML解析:
function getTextFromHtml(body) {
return getTextFromNode(Xml.parse(body, true).getElement());
}
function getTextFromNode(x) {
switch(x.toString()) {
case 'XmlText': return x.toXmlString();
case 'XmlElement': return x.getNodes().map(getTextFromNode).join('');
default: return '';
}
}
但是长期以来HTML这种方式效率很低。
示例 HTML 内容:http://pastebin.com/FmB4hvN2
有什么想法吗?
这将从输入中删除所有标签。
var text = html.replace(/<[^>]+>/g, "");
如果你要替换的内容总是被<和>包裹,你可以这样做
Regex rgx = new Regex(someString);
string result = rgx.Replace("<[^>]*>", "");
我正在寻找从 Google Apps 脚本中的内容中剥离 HTML 标签的快速方法。
现在我正在使用这些函数来HTML解析:
function getTextFromHtml(body) {
return getTextFromNode(Xml.parse(body, true).getElement());
}
function getTextFromNode(x) {
switch(x.toString()) {
case 'XmlText': return x.toXmlString();
case 'XmlElement': return x.getNodes().map(getTextFromNode).join('');
default: return '';
}
}
但是长期以来HTML这种方式效率很低。
示例 HTML 内容:http://pastebin.com/FmB4hvN2
有什么想法吗?
这将从输入中删除所有标签。
var text = html.replace(/<[^>]+>/g, "");
如果你要替换的内容总是被<和>包裹,你可以这样做
Regex rgx = new Regex(someString);
string result = rgx.Replace("<[^>]*>", "");