使用正则表达式从 html 中抓取内部文本
Scrape innertext from html using regex
我想使用正则表达式从 html 块中抓取内部文本。
这里是代码块以及我的最佳解析工作,远非完美:http://www.regexr.com/3andc
我想提取的是字符串“10 位现在是百万富翁的极受欢迎的 Youtubers”
谢谢。
请不要使用正则表达式来抓取HTML...
RegEx match open tags except XHTML self-contained tags
也许使用 HTMLAgilityPack?
https://htmlagilitypack.codeplex.com/
编辑:
然后试试这个:
http://regexr.com/3ane7
我想使用正则表达式从 html 块中抓取内部文本。
这里是代码块以及我的最佳解析工作,远非完美:http://www.regexr.com/3andc
我想提取的是字符串“10 位现在是百万富翁的极受欢迎的 Youtubers”
谢谢。
请不要使用正则表达式来抓取HTML... RegEx match open tags except XHTML self-contained tags
也许使用 HTMLAgilityPack? https://htmlagilitypack.codeplex.com/
编辑:
然后试试这个: http://regexr.com/3ane7