使用正则表达式从 html 中抓取内部文本

Scrape innertext from html using regex

我想使用正则表达式从 html 块中抓取内部文本。

这里是代码块以及我的最佳解析工作,远非完美:http://www.regexr.com/3andc

我想提取的是字符串“10 位现在是百万富翁的极受欢迎的 Youtubers”

谢谢。

请不要使用正则表达式来抓取HTML... RegEx match open tags except XHTML self-contained tags

也许使用 HTMLAgilityPack? https://htmlagilitypack.codeplex.com/

编辑:

然后试试这个: http://regexr.com/3ane7