正则表达式匹配 URL 除了一些使用 Look Ahead 的网站

Question

我正在尝试创建一个正则表达式来过滤掉 url 某些网站除外。

(?!(.*mysite))((www|http|.*com).*)

我很难排除某些网站。我试过向前看，但它似乎不起作用。我希望它的行为类似于 AND 操作，因此如果第一个条件为假，它不应继续到下一个条件。有任何想法吗？

Answer 1

如果您只想要求 URL 在其中包含 http、www 和 com，但主机部分不包含 mysite , 那么你可以使用

preg_match('~^https?://(?:[^./]+\.)*(?!mysite)[^./]+\.com(?:‌/.*)?$~', $url)

详情:

Regex to match URL except for some websites using Look Ahead