如何在 robots.txt 或 .htaccess 上阻止某种类型的 url?
How to block a certain type of urls on robots.txt or .htaccess?
目前在我的网上商店中,在页面过多的类别页面上,网址以 https://www.example.com?p=2 p=3...
我想告诉 robots.txt 不要索引以 p=Number 结尾的 URL。我该怎么做呢?顺便说一下,这是一个 prestashop 网站。
谢谢大家。
只需在您的 robots.txt
文件中添加这一行:
Disallow: /?p=*
因此,例如,这将阻止像 example.com/?p=2
这样的 URL 被 Google 之类的人编入索引。 *
符号代表所有。所以 p=
之后的任何内容都将被包括在内。
如果 p= 分页,您不会希望禁止这些 URL,因为您仍然希望它们被抓取。
如果您不希望它们在 Google 中编入索引,请为它们添加一个 noindex 标签,但不要在它们上面放置任何东西以防止抓取。
目前在我的网上商店中,在页面过多的类别页面上,网址以 https://www.example.com?p=2 p=3... 我想告诉 robots.txt 不要索引以 p=Number 结尾的 URL。我该怎么做呢?顺便说一下,这是一个 prestashop 网站。
谢谢大家。
只需在您的 robots.txt
文件中添加这一行:
Disallow: /?p=*
因此,例如,这将阻止像 example.com/?p=2
这样的 URL 被 Google 之类的人编入索引。 *
符号代表所有。所以 p=
之后的任何内容都将被包括在内。
如果 p= 分页,您不会希望禁止这些 URL,因为您仍然希望它们被抓取。
如果您不希望它们在 Google 中编入索引,请为它们添加一个 noindex 标签,但不要在它们上面放置任何东西以防止抓取。