如何防止搜索引擎索引一段文本?
How to prevent search engines from indexing a span of text?
从 the information I have been able to find so far 开始,<noindex>
应该可以实现这一点,使页面的单个部分对搜索引擎蜘蛛隐藏。但似乎很多浏览器都没有遵守这一点——所以如果是这样的话,除了它之外,还应该使用什么标记来代替/?
- 雅虎使用内置 class:
<span class="robots-nocontent">
- Googlebot 没有对应项(?)
- Yandex 使用
<noindex>
- 其他?
没有办法阻止爬虫索引任何东西,爬虫会做什么由作者决定。遵守规则的,如 Yahoo Slurp、Googlebot 等。他们每个人都有自己的规则,正如您已经发现的那样,但是否完全遵守规则仍然取决于他们 - 假设您设置 robots-nocontent
但该部分仍被编入索引并放在其他地方,可能用于检查垃圾邮件、非法 material、恶意软件等
那只是针对 "good" 的,不知道坏人会做什么。因此,请将所有 noindex 内容视为一组准则,而不是一组严格的规则。
唯一可以肯定的是:如果您有敏感数据,或者您只是不想将某些内容编入索引 - 不要将其公开。
从 the information I have been able to find so far 开始,<noindex>
应该可以实现这一点,使页面的单个部分对搜索引擎蜘蛛隐藏。但似乎很多浏览器都没有遵守这一点——所以如果是这样的话,除了它之外,还应该使用什么标记来代替/?
- 雅虎使用内置 class:
<span class="robots-nocontent">
- Googlebot 没有对应项(?)
- Yandex 使用
<noindex>
- 其他?
没有办法阻止爬虫索引任何东西,爬虫会做什么由作者决定。遵守规则的,如 Yahoo Slurp、Googlebot 等。他们每个人都有自己的规则,正如您已经发现的那样,但是否完全遵守规则仍然取决于他们 - 假设您设置 robots-nocontent
但该部分仍被编入索引并放在其他地方,可能用于检查垃圾邮件、非法 material、恶意软件等
那只是针对 "good" 的,不知道坏人会做什么。因此,请将所有 noindex 内容视为一组准则,而不是一组严格的规则。
唯一可以肯定的是:如果您有敏感数据,或者您只是不想将某些内容编入索引 - 不要将其公开。