阻止 HTML 页面被搜索引擎索引
Prevent HTML page indexing by search engines
在我的网站上,我有一个页面,其中只放置了一些“文本数据”,我将其用作一个简单的数据库。
更清楚地说,这是一个带有作者姓名的引号(即:
<div id="QUO12012022">
<h1>Author NAME</h1>
<span>QUOTE TEXT</span>
</div>
等等,在我的主页中,脚本每天加载报价并将其显示在主页中。
在直接使用我的网站名称测试和搜索 google 时,它在结果中加载了直接 link 到此数据页面,
我的问题显然是如何使该页面对搜索引擎不可见,并且仍然能够在我的内部脚本中从中加载数据,?
PS : 因为这是简单的练习,而且我还是初学者,所以我不想使用 sql 数据库,只是像这样的简单文本。
谢谢。
为防止大多数搜索引擎网络抓取工具将您网站上的网页编入索引,请将以下元标记放入您网页的部分:
<meta name="robots" content="noindex">
要仅阻止 Google 网络爬虫将页面编入索引:
<meta name="googlebot" content="noindex">
在我的网站上,我有一个页面,其中只放置了一些“文本数据”,我将其用作一个简单的数据库。 更清楚地说,这是一个带有作者姓名的引号(即:
<div id="QUO12012022">
<h1>Author NAME</h1>
<span>QUOTE TEXT</span>
</div>
等等,在我的主页中,脚本每天加载报价并将其显示在主页中。 在直接使用我的网站名称测试和搜索 google 时,它在结果中加载了直接 link 到此数据页面, 我的问题显然是如何使该页面对搜索引擎不可见,并且仍然能够在我的内部脚本中从中加载数据,?
PS : 因为这是简单的练习,而且我还是初学者,所以我不想使用 sql 数据库,只是像这样的简单文本。
谢谢。
为防止大多数搜索引擎网络抓取工具将您网站上的网页编入索引,请将以下元标记放入您网页的部分:
<meta name="robots" content="noindex">
要仅阻止 Google 网络爬虫将页面编入索引:
<meta name="googlebot" content="noindex">