Robots.txt、php.ini、connect_to_database.php、.htaccess
Robots.txt, php.ini, connect_to_database.php, .htaccess
关于是否应该禁止 /php.ini
之类的配置文件或 /.htaccess
之类的隐藏文件,我似乎无法在任何地方找到答案?那么 /includes
或 /includes/connect_to_database.php
之类的东西呢?
我在 ProWebmasters 和其他地方都读过我们不应该 disallow: /*.js$
或 /*.css$
,但几乎所有这些答案都已有将近十年的历史了。此外, robots.txt
的目的是确定索引的内容,而不是爬网的内容,不是吗?我的意思是,我们不希望爬虫试图索引我们的 css
和 js
文件。
甚至 Google 自己关于 robots.txt
的文档似乎也没有涵盖这些内容。有人知道网络上某处与此相关的信息资源吗?
谢谢
在网络浏览器和搜索蜘蛛(例如 Google 机器人)中呈现整个页面所需的文件应该在 robots.txt 文件中可用。允许文件 css、js、图像 jpg、jpeg、png、字体。
PHP(include() 和 require(),例如 connect_to_database.php)和配置 (php.ini) 加载的文件应该无法被 public 访问并在 .htaccess 文件中被阻止。
关于是否应该禁止 /php.ini
之类的配置文件或 /.htaccess
之类的隐藏文件,我似乎无法在任何地方找到答案?那么 /includes
或 /includes/connect_to_database.php
之类的东西呢?
我在 ProWebmasters 和其他地方都读过我们不应该 disallow: /*.js$
或 /*.css$
,但几乎所有这些答案都已有将近十年的历史了。此外, robots.txt
的目的是确定索引的内容,而不是爬网的内容,不是吗?我的意思是,我们不希望爬虫试图索引我们的 css
和 js
文件。
甚至 Google 自己关于 robots.txt
的文档似乎也没有涵盖这些内容。有人知道网络上某处与此相关的信息资源吗?
谢谢
在网络浏览器和搜索蜘蛛(例如 Google 机器人)中呈现整个页面所需的文件应该在 robots.txt 文件中可用。允许文件 css、js、图像 jpg、jpeg、png、字体。
PHP(include() 和 require(),例如 connect_to_database.php)和配置 (php.ini) 加载的文件应该无法被 public 访问并在 .htaccess 文件中被阻止。