robots.txt 如何禁止 jpg.php

robots.txt how to disallow jpg.php

您好,在看到一个朋友的网站被黑后,我正在尝试禁止任何具有双重扩展名的文件。即 myimage.jpg.php 但允许常规 .jpg 正常工作。

Disallow: *.* //disallow all extensions

Allow: *.jpg //now allow .jpg images
Disallow: *.jpg*?* //but not query strings

Disallow: *.php$ //now make sure .php files cant be touched
Disallow: *.*.php$ //double check jpg.php does not work <<--- this or above should work but it does not?

谢谢

您想要的不是 robots.txt(对于 computers/spiders 阅读和遵循完全是可选的),而是 .htaccess 中的一条法律。如果您 运行 Apache 服务器,那么您可以使用 htaccess 文件来控制您希望观众/用户访问的内容。

区别在于 robots.txt 是可选的,其他人可以跟随,而 .htaccess 不是。

在你的 .htaccess 中试试这个:

<Files ~ ".*\.[a-z0-9]{1,6}\.[a-z0-9]{1,6}$">
Order deny,allow
Deny from all
</Files>

这会阻止访问任何具有双重扩展名的文件,但如果您不熟悉它,那么我建议您从这个出色的网站上阅读 htaccess:http://www.askapache.com/htaccess/htaccess.html

首先,Robots.txt 不会阻止黑客。机器人不会被迫阅读它。它仅由 nice 机器人使用。

如果你想让漂亮的机器人远离*.jpg,你可以使用这个:

Disallow: *.*
Allow: *.jpg$

注意末尾的 $ 字符。

使用 htaccess 设置可访问哪些文件以及如何访问的规则。