如何告诉搜索引擎使用我更新的 robots.txt 文件?
How to tell search engines to use my updated robots.txt file?
之前,我阻止了搜索引擎机器人以防止使用 robots.txt 文件抓取我的网站,但现在我想取消阻止它们。
我更新了 robots.txt 文件并允许搜索引擎机器人抓取我的网站,但搜索引擎似乎仍在使用我的旧 robots.txt 文件,我如何告诉搜索引擎使用我的新 robots.txt 文件?还是我的 robots.txt 文件有问题?
我的旧 robots.txt 文件的内容:
User-agent: *
Disallow: /
我的新 robots.txt 文件的内容:
User-agent: *
Allow: /
# Disallow these directories, url types & file-types
Disallow: /trackback/
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /xmlrpc.php
Disallow: /wp-
Disallow: /cgi-bin
Disallow: /readme.html
Disallow: /license.txt
Disallow: /*?*
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.gz$
Disallow: /*.wmv$
Disallow: /*.cgi$
Disallow: /*.xhtml$
Disallow: /*/wp-*
Disallow: /*/feed/*
Disallow: /*/*?s=*
Disallow: /*/*.js$
Disallow: /*/*.inc$
Allow: /wp-content/uploads/
User-agent: ia_archiver*
Disallow: /
User-agent: duggmirror
Disallow: /
Sitemap: https://example.com/sitemap.xml
需要为每个搜索引擎独立完成,否则它可能会随着时间的推移而发生。对于 Google,请使用 Google Search Console 工具。这将允许您上传新的 robots.txt 并提交以供重新抓取。
之前,我阻止了搜索引擎机器人以防止使用 robots.txt 文件抓取我的网站,但现在我想取消阻止它们。
我更新了 robots.txt 文件并允许搜索引擎机器人抓取我的网站,但搜索引擎似乎仍在使用我的旧 robots.txt 文件,我如何告诉搜索引擎使用我的新 robots.txt 文件?还是我的 robots.txt 文件有问题?
我的旧 robots.txt 文件的内容:
User-agent: *
Disallow: /
我的新 robots.txt 文件的内容:
User-agent: *
Allow: /
# Disallow these directories, url types & file-types
Disallow: /trackback/
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /xmlrpc.php
Disallow: /wp-
Disallow: /cgi-bin
Disallow: /readme.html
Disallow: /license.txt
Disallow: /*?*
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.gz$
Disallow: /*.wmv$
Disallow: /*.cgi$
Disallow: /*.xhtml$
Disallow: /*/wp-*
Disallow: /*/feed/*
Disallow: /*/*?s=*
Disallow: /*/*.js$
Disallow: /*/*.inc$
Allow: /wp-content/uploads/
User-agent: ia_archiver*
Disallow: /
User-agent: duggmirror
Disallow: /
Sitemap: https://example.com/sitemap.xml
需要为每个搜索引擎独立完成,否则它可能会随着时间的推移而发生。对于 Google,请使用 Google Search Console 工具。这将允许您上传新的 robots.txt 并提交以供重新抓取。