Node.js 获取 HTTP_USER_AGENT 并阻止 HTTrack

Node.js get HTTP_USER_AGENT and Block HTTrack

我想阻止我网站上的所有机器人(如 HTTrack)。通常,我会使用 .htaccess 文件通过 RewriteCond %{HTTP_USER_AGENT} HTTrack [NC,OR].

来阻止机器人

不过,我的服务器是运行 Node.js Express。我怎样才能得到 HTTP_USER_AGENT 并在 Node.js 上进行阻止或重写?

有一个中间件,叫做 express-nobots:

var noBots = require('express-nobots');

// must be the first middleware
app.use(noBots());

您可以看到被阻止的机器人列表inside a source file