Node.js 和模块作用域:将文件读入内存的最有效方式

Node.js and the Module Scope: Most Efficient Way to Read Files into Memory

我试图更好地理解 node.js 模块作用域和变量实例化上下文中的要求。更具体地说,将文件读入内存。

我有一个带有模块的 http 服务器,该模块读取存储在代码库中的静态 sql 文件并执行其中包含的查询。例如:

'use strict';

const fs = require('fs')
const executeSql = require('./utils/execute-sql');

module.exports.getDataById = (id) => {
  const sql = fs.readFileSync(
    `./data-access/sql/getDataById.sql`, 'utf8'
  );

  return executeSql(sql, id);
}

module.exports.getDataByName = (name) => {
  const sql = fs.readFileSync(
    `./data-access/sql/getDataByName.sql`, 'utf8'
  );

  return executeSql(sql, name);
}

我的理解是,每次调用这些函数(getDataByIdgetDataByName)时,都会以阻塞方式同步读取文件并阻塞执行线程。我知道我可以异步读取文件来避免这种情况,但我真正好奇的是,将 sql 变量从函数中拉出并进入模块范围是否意味着 readFile 操作只发生一次(当节点process 被实例化)并且最终会更有效率。例如:

'use strict';

const fs = require('fs')
const executeSql = require('./utils/execute-sql');
const sql1 = fs.readFileSync(
  `./data-access/sql/getDataById.sql`, 'utf8'
);
const sql2 = fs.readFileSync(
  `./data-access/sql/getDataByName.sql`, 'utf8'
);

module.exports.getDataById = (id) => {
  return executeSql(sql1, id);
}

module.exports.getDataByName = (name) => {
  return executeSql(sql2, name);
}

我知道 require 在节点进程初始化时同步加载模块,并在其他地方需要它们时进一步缓存这些模块,但我想了解的是,如果标准变量声明不使用require 导致类似实例化的内存引用在节点进程的生命周期内持续存在,不需要在每次需要模块时重新实例化。

感谢您提供的任何见解。

你是对的。每次一个模块需要另一个模块时,只有第一次执行代码,其余时间它只是 return 缓存的 exports,因此在您的示例中 fs.readFileSync 将是运行 一次(有人第一次需要它),node.js 将缓存 exports 对象,下一次要求 exports 对象将被 returned , 又没有 运行 代码。

你可以用这样的东西来测试它:

var mod = require("./myModule");
console.log(mod.nonExistantProperty); // This will log undefined
mod.nonExistantProperty = "yay";

var requireagain = require("./myModule");
console.log(requireagain.nonExistantProperty); // This will log yay

在第二次 require 中,它不会再次执行模块代码,它只会 return 缓存的对象,因此您可以看到第二次 require 之前所做的修改。

根据此信息,在您的第一个示例中,您在导出中 returning 函数,每次调用它们时都会执行它们的代码(很明显),因此如果函数内部有一个 readfile 方法,每次都是运行。

您的第二种方法通常用于提高性能,因为代码 运行 只有一次(在第一次要求时),每次执行导出的函数时,它们都会访问变量内容已经缓存了文件内容。感谢您得出该结论 :-) 坚持下去。