Node.js 和模块作用域:将文件读入内存的最有效方式
Node.js and the Module Scope: Most Efficient Way to Read Files into Memory
我试图更好地理解 node.js 模块作用域和变量实例化上下文中的要求。更具体地说,将文件读入内存。
我有一个带有模块的 http 服务器,该模块读取存储在代码库中的静态 sql 文件并执行其中包含的查询。例如:
'use strict';
const fs = require('fs')
const executeSql = require('./utils/execute-sql');
module.exports.getDataById = (id) => {
const sql = fs.readFileSync(
`./data-access/sql/getDataById.sql`, 'utf8'
);
return executeSql(sql, id);
}
module.exports.getDataByName = (name) => {
const sql = fs.readFileSync(
`./data-access/sql/getDataByName.sql`, 'utf8'
);
return executeSql(sql, name);
}
我的理解是,每次调用这些函数(getDataById
和getDataByName
)时,都会以阻塞方式同步读取文件并阻塞执行线程。我知道我可以异步读取文件来避免这种情况,但我真正好奇的是,将 sql 变量从函数中拉出并进入模块范围是否意味着 readFile 操作只发生一次(当节点process 被实例化)并且最终会更有效率。例如:
'use strict';
const fs = require('fs')
const executeSql = require('./utils/execute-sql');
const sql1 = fs.readFileSync(
`./data-access/sql/getDataById.sql`, 'utf8'
);
const sql2 = fs.readFileSync(
`./data-access/sql/getDataByName.sql`, 'utf8'
);
module.exports.getDataById = (id) => {
return executeSql(sql1, id);
}
module.exports.getDataByName = (name) => {
return executeSql(sql2, name);
}
我知道 require
在节点进程初始化时同步加载模块,并在其他地方需要它们时进一步缓存这些模块,但我想了解的是,如果标准变量声明不使用require
导致类似实例化的内存引用在节点进程的生命周期内持续存在,不需要在每次需要模块时重新实例化。
感谢您提供的任何见解。
你是对的。每次一个模块需要另一个模块时,只有第一次执行代码,其余时间它只是 return 缓存的 exports
,因此在您的示例中 fs.readFileSync
将是运行 一次(有人第一次需要它),node.js 将缓存 exports
对象,下一次要求 exports
对象将被 returned , 又没有 运行 代码。
你可以用这样的东西来测试它:
var mod = require("./myModule");
console.log(mod.nonExistantProperty); // This will log undefined
mod.nonExistantProperty = "yay";
var requireagain = require("./myModule");
console.log(requireagain.nonExistantProperty); // This will log yay
在第二次 require 中,它不会再次执行模块代码,它只会 return 缓存的对象,因此您可以看到第二次 require 之前所做的修改。
根据此信息,在您的第一个示例中,您在导出中 returning 函数,每次调用它们时都会执行它们的代码(很明显),因此如果函数内部有一个 readfile 方法,每次都是运行。
您的第二种方法通常用于提高性能,因为代码 运行 只有一次(在第一次要求时),每次执行导出的函数时,它们都会访问变量内容已经缓存了文件内容。感谢您得出该结论 :-) 坚持下去。
我试图更好地理解 node.js 模块作用域和变量实例化上下文中的要求。更具体地说,将文件读入内存。
我有一个带有模块的 http 服务器,该模块读取存储在代码库中的静态 sql 文件并执行其中包含的查询。例如:
'use strict';
const fs = require('fs')
const executeSql = require('./utils/execute-sql');
module.exports.getDataById = (id) => {
const sql = fs.readFileSync(
`./data-access/sql/getDataById.sql`, 'utf8'
);
return executeSql(sql, id);
}
module.exports.getDataByName = (name) => {
const sql = fs.readFileSync(
`./data-access/sql/getDataByName.sql`, 'utf8'
);
return executeSql(sql, name);
}
我的理解是,每次调用这些函数(getDataById
和getDataByName
)时,都会以阻塞方式同步读取文件并阻塞执行线程。我知道我可以异步读取文件来避免这种情况,但我真正好奇的是,将 sql 变量从函数中拉出并进入模块范围是否意味着 readFile 操作只发生一次(当节点process 被实例化)并且最终会更有效率。例如:
'use strict';
const fs = require('fs')
const executeSql = require('./utils/execute-sql');
const sql1 = fs.readFileSync(
`./data-access/sql/getDataById.sql`, 'utf8'
);
const sql2 = fs.readFileSync(
`./data-access/sql/getDataByName.sql`, 'utf8'
);
module.exports.getDataById = (id) => {
return executeSql(sql1, id);
}
module.exports.getDataByName = (name) => {
return executeSql(sql2, name);
}
我知道 require
在节点进程初始化时同步加载模块,并在其他地方需要它们时进一步缓存这些模块,但我想了解的是,如果标准变量声明不使用require
导致类似实例化的内存引用在节点进程的生命周期内持续存在,不需要在每次需要模块时重新实例化。
感谢您提供的任何见解。
你是对的。每次一个模块需要另一个模块时,只有第一次执行代码,其余时间它只是 return 缓存的 exports
,因此在您的示例中 fs.readFileSync
将是运行 一次(有人第一次需要它),node.js 将缓存 exports
对象,下一次要求 exports
对象将被 returned , 又没有 运行 代码。
你可以用这样的东西来测试它:
var mod = require("./myModule");
console.log(mod.nonExistantProperty); // This will log undefined
mod.nonExistantProperty = "yay";
var requireagain = require("./myModule");
console.log(requireagain.nonExistantProperty); // This will log yay
在第二次 require 中,它不会再次执行模块代码,它只会 return 缓存的对象,因此您可以看到第二次 require 之前所做的修改。
根据此信息,在您的第一个示例中,您在导出中 returning 函数,每次调用它们时都会执行它们的代码(很明显),因此如果函数内部有一个 readfile 方法,每次都是运行。
您的第二种方法通常用于提高性能,因为代码 运行 只有一次(在第一次要求时),每次执行导出的函数时,它们都会访问变量内容已经缓存了文件内容。感谢您得出该结论 :-) 坚持下去。