HTML 页面加载并在 .txt 文件中显示

HTML pages loading and showing them in .txt file

我正在尝试在 java 中构建一个搜索引擎,其中我有一个文件夹 "crawler" 来存储下载,但是当我打开我的项目并单击该文件时,我的计算机卡住了,因为它尝试加载从 html 页面 (100k+) 解析的所有 url 和文本,并尝试在 "crawler" 文件夹中的 .txt 文件中显示它们。

如何防止在文件中加载和显示它们?

将您的数据文件存储在项目之外的某个地方。使用例如一个属性文件,用于将位置存储到您的搜寻器文件夹中。您应该只在您的项目中包含此类文件,如源代码。您将上传到 Git 或 SVN 的内容。不是您的应用程序操作的数据文件。如果将此数据存储在数据库中,则不会在项目中包含整个数据库,而只包含 SQL 文件来创建表和视图。