如何有效地获取目录中的(某些)文件名

How to get (some) filenames within a directory efficiently

我有一个包含 20M+ 个文件的目录。如果我尝试

folder.list();

我大约需要 5~10 分钟才能获取文件(有时甚至更多)。我不需要所有的文件名,每次只需要几个。

在 Linux 如果我尝试:

所以如果我使用 ProcessBuilder 和 运行 类似 ls -f | head -n 100

的东西,我可以快速列出文件

是否有无需使用 ProcessBuilder 即可在目录中列出固定数量文件的本机方法?

您可以试试 java7 nio 文件操作是否对您来说更快。在我使用它们的一个案例中,它们是一个很大的改进:https://docs.oracle.com/javase/tutorial/essential/io/walk.html

是的,可以使用 Java NIO.2 and the class DirectoryStream. This class implements a lazy iterable over the entries of a directory. You can obtain an instance of DirectoryStream<Path> using Files.newDirectoryStream(path) (and you can obtain an instance of Path with the static factories Paths.get).

如果您使用的是 Java 8,更简单的解决方案是使用 Files.list():

Return a lazily populated Stream, the elements of which are the entries in the directory. The listing is not recursive.

然后你就可以

List<String> fileNames = Files.list(path)
                              .map(Path::getFileName)
                              .map(Path::toString)
                              .limit(100)
                              .collect(Collectors.toList());

检索给定 path 的 100 个文件名。