如何有效地获取目录中的(某些)文件名
How to get (some) filenames within a directory efficiently
我有一个包含 20M+ 个文件的目录。如果我尝试
folder.list();
我大约需要 5~10 分钟才能获取文件(有时甚至更多)。我不需要所有的文件名,每次只需要几个。
在 Linux 如果我尝试:
ls -l | head -n 100
: 会花很长时间
ls -f | head -n 100
: 几秒后得到响应
所以如果我使用 ProcessBuilder
和 运行 类似 ls -f | head -n 100
的东西,我可以快速列出文件
是否有无需使用 ProcessBuilder
即可在目录中列出固定数量文件的本机方法?
您可以试试 java7 nio 文件操作是否对您来说更快。在我使用它们的一个案例中,它们是一个很大的改进:https://docs.oracle.com/javase/tutorial/essential/io/walk.html
是的,可以使用 Java NIO.2 and the class DirectoryStream
. This class implements a lazy iterable over the entries of a directory. You can obtain an instance of DirectoryStream<Path>
using Files.newDirectoryStream(path)
(and you can obtain an instance of Path
with the static factories Paths.get
).
如果您使用的是 Java 8,更简单的解决方案是使用 Files.list()
:
Return a lazily populated Stream
, the elements of which are the entries in the directory. The listing is not recursive.
然后你就可以
List<String> fileNames = Files.list(path)
.map(Path::getFileName)
.map(Path::toString)
.limit(100)
.collect(Collectors.toList());
检索给定 path
的 100 个文件名。
我有一个包含 20M+ 个文件的目录。如果我尝试
folder.list();
我大约需要 5~10 分钟才能获取文件(有时甚至更多)。我不需要所有的文件名,每次只需要几个。
在 Linux 如果我尝试:
ls -l | head -n 100
: 会花很长时间ls -f | head -n 100
: 几秒后得到响应
所以如果我使用 ProcessBuilder
和 运行 类似 ls -f | head -n 100
是否有无需使用 ProcessBuilder
即可在目录中列出固定数量文件的本机方法?
您可以试试 java7 nio 文件操作是否对您来说更快。在我使用它们的一个案例中,它们是一个很大的改进:https://docs.oracle.com/javase/tutorial/essential/io/walk.html
是的,可以使用 Java NIO.2 and the class DirectoryStream
. This class implements a lazy iterable over the entries of a directory. You can obtain an instance of DirectoryStream<Path>
using Files.newDirectoryStream(path)
(and you can obtain an instance of Path
with the static factories Paths.get
).
如果您使用的是 Java 8,更简单的解决方案是使用 Files.list()
:
Return a lazily populated
Stream
, the elements of which are the entries in the directory. The listing is not recursive.
然后你就可以
List<String> fileNames = Files.list(path)
.map(Path::getFileName)
.map(Path::toString)
.limit(100)
.collect(Collectors.toList());
检索给定 path
的 100 个文件名。