删除没有文件名重复的文件
Remove files which have not filename duplicates
对于每个文档(.pdf、.txt、.docx ecc),我还有一个具有相同文件名的相应 json 文件。
示例:
file1.json,
file1.pdf,
file2.json,
file2.txt,
filex.json,
filex.pdf,
但我也得到了一些 json 文件,这些文件没有随附相应的文件。
我想删除所有 json 个没有相应文档的文件。我真的很困惑,因为我找不到合适的方法来解决我的问题。
我知道如何通过 scandir() 从 pathinfo() ecc 获取文件名和扩展名。但问题是,对于我在目录中找到的每个 json 文件,我必须在该目录上执行另一个 foreach,不包括所有 json 文件,看看是否存在相同的文件名,这样我就可以决定删除它。 (我是这么想解决的)
这里的问题是性能,因为有数百万个文件,对于每个 json 我必须 运行 对数百万个文件进行 foreach。
谁能指导我找到更好的解决方案?
谢谢!
编辑:因为没有人会在没有先发布一段代码的情况下提供帮助(而且 Whosebug 中的这种方法绝对是错误的)这就是我正在尝试的方式。:
<?php
$dir = "2000/";
$files = scandir($dir);
foreach ($files as $file) {
$fullName = pathinfo($file);
if ($fullName['extension'] === 'json') {
if (!in_array($fullName['filename'].'.pdf', $files)){
unlink($dir.$file);
}
}
}
现在如您所见,我只能搜索一种类型的文档(在本例中为.pdf
)。我想搜索除 .json
之外的每个扩展名,而且我不希望每个 json 文件到 运行 a foreach/in_array() 但只需要一个就可以实现所有这些foreach.
或许你应该换个角度考虑?我的意思是,遍历所有文件,并尝试找到 json
对应的文件,如果找不到,请将其删除。
看起来像这样:
$dir = "2000/";
foreach (glob($dir . "*.json") as $file) {
$file = new \SplFileInfo($dir . $file);
if (count(glob($dir . $file->getBasename('.' . $file->getExtension()) . ".*")) === 1) {
unlink($dir . $file->getFilename());
}
}
手动
对于每个文档(.pdf、.txt、.docx ecc),我还有一个具有相同文件名的相应 json 文件。
示例: file1.json, file1.pdf, file2.json, file2.txt, filex.json, filex.pdf,
但我也得到了一些 json 文件,这些文件没有随附相应的文件。
我想删除所有 json 个没有相应文档的文件。我真的很困惑,因为我找不到合适的方法来解决我的问题。
我知道如何通过 scandir() 从 pathinfo() ecc 获取文件名和扩展名。但问题是,对于我在目录中找到的每个 json 文件,我必须在该目录上执行另一个 foreach,不包括所有 json 文件,看看是否存在相同的文件名,这样我就可以决定删除它。 (我是这么想解决的)
这里的问题是性能,因为有数百万个文件,对于每个 json 我必须 运行 对数百万个文件进行 foreach。
谁能指导我找到更好的解决方案?
谢谢!
编辑:因为没有人会在没有先发布一段代码的情况下提供帮助(而且 Whosebug 中的这种方法绝对是错误的)这就是我正在尝试的方式。:
<?php
$dir = "2000/";
$files = scandir($dir);
foreach ($files as $file) {
$fullName = pathinfo($file);
if ($fullName['extension'] === 'json') {
if (!in_array($fullName['filename'].'.pdf', $files)){
unlink($dir.$file);
}
}
}
现在如您所见,我只能搜索一种类型的文档(在本例中为.pdf
)。我想搜索除 .json
之外的每个扩展名,而且我不希望每个 json 文件到 运行 a foreach/in_array() 但只需要一个就可以实现所有这些foreach.
或许你应该换个角度考虑?我的意思是,遍历所有文件,并尝试找到 json
对应的文件,如果找不到,请将其删除。
看起来像这样:
$dir = "2000/";
foreach (glob($dir . "*.json") as $file) {
$file = new \SplFileInfo($dir . $file);
if (count(glob($dir . $file->getBasename('.' . $file->getExtension()) . ".*")) === 1) {
unlink($dir . $file->getFilename());
}
}
手动