访问文件时 TPath 忽略大小写 [Java TrueZip]
TPath ignore case when accessing file [Java TrueZip]
有没有办法在使用 TrueZip 忽略文件名大小写的同时访问存档中的文件?
想象一下下面的 zip 存档内容:
MyZip.zip
-> myFolder/tExtFile.txt
-> anotherFolder/TextFiles/file.txt
-> myFile.txt
-> anotherFile.txt
-> OneMOREfile.txt
这是它的工作原理:
TPath tPath = new TPath("MyZip.zip\myFolder\tExtFile.txt");
System.out.println(tPath.toFile().getName()); //prints tExtFile.txt
如何做到同样但忽略所有大小写,如下所示:
// note "myFolder" changed to "myfolder" and "tExtFile" to "textfile"
TPath tPath = new TPath("MyZip.zip\myfolder\textfile.txt");
System.out.println(tPath.toFile().getName()); // should print tExtFile.txt
上面的代码抛出 FsEntryNotFoundException ... (no such entry)
它适用于常规 java.io.File
,不确定为什么不适用于 TrueZip 的 TFile
或者我遗漏了什么?
我的目标是只对文件和文件夹使用小写来访问每个文件。
编辑:24-03-2017
假设我想从提到的 zip 存档中的文件中读取字节 MyZip.zip
Path tPath = new TPath("...MyZip.zip\myFolder\tExtFile.txt");
byte[] bytes = Files.readAllBytes(tPath); //returns bytes of the file
上面的代码片段有效,但下面的代码片段无效(抛出问题 -> FsEntryNotFoundException
)。它是相同的路径和文件,只是小写。
Path tPath = new TPath("...myzip.zip\myfolder\textfile.txt");
byte[] bytes = Files.readAllBytes(tPath);
你说:
My goal is to access each file just using only lowercase for files and folders.
但是一厢情愿不会让你走得太远。事实上,大多数文件系统(Windows 类型除外)都是区分大小写的,即在它们中,如果您使用大写或小写字符,会有很大的不同。您甚至可以在同一目录中多次使用不同大小写的 "same" 文件名。 IE。如果名称是 file.txt
、File.txt
或 file.TXT
,它实际上会有所不同。 Windows 在这里确实是个例外,但 TrueZIP 不模拟 Windows 文件系统,而是模拟通用存档文件系统,适用于所有平台上的 ZIP、TAR 等。因此,您无法选择是使用大写字符还是小写字符,但必须完全按照 ZIP 存档中存储的那样使用它们。
更新: 作为一个小证据,我登录到一个带有 extfs 文件系统的远程 Linux 框并执行了以下操作:
~$ mkdir test
~$ cd test
~/test$ touch file.txt
~/test$ touch File.txt
~/test$ touch File.TXT
~/test$ ls -l
total 0
-rw-r--r-- 1 group user 0 Mar 25 00:14 File.TXT
-rw-r--r-- 1 group user 0 Mar 25 00:14 File.txt
-rw-r--r-- 1 group user 0 Mar 25 00:14 file.txt
您可以清楚地看到,有三个不同的文件,而不仅仅是一个。
如果将这三个文件压缩到存档中会怎样?
~/test$ zip ../files.zip *
adding: File.TXT (stored 0%)
adding: File.txt (stored 0%)
adding: file.txt (stored 0%)
添加了三个文件。但是它们在存档中仍然是不同的文件还是只是存储在同一个名字下?
~/test$ unzip -l ../files.zip
Archive: ../files.zip
Length Date Time Name
--------- ---------- ----- ----
0 2017-03-25 00:14 File.TXT
0 2017-03-25 00:14 File.txt
0 2017-03-25 00:14 file.txt
--------- -------
0 3 files
“3 个文件”,它说 - quod erat demonstrandum。
如你所见,Windows并不是全世界。但是,如果您将该存档复制到 Windows 框并在那里解压缩,它只会将一个文件写入具有 NTFS 或 FAT 文件系统的磁盘 - 哪个是运气问题。如果三个文件的内容不同就很糟糕了。
更新 2: 好的,由于上面详细解释的原因,TrueZIP 中没有解决方案,但如果你想解决它,你可以像这样手动解决:
package de.scrum_master.app;
import de.schlichtherle.truezip.nio.file.TPath;
import java.io.IOException;
import java.net.URISyntaxException;
import java.nio.file.Files;
public class Application {
public static void main(String[] args) throws IOException, URISyntaxException {
TPathHelper tPathHelper = new TPathHelper(
new TPath(
"../../../downloads/powershellarsenal-master.zip/" +
"PowerShellArsenal-master\LIB/CAPSTONE\LIB\X64\LIBCAPSTONE.DLL"
)
);
TPath caseSensitivePath = tPathHelper.getCaseSensitivePath();
System.out.printf("Original path: %s%n", tPathHelper.getOriginalPath());
System.out.printf("Case-sensitive path: %s%n", caseSensitivePath);
System.out.printf("File size: %,d bytes%n", Files.readAllBytes(caseSensitivePath).length);
}
}
package de.scrum_master.app;
import de.schlichtherle.truezip.file.TFile;
import de.schlichtherle.truezip.nio.file.TPath;
import java.io.IOException;
import java.net.URISyntaxException;
import java.nio.file.Path;
public class TPathHelper {
private final TPath originalPath;
private TPath caseSensitivePath;
public TPathHelper(TPath tPath) {
originalPath = tPath;
}
public TPath getOriginalPath() {
return originalPath;
}
public TPath getCaseSensitivePath() throws IOException, URISyntaxException {
if (caseSensitivePath != null)
return caseSensitivePath;
final TPath absolutePath = new TPath(originalPath.toFile().getCanonicalPath());
TPath matchingPath = absolutePath.getRoot();
for (Path subPath : absolutePath) {
boolean matchFound = false;
for (TFile candidateFile : matchingPath.toFile().listFiles()) {
if (candidateFile.getName().equalsIgnoreCase(subPath.toString())) {
matchFound = true;
matchingPath = new TPath(matchingPath.toString(), candidateFile.getName());
break;
}
}
if (!matchFound)
throw new IOException("element '" + subPath + "' not found in '" + matchingPath + "'");
}
caseSensitivePath = matchingPath;
return caseSensitivePath;
}
}
当然,这有点难看,如果存档中有多个不区分大小写的匹配项,它只会为您提供第一个匹配路径。该算法将在每个子目录中的第一个匹配项后停止搜索。我对这个解决方案并不感到特别自豪,但这是一个很好的练习,你似乎坚持要这样做。我只希望您永远不会遇到在区分大小写的文件系统上创建并包含多个可能匹配项的 UNIX 样式 ZIP 存档。
顺便说一句,我的示例文件的控制台日志如下所示:
Original path: ..\..\..\downloads\powershellarsenal-master.zip\PowerShellArsenal-master\LIB\CAPSTONE\LIB\X64\LIBCAPSTONE.DLL
Case-sensitive path: C:\Users\Alexander\Downloads\PowerShellArsenal-master.zip\PowerShellArsenal-master\Lib\Capstone\lib\x64\libcapstone.dll
File size: 3.629.294 bytes
我没有安装 TrueZip 但我也想知道它在正常情况下如何工作 Path
,所以我在下面实现了非常相似的@kriegaex 解决方案,你可以尝试使用 caseCheck(path)
:
public class Main {
/**
* @param args
* @throws Exception
*/
public static void main(String[] args) throws Exception {
Path path = Paths.get("/home/user/workspace/JParser/myfolder/yourfolder/Hisfolder/a.txt");
Instant start = Instant.now();
Path resolution;
try{
resolution = caseCheck(path);
}catch (Exception e) {
throw new IllegalArgumentException("Couldnt access given path", e);
}
Instant end = Instant.now();
Duration duration = Duration.between(start, end);
System.out.println("Path is: " + resolution + " process took " + duration.toMillis() + "ms");
}
/**
* @param path
* @return
* @throws IOException
*/
private static Path caseCheck(Path path) throws IOException {
Path entryPoint = path.isAbsolute() ? path.getRoot() : Paths.get(".");
AtomicInteger counter = new AtomicInteger(0);
while (counter.get() < path.getNameCount()) {
entryPoint = Files
.walk(entryPoint, 1)
.filter(s -> checkPath(s, path, counter.get()))
.findFirst()
.orElseThrow(()->new IllegalArgumentException("No folder found"));
counter.getAndIncrement();
}
return entryPoint;
}
/**
* @param s
* @param path
* @param index
* @return
*/
private static final boolean checkPath(Path s, Path path, int index){
if (s.getFileName() == null) {
return false;
}
return s.getFileName().toString().equalsIgnoreCase(path.getName(index).toString());
}
}
有没有办法在使用 TrueZip 忽略文件名大小写的同时访问存档中的文件?
想象一下下面的 zip 存档内容:
MyZip.zip
-> myFolder/tExtFile.txt
-> anotherFolder/TextFiles/file.txt
-> myFile.txt
-> anotherFile.txt
-> OneMOREfile.txt
这是它的工作原理:
TPath tPath = new TPath("MyZip.zip\myFolder\tExtFile.txt");
System.out.println(tPath.toFile().getName()); //prints tExtFile.txt
如何做到同样但忽略所有大小写,如下所示:
// note "myFolder" changed to "myfolder" and "tExtFile" to "textfile"
TPath tPath = new TPath("MyZip.zip\myfolder\textfile.txt");
System.out.println(tPath.toFile().getName()); // should print tExtFile.txt
上面的代码抛出 FsEntryNotFoundException ... (no such entry)
它适用于常规 java.io.File
,不确定为什么不适用于 TrueZip 的 TFile
或者我遗漏了什么?
我的目标是只对文件和文件夹使用小写来访问每个文件。
编辑:24-03-2017
假设我想从提到的 zip 存档中的文件中读取字节 MyZip.zip
Path tPath = new TPath("...MyZip.zip\myFolder\tExtFile.txt");
byte[] bytes = Files.readAllBytes(tPath); //returns bytes of the file
上面的代码片段有效,但下面的代码片段无效(抛出问题 -> FsEntryNotFoundException
)。它是相同的路径和文件,只是小写。
Path tPath = new TPath("...myzip.zip\myfolder\textfile.txt");
byte[] bytes = Files.readAllBytes(tPath);
你说:
My goal is to access each file just using only lowercase for files and folders.
但是一厢情愿不会让你走得太远。事实上,大多数文件系统(Windows 类型除外)都是区分大小写的,即在它们中,如果您使用大写或小写字符,会有很大的不同。您甚至可以在同一目录中多次使用不同大小写的 "same" 文件名。 IE。如果名称是 file.txt
、File.txt
或 file.TXT
,它实际上会有所不同。 Windows 在这里确实是个例外,但 TrueZIP 不模拟 Windows 文件系统,而是模拟通用存档文件系统,适用于所有平台上的 ZIP、TAR 等。因此,您无法选择是使用大写字符还是小写字符,但必须完全按照 ZIP 存档中存储的那样使用它们。
更新: 作为一个小证据,我登录到一个带有 extfs 文件系统的远程 Linux 框并执行了以下操作:
~$ mkdir test
~$ cd test
~/test$ touch file.txt
~/test$ touch File.txt
~/test$ touch File.TXT
~/test$ ls -l
total 0
-rw-r--r-- 1 group user 0 Mar 25 00:14 File.TXT
-rw-r--r-- 1 group user 0 Mar 25 00:14 File.txt
-rw-r--r-- 1 group user 0 Mar 25 00:14 file.txt
您可以清楚地看到,有三个不同的文件,而不仅仅是一个。
如果将这三个文件压缩到存档中会怎样?
~/test$ zip ../files.zip *
adding: File.TXT (stored 0%)
adding: File.txt (stored 0%)
adding: file.txt (stored 0%)
添加了三个文件。但是它们在存档中仍然是不同的文件还是只是存储在同一个名字下?
~/test$ unzip -l ../files.zip
Archive: ../files.zip
Length Date Time Name
--------- ---------- ----- ----
0 2017-03-25 00:14 File.TXT
0 2017-03-25 00:14 File.txt
0 2017-03-25 00:14 file.txt
--------- -------
0 3 files
“3 个文件”,它说 - quod erat demonstrandum。
如你所见,Windows并不是全世界。但是,如果您将该存档复制到 Windows 框并在那里解压缩,它只会将一个文件写入具有 NTFS 或 FAT 文件系统的磁盘 - 哪个是运气问题。如果三个文件的内容不同就很糟糕了。
更新 2: 好的,由于上面详细解释的原因,TrueZIP 中没有解决方案,但如果你想解决它,你可以像这样手动解决:
package de.scrum_master.app;
import de.schlichtherle.truezip.nio.file.TPath;
import java.io.IOException;
import java.net.URISyntaxException;
import java.nio.file.Files;
public class Application {
public static void main(String[] args) throws IOException, URISyntaxException {
TPathHelper tPathHelper = new TPathHelper(
new TPath(
"../../../downloads/powershellarsenal-master.zip/" +
"PowerShellArsenal-master\LIB/CAPSTONE\LIB\X64\LIBCAPSTONE.DLL"
)
);
TPath caseSensitivePath = tPathHelper.getCaseSensitivePath();
System.out.printf("Original path: %s%n", tPathHelper.getOriginalPath());
System.out.printf("Case-sensitive path: %s%n", caseSensitivePath);
System.out.printf("File size: %,d bytes%n", Files.readAllBytes(caseSensitivePath).length);
}
}
package de.scrum_master.app;
import de.schlichtherle.truezip.file.TFile;
import de.schlichtherle.truezip.nio.file.TPath;
import java.io.IOException;
import java.net.URISyntaxException;
import java.nio.file.Path;
public class TPathHelper {
private final TPath originalPath;
private TPath caseSensitivePath;
public TPathHelper(TPath tPath) {
originalPath = tPath;
}
public TPath getOriginalPath() {
return originalPath;
}
public TPath getCaseSensitivePath() throws IOException, URISyntaxException {
if (caseSensitivePath != null)
return caseSensitivePath;
final TPath absolutePath = new TPath(originalPath.toFile().getCanonicalPath());
TPath matchingPath = absolutePath.getRoot();
for (Path subPath : absolutePath) {
boolean matchFound = false;
for (TFile candidateFile : matchingPath.toFile().listFiles()) {
if (candidateFile.getName().equalsIgnoreCase(subPath.toString())) {
matchFound = true;
matchingPath = new TPath(matchingPath.toString(), candidateFile.getName());
break;
}
}
if (!matchFound)
throw new IOException("element '" + subPath + "' not found in '" + matchingPath + "'");
}
caseSensitivePath = matchingPath;
return caseSensitivePath;
}
}
当然,这有点难看,如果存档中有多个不区分大小写的匹配项,它只会为您提供第一个匹配路径。该算法将在每个子目录中的第一个匹配项后停止搜索。我对这个解决方案并不感到特别自豪,但这是一个很好的练习,你似乎坚持要这样做。我只希望您永远不会遇到在区分大小写的文件系统上创建并包含多个可能匹配项的 UNIX 样式 ZIP 存档。
顺便说一句,我的示例文件的控制台日志如下所示:
Original path: ..\..\..\downloads\powershellarsenal-master.zip\PowerShellArsenal-master\LIB\CAPSTONE\LIB\X64\LIBCAPSTONE.DLL
Case-sensitive path: C:\Users\Alexander\Downloads\PowerShellArsenal-master.zip\PowerShellArsenal-master\Lib\Capstone\lib\x64\libcapstone.dll
File size: 3.629.294 bytes
我没有安装 TrueZip 但我也想知道它在正常情况下如何工作 Path
,所以我在下面实现了非常相似的@kriegaex 解决方案,你可以尝试使用 caseCheck(path)
:
public class Main {
/**
* @param args
* @throws Exception
*/
public static void main(String[] args) throws Exception {
Path path = Paths.get("/home/user/workspace/JParser/myfolder/yourfolder/Hisfolder/a.txt");
Instant start = Instant.now();
Path resolution;
try{
resolution = caseCheck(path);
}catch (Exception e) {
throw new IllegalArgumentException("Couldnt access given path", e);
}
Instant end = Instant.now();
Duration duration = Duration.between(start, end);
System.out.println("Path is: " + resolution + " process took " + duration.toMillis() + "ms");
}
/**
* @param path
* @return
* @throws IOException
*/
private static Path caseCheck(Path path) throws IOException {
Path entryPoint = path.isAbsolute() ? path.getRoot() : Paths.get(".");
AtomicInteger counter = new AtomicInteger(0);
while (counter.get() < path.getNameCount()) {
entryPoint = Files
.walk(entryPoint, 1)
.filter(s -> checkPath(s, path, counter.get()))
.findFirst()
.orElseThrow(()->new IllegalArgumentException("No folder found"));
counter.getAndIncrement();
}
return entryPoint;
}
/**
* @param s
* @param path
* @param index
* @return
*/
private static final boolean checkPath(Path s, Path path, int index){
if (s.getFileName() == null) {
return false;
}
return s.getFileName().toString().equalsIgnoreCase(path.getName(index).toString());
}
}