如何在 Scala 中正确解压缩 gz 存档
How to properly decompress gz archive in Scala
我是 Scala 的新手,我有一个小任务需要我从 resources
目录中解压 *.gz file
。
所以我想要一个正确的方法来做到这一点,以便能够在之后解析文件内容。当然,我过去读过一些文章,例如:
ONE
TWO
THREE
我可以解析未归档但现在无法处理 gz 归档的文件内容。看起来我遗漏了一些小东西,因为我是 Java 和 Scala 的新手。
Scala 版本 - 2.21.0
我的部分代码如下:
object ResourceLoader {
def loadResource(fileName: String): Try[InputStream] = Try(getClass.getResourceAsStream(fileName))
def loadResource(fileName: String): Try[List[String]] =
for {
resourceStream <- loadResource(fileName)
resourceContent = Source.fromInputStream(resourceStream).getLines.toList
} yield resourceContent
}
然后我可以遍历未归档的文件,例如:
val content = ResourceLoader.loadResourceContent("/test_text.csv") recover {
case e: FileNotFoundException => println(s"Requested file not found: $e")
case e: SecurityException => println(s"Permission denied: $e")
case e: Exception => println(s"An unknown exception occurred: $e")
}
content.foreach(println)
但无法理解如何先解压 gz 存档然后对其进行迭代。
我希望在 loadResource 函数中使用 GZIPInputStream 而不是 getResourceAsStream,但不明白如何以正确的方式做到这一点。
提前感谢您的帮助!
正如@Luis 评论的那样,您可以这样做:
val inputStream = Thread.currentThread().getContextClassLoader.getResourceAsStream("test_text.csv.gz")
val gzipFileSource: BufferedSource = Source.fromInputStream(new GZIPInputStream(inputStream))
println(gzipFileSource.getLines.toList.head)
我是 Scala 的新手,我有一个小任务需要我从 resources
目录中解压 *.gz file
。
所以我想要一个正确的方法来做到这一点,以便能够在之后解析文件内容。当然,我过去读过一些文章,例如:
ONE
TWO
THREE
我可以解析未归档但现在无法处理 gz 归档的文件内容。看起来我遗漏了一些小东西,因为我是 Java 和 Scala 的新手。
Scala 版本 - 2.21.0
我的部分代码如下:
object ResourceLoader {
def loadResource(fileName: String): Try[InputStream] = Try(getClass.getResourceAsStream(fileName))
def loadResource(fileName: String): Try[List[String]] =
for {
resourceStream <- loadResource(fileName)
resourceContent = Source.fromInputStream(resourceStream).getLines.toList
} yield resourceContent
}
然后我可以遍历未归档的文件,例如:
val content = ResourceLoader.loadResourceContent("/test_text.csv") recover {
case e: FileNotFoundException => println(s"Requested file not found: $e")
case e: SecurityException => println(s"Permission denied: $e")
case e: Exception => println(s"An unknown exception occurred: $e")
}
content.foreach(println)
但无法理解如何先解压 gz 存档然后对其进行迭代。
我希望在 loadResource 函数中使用 GZIPInputStream 而不是 getResourceAsStream,但不明白如何以正确的方式做到这一点。
提前感谢您的帮助!
正如@Luis 评论的那样,您可以这样做:
val inputStream = Thread.currentThread().getContextClassLoader.getResourceAsStream("test_text.csv.gz")
val gzipFileSource: BufferedSource = Source.fromInputStream(new GZIPInputStream(inputStream))
println(gzipFileSource.getLines.toList.head)