如何在 Scala 中正确解压缩 gz 存档

How to properly decompress gz archive in Scala

我是 Scala 的新手,我有一个小任务需要我从 resources 目录中解压 *.gz file。 所以我想要一个正确的方法来做到这一点,以便能够在之后解析文件内容。当然,我过去读过一些文章,例如: ONE TWO THREE

我可以解析未归档但现在无法处理 gz 归档的文件内容。看起来我遗漏了一些小东西,因为我是 Java 和 Scala 的新手。

Scala 版本 - 2.21.0

我的部分代码如下:

object ResourceLoader {
    def loadResource(fileName: String): Try[InputStream] = Try(getClass.getResourceAsStream(fileName))


    def loadResource(fileName: String): Try[List[String]] =
        for {
            resourceStream <- loadResource(fileName)
            resourceContent = Source.fromInputStream(resourceStream).getLines.toList
        } yield resourceContent
}

然后我可以遍历未归档的文件,例如:

        val content = ResourceLoader.loadResourceContent("/test_text.csv") recover {
            case e: FileNotFoundException => println(s"Requested file not found: $e")
            case e: SecurityException => println(s"Permission denied: $e")
            case e: Exception => println(s"An unknown exception occurred: $e")
        }
        content.foreach(println)

但无法理解如何先解压 gz 存档然后对其进行迭代。

我希望在 loadResource 函数中使用 GZIPInputStream 而不是 getResourceAsStream,但不明白如何以正确的方式做到这一点。

提前感谢您的帮助!

正如@Luis 评论的那样,您可以这样做:


val inputStream = Thread.currentThread().getContextClassLoader.getResourceAsStream("test_text.csv.gz")
val gzipFileSource: BufferedSource = Source.fromInputStream(new GZIPInputStream(inputStream))

println(gzipFileSource.getLines.toList.head)