确定 JPEG 颜色编码

Determining JPEG color encoding

我目前正在 python3.

上进行 PDF 图像提取

我已经完成了核心逻辑,它工作得很好。

问题是,有时 YCCK 编码的 JPG 文件从 PDF 中出来,用普通的图像查看器看起来很糟糕。

我可以将 YCCK 图像转换为 CMYK,但我不知道如何确定图像是 YCCK、CMYK 还是 YUV。

如果我将每个图像从 YCCK 转换为 CMYK,它会破坏 CMYK 和 YUV 图像。

我搜索了几个小时,只找到了 this

这篇文章帮助很大,但我不会用java API。

为了确定使用的色彩空间,您必须解析流中的 APPn 块以确定文件格式:JFIF、SPIFF、EXIF、ADOBE 等。如果您从 PDF 中获取它,这些文件可能是 ADOBE 格式。您需要查看他们的文档,了解他们如何使用 APPn 块。

这是一个包含摘要的页面:

http://www.sno.phy.queensu.ca/~phil/exiftool/TagNames/JPEG.html#Adobe