为什么页面的 MuPDF MediaBox 比包含的图像小?
Why is the MuPDF MediaBox of a page smaller than a contained image?
为了 this example PDF,我这样做了:
import fitz
doc = fitz.open("PDF-export-example-image-ocr.pdf")
print(f"(1) {doc[0].bound()=}")
print(f"(2) {doc[0].MediaBox=}")
print(f"(3) {doc[0].getImageList()}")
doc.close()
给出:
(1) doc[0].bound()=Rect(0.0, 0.0, 612.0399780273438, 792.530029296875)
(2) doc[0].MediaBox=Rect(0.0, 0.0, 612.0399780273438, 792.530029296875)
(3) [(15, 0, 1275, 1651, 8, 'DeviceRGB', '', 'R12', 'DCTDecode')]
我希望 (1) 和 (2) 相同,虽然我不明白为什么有两种方法可以相同。
我不明白的是为什么 (3) 中图像的值比它所在的页面大得多。有人可以解释一下吗?
您看到的图像大小是嵌入的JPEG图像资源中有多少像素。这对在页面上绘制图像时的大小几乎没有影响。页面上图像的物理尺寸完全由绘制图像的页面内容流命令决定。
为了 this example PDF,我这样做了:
import fitz
doc = fitz.open("PDF-export-example-image-ocr.pdf")
print(f"(1) {doc[0].bound()=}")
print(f"(2) {doc[0].MediaBox=}")
print(f"(3) {doc[0].getImageList()}")
doc.close()
给出:
(1) doc[0].bound()=Rect(0.0, 0.0, 612.0399780273438, 792.530029296875)
(2) doc[0].MediaBox=Rect(0.0, 0.0, 612.0399780273438, 792.530029296875)
(3) [(15, 0, 1275, 1651, 8, 'DeviceRGB', '', 'R12', 'DCTDecode')]
我希望 (1) 和 (2) 相同,虽然我不明白为什么有两种方法可以相同。
我不明白的是为什么 (3) 中图像的值比它所在的页面大得多。有人可以解释一下吗?
您看到的图像大小是嵌入的JPEG图像资源中有多少像素。这对在页面上绘制图像时的大小几乎没有影响。页面上图像的物理尺寸完全由绘制图像的页面内容流命令决定。