如何在 pdf 中获取页面的特定部分并将其保存到 python 中的新 pdf?
How do I get a specific part of a page in a pdf and save it to a new pdf in python?
我在使用 python 处理 pdf 方面经验很少,我的经验仅限于使用 'pdfreader' 和 python 库进行阅读。我有一个 pdf,(在这种情况下是过去的试卷),我希望它在遇到问题编号时拆分页面,假设这个例子是 12(格式为“12”),然后保存拆分部分包含数字 12. 在新的 pdf 中。我该怎么做?
我不是一个很好的程序员,如果我的问题很愚蠢,我很抱歉,但是在互联网上搜索我找不到如何做到这一点。
最后的解决方案是将 pdf 页面转换为图像,在我想要的地方裁剪它,然后再恢复为 pdf。要获取坐标,我必须使用 pdf miner,然后获取像素来修改图像,我必须在 pdf 坐标中的页面高度和我想以像素为单位创建的图像的高度之间建立一个比例,然后我可以将一个的坐标转换为另一个的坐标。
我在使用 python 处理 pdf 方面经验很少,我的经验仅限于使用 'pdfreader' 和 python 库进行阅读。我有一个 pdf,(在这种情况下是过去的试卷),我希望它在遇到问题编号时拆分页面,假设这个例子是 12(格式为“12”),然后保存拆分部分包含数字 12. 在新的 pdf 中。我该怎么做?
我不是一个很好的程序员,如果我的问题很愚蠢,我很抱歉,但是在互联网上搜索我找不到如何做到这一点。
最后的解决方案是将 pdf 页面转换为图像,在我想要的地方裁剪它,然后再恢复为 pdf。要获取坐标,我必须使用 pdf miner,然后获取像素来修改图像,我必须在 pdf 坐标中的页面高度和我想以像素为单位创建的图像的高度之间建立一个比例,然后我可以将一个的坐标转换为另一个的坐标。