如何在 PDFPlumber 库中使用 page.filter(test_function)?

How to use page.filter(test_function) in PDFPlumber library?

我正在尝试删除 pdf 页面中的 tables,我正在尝试为此使用 page.filter() 函数,在这里我有 table bbox 坐标 并且我正在尝试比较对象坐标是否在 table 坐标内。 但是我无法找到过滤功能的任何示例用法。

这里是 documentation link

我这样试过:

def filter_func(object):
  #some logic to find the coordinates inside boundary or not

new_page = page.filter(lambda x: x if filter_func(x) else '')

但不幸的是,这种用法不起作用,请帮助了解如何使用 page.filter 函数

找到了这个正在运行的:

def filter_func(object):
 #some logic to find the coordinates inside boundary or not

new_page = page.filter(filter_func)

page.filter 是一个生成器,仅在您使用 new_page

时执行