如何在 PDFPlumber 库中使用 page.filter(test_function)?
How to use page.filter(test_function) in PDFPlumber library?
我正在尝试删除 pdf 页面中的 tables,我正在尝试为此使用 page.filter() 函数,在这里我有 table bbox 坐标 并且我正在尝试比较对象坐标是否在 table 坐标内。
但是我无法找到过滤功能的任何示例用法。
我这样试过:
def filter_func(object):
#some logic to find the coordinates inside boundary or not
new_page = page.filter(lambda x: x if filter_func(x) else '')
但不幸的是,这种用法不起作用,请帮助了解如何使用 page.filter 函数
找到了这个正在运行的:
def filter_func(object):
#some logic to find the coordinates inside boundary or not
new_page = page.filter(filter_func)
page.filter 是一个生成器,仅在您使用 new_page
时执行
我正在尝试删除 pdf 页面中的 tables,我正在尝试为此使用 page.filter() 函数,在这里我有 table bbox 坐标 并且我正在尝试比较对象坐标是否在 table 坐标内。 但是我无法找到过滤功能的任何示例用法。
我这样试过:
def filter_func(object):
#some logic to find the coordinates inside boundary or not
new_page = page.filter(lambda x: x if filter_func(x) else '')
但不幸的是,这种用法不起作用,请帮助了解如何使用 page.filter 函数
找到了这个正在运行的:
def filter_func(object):
#some logic to find the coordinates inside boundary or not
new_page = page.filter(filter_func)
page.filter 是一个生成器,仅在您使用 new_page
时执行