pydantic @validate_arguments 非内置类型(如 pandas DataFrame)的最佳实践

Best practice to pydantic @validate_arguments for non built-in types like pandas DataFrame

我目前正在尝试使用 pydantic 验证函数的输入参数。这适用于内置数据类型,但不适用于 pandas.DataFrame 或 numpy.array 等类型。 示例:

@validate_arguments
def some_function(params: pd.DataFrame,
                  var_name: str
                  ) -> dict:
    # do something
    return my_dict

调用 some_function 时显示以下错误:

RuntimeError: no validator found for <class 'pandas.core.frame.DataFrame'>, see `arbitrary_types_allowed` in Config`

我的第一个想法是用这样的东西定义我自己的 DataFrame 类型:

class MyDF(pd.DataFrame):
    @classmethod
    def __get_validators__(cls):
        yield cls.validate

    @classmethod
    def validate(cls, val):
        return pd.DataFrame(val)

我不确定这是否是最佳做法。有没有人有更好的想法?

您可以定义一个 custom config 以允许任意类型,以便 pydantic 检查参数是该类型的实例。

例如:

@validate_arguments(config=dict(arbitrary_types_allowed=True))
def some_function(params: pd.DataFrame,
                  var_name: str
                  ) -> dict:
    # do something
    return my_dict

模型配置选项的文档可用here