TypeError: _() takes 2 positional arguments but 4 were given Databricks

TypeError: _() takes 2 positional arguments but 4 were given Databricks

我有一个错误,出现在我 运行 我在 Databricks 中的脚本

TypeError: _() takes 2 positional arguments but 4 were given

sessionevents = eventsDF.filter(eventsDF.eventcategory.contains("size guide","native size guide","product interactions")).groupby('eventcategory','uniquesessionid').count()

我不确定在这种情况下是否应该定义自我,如果是,那么如何定义。谁能帮帮我?

Column 方法 contains 只能取一个值,但你传递的是 3。函数定义为:

def contains(self, item: Any) -> Column

错误消息显示“2 个位置参数”,因为它计算 self,即列本身。

如果我正确理解了您要实现的目标,您可以改用 rlike 函数:

sessionevents = eventsDF.filter(
       eventsDF.eventcategory.rlike("size guide|native size guide|product interactions")
   ).groupby('eventcategory', 'uniquesessionid').count().show()