在函数调用 print( ) 后打印所有列

print all columns in dask after a function call print( )

我拜访了

print(df.isna().sum().compute())

在我的 dask 数据框上。该代码有效并显示了预期的输出。然而,在各种在线教程、入门和示例中,结果显示了一个完整的列表,但是当我使用并遵循所使用的相同语法时,它向我展示了这个:

var1       39560
var2           0
var3      118665
var4           0
var5           0
        ...   
var55    6054144
var56     416086
var57      19780
var58      19780
var59    7972615

我想让输出显示我所有的 59 个变量。

您仍然可以使用某些 pandas 语法并且 dask“尊重”它。在 pandas 中,我们使用函数 pd.set_option("displa.max_rows", 59)。这个函数调用显示行,在你的情况下你有 59 个变量,因此括号中的 59,你应该能够得到所有变量的输出。

供参考。在调用打印之前键入它。

pd.set_option("displa.max_rows", 59)
print(df.isna().sum().compute())

它很管用。

作为另一种不修改 pandas 配置的解决方案:

print(*df.isna().sum().compute().items(), sep="\n")

如果.compute是重操作,重复调用, 有人可能想将它存储在一个变量中:

result = df.isna().sum().compute()
print(*result.items(), sep="\n")