稀疏数据帧 returns AttributeError

Sparse DataFrame returns AttributeError

我创建了以下 DataFrame:

trains = np.arange(100)
tresholds = [10, 20, 30, 40, 50, 60]
tuples = []
for i in trains:
    for j in tresholds:
        tuples.append((i, j))

index = pd.MultiIndex.from_tuples(tuples, names=['trains', 'tresholds'])
matrix = np.empty((len(index), len(trains)))
matrix.fill(np.nan)
df = pd.DataFrame(matrix, index=index, columns=trains, dtype=float)

这个 DataFrame 是使用 df.loc[(x, y), z] 索引填充的,但它包含的 NaN 比实际数字多,所以我想创建一个稀疏 DataFrame。但是 df.to_sparse() 给了我 this error (full trace).

在这种转换中,所有 nan 列都是错误的 ATM。但是,如果您已经有一个 SparseFrame 添加一个 nan 列就可以了。

如果你这样做了:

df.iloc[0] = 0
df.to_sparse()

有效。