delimit/split 行值并形成单独的行

Question

数据的可重现代码：

import pandas as pd
dict = {"a": "[1,2,3,4]", "b": "[1,2,3,4]"}
dict = pd.DataFrame(list(dict.items()))

dict

    0   1
 0  a   [1,2,3,4]
 1  b   [1,2,3,4]

我想 split/delimit "column 1" 并为每个拆分值创建单独的行。

预期输出：

我应该先去掉括号然后拆分值吗？我真的不知道这样做。请问有什么参考可以帮助我解决这个问题吗？

Answer 1

基于that answer的逻辑：

s = d[1]\
    .apply(lambda x: pd.Series(eval(x)))\
    .stack()

s.index = s.index.droplevel(-1)
s.name = "split"
d.join(s).drop(1, axis=1)

Answer 2

因为您的单元格中有包含列表（而非列表）的字符串，您可以使用 eval:

dict_v = {"a": "[1,2,3,4]", "b": "[1,2,3,4]"}
df = pd.DataFrame(list(dict_v.items()))
df = (df.rename(columns={0:'l'}).set_index('l')[1]
          .apply(lambda x: pd.Series(eval(x))).stack()
           .reset_index().drop('level_1',1).rename(columns={'l':0,0:1}))

或者另一种方法是创建一个 DataFrame（可能更快），例如：

df = (pd.DataFrame(df[1].apply(eval).tolist(),index=df[0])
          .stack().reset_index(level=1, drop=True)
            .reset_index(name='1'))

你的输出是

所有的重命名都是为了得到你的 input/output

delimit/split 行值并形成单独的行

delimit/split row values and form individual rows

python

delimiter

reshape