从具有多行的列创建列表

creating a list from a column with multiple lines

我有一个 Pandas 数据框,在一个名为 SourceDocument 的列中,每个单元格中有多行数据(以 \n 分隔)。

源文档

PRDS-002039\nPRDS-001952\nPRDS-001956

我想 运行 一个 for 循环,它读取每一行,然后将这些行分隔成一个列表。最终,我想要一本字典,其中的值是拆分项目的列表。 例如:

来源ID

546785: ['PRDS-002039','PRDS-001952','PRDS-001956']

字典键(546785)是通过另一个for循环生成的 我写了下面的代码,但不知道如何逐行拆分

valuez=[]    
for j in range (0,ABP215.shape[0]):
       valuez.append(ABP215['SourceDocuments'][j].split('\n'))

APB215 是 Pandaas 数据框名称。

我收到这个错误:

AttributeError: 'float' 对象没有属性 'split'

如有任何帮助,我们将不胜感激。

谢谢大家的帮助,对于我的问题没有说清楚,我深表歉意。这是在社区帮助下汇总的答案。

SourceDocumentID=np.arange(1001,1001+ABP215.shape[0],1)
SourceDocumentID=list(SourceDocumentID)

keyz=[]
for i in range(0,len(SourceDocumentID)): # building 
  keyz.append(SourceDocumentID[i])
valuez=[]
for j in range (0,ABP215.shape[0]):
  valuez.append(ABP215['Source Document'].apply(str)[j].split('\n'))
sourcedocuments={k:v for k,v in zip(keyz,valuez) }

SourceDoc=pd.DataFrame.from_dict(sourcedocuments,orient='index')