从具有多行的列创建列表
creating a list from a column with multiple lines
我有一个 Pandas 数据框,在一个名为 SourceDocument 的列中,每个单元格中有多行数据(以 \n 分隔)。
源文档
PRDS-002039\nPRDS-001952\nPRDS-001956
我想 运行 一个 for 循环,它读取每一行,然后将这些行分隔成一个列表。最终,我想要一本字典,其中的值是拆分项目的列表。
例如:
来源ID
546785: ['PRDS-002039','PRDS-001952','PRDS-001956']
字典键(546785)是通过另一个for循环生成的
我写了下面的代码,但不知道如何逐行拆分
valuez=[]
for j in range (0,ABP215.shape[0]):
valuez.append(ABP215['SourceDocuments'][j].split('\n'))
APB215 是 Pandaas 数据框名称。
我收到这个错误:
AttributeError: 'float' 对象没有属性 'split'
如有任何帮助,我们将不胜感激。
谢谢大家的帮助,对于我的问题没有说清楚,我深表歉意。这是在社区帮助下汇总的答案。
SourceDocumentID=np.arange(1001,1001+ABP215.shape[0],1)
SourceDocumentID=list(SourceDocumentID)
keyz=[]
for i in range(0,len(SourceDocumentID)): # building
keyz.append(SourceDocumentID[i])
valuez=[]
for j in range (0,ABP215.shape[0]):
valuez.append(ABP215['Source Document'].apply(str)[j].split('\n'))
sourcedocuments={k:v for k,v in zip(keyz,valuez) }
SourceDoc=pd.DataFrame.from_dict(sourcedocuments,orient='index')
我有一个 Pandas 数据框,在一个名为 SourceDocument 的列中,每个单元格中有多行数据(以 \n 分隔)。
源文档
PRDS-002039\nPRDS-001952\nPRDS-001956
我想 运行 一个 for 循环,它读取每一行,然后将这些行分隔成一个列表。最终,我想要一本字典,其中的值是拆分项目的列表。 例如:
来源ID
546785: ['PRDS-002039','PRDS-001952','PRDS-001956']
字典键(546785)是通过另一个for循环生成的 我写了下面的代码,但不知道如何逐行拆分
valuez=[]
for j in range (0,ABP215.shape[0]):
valuez.append(ABP215['SourceDocuments'][j].split('\n'))
APB215 是 Pandaas 数据框名称。
我收到这个错误:
AttributeError: 'float' 对象没有属性 'split'
如有任何帮助,我们将不胜感激。
谢谢大家的帮助,对于我的问题没有说清楚,我深表歉意。这是在社区帮助下汇总的答案。
SourceDocumentID=np.arange(1001,1001+ABP215.shape[0],1)
SourceDocumentID=list(SourceDocumentID)
keyz=[]
for i in range(0,len(SourceDocumentID)): # building
keyz.append(SourceDocumentID[i])
valuez=[]
for j in range (0,ABP215.shape[0]):
valuez.append(ABP215['Source Document'].apply(str)[j].split('\n'))
sourcedocuments={k:v for k,v in zip(keyz,valuez) }
SourceDoc=pd.DataFrame.from_dict(sourcedocuments,orient='index')