如何从列表项中删除'\n'
How to delete '\n' from items of a list
我要从列表项中删除“\n”(新行)。以下命令从 DataFrame 格式的 excel 文件中读取数据,然后将其转换为列表 'bodylist':
data = pd.read_excel (r'C:\Users\thmag\HealthUnlockSelenium\PopularPosts\out2.xlsx')
df = pd.DataFrame(data, columns= ['body'])
#print (df)
#convert df to list
bodylist = df.values.tolist()
bodylist= map(lambda s: s.strip(),bodylist)
for item in bodylist:
print (item)
但是我有以下错误:
bodylist= map(lambda s: s.strip(),bodylist)
AttributeError: 'list' object has no attribute 'strip'
你可以试试这个
bodylist = df.values.tolist()
bodylist = [elt.replace("\n", "") for elt in bodylist]
鉴于您有一个列表,您可以理解地浏览它并创建一个没有 «\n» 字符的新列表。
df['body'] = df['body'].apply(lambda line: line.replace('\n', ''))
此代码将在数据帧本身内执行操作,apply
采用函数或 lambda 操作并将对数据帧中的每一行执行它。
如果之后需要列表表示,可以将其转换为列表。
我要从列表项中删除“\n”(新行)。以下命令从 DataFrame 格式的 excel 文件中读取数据,然后将其转换为列表 'bodylist':
data = pd.read_excel (r'C:\Users\thmag\HealthUnlockSelenium\PopularPosts\out2.xlsx')
df = pd.DataFrame(data, columns= ['body'])
#print (df)
#convert df to list
bodylist = df.values.tolist()
bodylist= map(lambda s: s.strip(),bodylist)
for item in bodylist:
print (item)
但是我有以下错误:
bodylist= map(lambda s: s.strip(),bodylist)
AttributeError: 'list' object has no attribute 'strip'
你可以试试这个
bodylist = df.values.tolist()
bodylist = [elt.replace("\n", "") for elt in bodylist]
鉴于您有一个列表,您可以理解地浏览它并创建一个没有 «\n» 字符的新列表。
df['body'] = df['body'].apply(lambda line: line.replace('\n', ''))
此代码将在数据帧本身内执行操作,apply
采用函数或 lambda 操作并将对数据帧中的每一行执行它。
如果之后需要列表表示,可以将其转换为列表。