连接熊猫数据框中字符串列和长列的值
concatenate values of string column and long column in panda dataframe
我有一个 pandas 数据框,它还没有索引(只是人工 1,2,3,.. 索引)
列 'store'、'style' 是字符串,列 'color'、'size' 是长整型。
None 它们本身是唯一的,但它们的串联是唯一的。
我想将它们连接起来生成一个索引,但是
df2['store']+df2['style']+str(df2['color'])+str(df2['size'])
或
df2['store']+df2['style']+df2['color'].to_string()+df2['size'].to_string()
两者都不起作用。我认为它需要整个列,强制它成为一个字符串并连接,这会导致奇怪的符号。并且合并无法正常工作。
连接字符串列和长列的正确方法是什么?
这应该是:
df2['store'] + df2['style'] + df2['color'].astype(str) + df2['size'].astype(str)
说明:str(df2['size'])
将对整个列进行字符串表示(一个字符串,与打印字符串时看到的内容相当),而 .astype(str)
将转换所有值系列到字符串。
to_string
给出与 str()
相同的结果(但采用可选参数来控制结果)
我有一个 pandas 数据框,它还没有索引(只是人工 1,2,3,.. 索引)
列 'store'、'style' 是字符串,列 'color'、'size' 是长整型。 None 它们本身是唯一的,但它们的串联是唯一的。
我想将它们连接起来生成一个索引,但是
df2['store']+df2['style']+str(df2['color'])+str(df2['size'])
或
df2['store']+df2['style']+df2['color'].to_string()+df2['size'].to_string()
两者都不起作用。我认为它需要整个列,强制它成为一个字符串并连接,这会导致奇怪的符号。并且合并无法正常工作。
连接字符串列和长列的正确方法是什么?
这应该是:
df2['store'] + df2['style'] + df2['color'].astype(str) + df2['size'].astype(str)
说明:str(df2['size'])
将对整个列进行字符串表示(一个字符串,与打印字符串时看到的内容相当),而 .astype(str)
将转换所有值系列到字符串。
to_string
给出与 str()
相同的结果(但采用可选参数来控制结果)