如何比较每列文本值?
How to compare between each columns text value?
我想与 python 中的每一列进行比较。
例如:
no.
name
name_convert
contains
0
applepie
apple
True
1
applepie
strawberry
False
2
bananashake
banana
True
3
bananashake
banana
True
我想创建 contains
列。它定义了每列的比较结果(name
与 name_convert
)。 applepie (in name
) 包含 apple(in name_convert
) string.
如果 name_convert
是 name
的子字符串,我如何创建一个包含 True 的新列?
这是我的尝试:
data['contains'] = data['name'].isin(data['name_convert'])
您可以使用 list comprehension
和 zip
函数来完成:
df['contains']=[i in j for i,j in zip(df['name_convert'],df['name'])]
: df
Out[10]:
no. name name_convert contains
0 0 applepie apple True
1 1 applepie strawberry False
2 2 bananashake banana True
3 3 bananashake banana True
我想与 python 中的每一列进行比较。
例如:
no. | name | name_convert | contains |
---|---|---|---|
0 | applepie | apple | True |
1 | applepie | strawberry | False |
2 | bananashake | banana | True |
3 | bananashake | banana | True |
我想创建 contains
列。它定义了每列的比较结果(name
与 name_convert
)。 applepie (in name
) 包含 apple(in name_convert
) string.
如果 name_convert
是 name
的子字符串,我如何创建一个包含 True 的新列?
这是我的尝试:
data['contains'] = data['name'].isin(data['name_convert'])
您可以使用 list comprehension
和 zip
函数来完成:
df['contains']=[i in j for i,j in zip(df['name_convert'],df['name'])]
: df
Out[10]:
no. name name_convert contains
0 0 applepie apple True
1 1 applepie strawberry False
2 2 bananashake banana True
3 3 bananashake banana True