使用 Python 将文本和数字与字母数字文本分开
Separate Text and number from Alphanumeric text using Python
我有一个 excel sheet 在 A 列和 B 列中包含大量数据,如下所示。 B 列始终以字母 M 开头,然后是数字。
A B
Pradeep440 M440
Azhar541 M541
Venkat456 M456
Akash144 M144
Vipul157 M157
Fairo452 M452
Akshay449 M449
Pavan249 M249
Asad114 M114
Rudra890 M890
Niranjan120 M120
Darshan334 M334
Veeresh876 M876
预期输出:
A B C
Pradeep440 M440 440
Azhar541 M541 541
Venkat456 M456 456
Akash144 M144 144
Vipul157 M157 157
Fairo452 M452 452
Akshay449 M449 449
Pavan249 M249 249
Asad114 M114 114
Rudra890 M890 890
Niranjan120 M120 120
Darshan334 M334 334
Veeresh876 M876 876
谁能指导我如何使用 python 拆分或分离它,我是新手 python.Appreciate 你的帮助。
与strip
一起做
df['C']=df.B.str.strip('M')
df
Out[132]:
A B C
0 Pradeep440 M440 440
1 Azhar541 M541 541
2 Venkat456 M456 456
3 Akash144 M144 144
4 Vipul157 M157 157
5 Fairo452 M452 452
6 Akshay449 M449 449
7 Pavan249 M249 249
8 Asad114 M114 114
9 Rudra890 M890 890
10 Niranjan120 M120 120
11 Darshan334 M334 334
12 Veeresh876 M876 876
你可以做到 extract
:
df['C'] = df['B'].str.extract('(\d+)$')[0]
因为你有修复甲酸盐,你可以跳过字符串中的第一个字符
df["C"] = df.B.str[1:]
或
df["C"] = df.iloc[:,1].str[1:]
df
A B C
0 Pradeep440 M440 440
1 Azhar541 M541 541
2 Venkat456 M456 456
3 Akash144 M144 144
4 Vipul157 M157 157
5 Fairo452 M452 452
6 Akshay449 M449 449
7 Pavan249 M249 249
8 Asad114 M114 114
9 Rudra890 M890 890
10 Niranjan120 M120 120
11 Darshan334 M334 334
12 Veeresh876 M876 876
我有一个 excel sheet 在 A 列和 B 列中包含大量数据,如下所示。 B 列始终以字母 M 开头,然后是数字。
A B
Pradeep440 M440
Azhar541 M541
Venkat456 M456
Akash144 M144
Vipul157 M157
Fairo452 M452
Akshay449 M449
Pavan249 M249
Asad114 M114
Rudra890 M890
Niranjan120 M120
Darshan334 M334
Veeresh876 M876
预期输出:
A B C
Pradeep440 M440 440
Azhar541 M541 541
Venkat456 M456 456
Akash144 M144 144
Vipul157 M157 157
Fairo452 M452 452
Akshay449 M449 449
Pavan249 M249 249
Asad114 M114 114
Rudra890 M890 890
Niranjan120 M120 120
Darshan334 M334 334
Veeresh876 M876 876
谁能指导我如何使用 python 拆分或分离它,我是新手 python.Appreciate 你的帮助。
与strip
df['C']=df.B.str.strip('M')
df
Out[132]:
A B C
0 Pradeep440 M440 440
1 Azhar541 M541 541
2 Venkat456 M456 456
3 Akash144 M144 144
4 Vipul157 M157 157
5 Fairo452 M452 452
6 Akshay449 M449 449
7 Pavan249 M249 249
8 Asad114 M114 114
9 Rudra890 M890 890
10 Niranjan120 M120 120
11 Darshan334 M334 334
12 Veeresh876 M876 876
你可以做到 extract
:
df['C'] = df['B'].str.extract('(\d+)$')[0]
因为你有修复甲酸盐,你可以跳过字符串中的第一个字符
df["C"] = df.B.str[1:]
或
df["C"] = df.iloc[:,1].str[1:]
df
A B C
0 Pradeep440 M440 440
1 Azhar541 M541 541
2 Venkat456 M456 456
3 Akash144 M144 144
4 Vipul157 M157 157
5 Fairo452 M452 452
6 Akshay449 M449 449
7 Pavan249 M249 249
8 Asad114 M114 114
9 Rudra890 M890 890
10 Niranjan120 M120 120
11 Darshan334 M334 334
12 Veeresh876 M876 876