使用模式拆分文本的问题

Issue splitting a text with a pattern

我正在编写一个脚本,它可以帮助我们使用特定模式(逗号 + " " + 大写字母)拆分文本。所以,我做了正则表达式:patt = re.compile(r'\b, [A-Z]') 然后,我拆分了遵循这种模式的文本,当我这样做时,大写字母被排除在外,这不是我正在寻找的预期结果。

示例:

target_string = 'Prueba1, palabra 1, Palabra 2, palabra 3, palabra 4, Palabra5 frase1'

patt = re.compile(r'\b, [A-Z]')
print(patt.split(target_string))
Result: ['Prueba1, palabra 1', **'alabra 2**, palabra 3, palabra 4', **'alabra5 frase1'**]
Expected result: ['Prueba1, palabra 1', 'Palabra 2, palabra 3, palabra 4', 'Palabra5 frase1']

我希望你能帮助我修复我的脚本。

您需要让大写字母成为“先行”——返回的匹配字符串中不包含这一要求。

patt = re.compile(r'\b, (?=[A-Z])')