python difflib 打印只匹配两个字符串之间的部分
python difflib print only matches part between two strings
我是 python 的新手,我需要一些关于 difflib 的帮助。我试着阅读了文档,但对我来说文档并不容易理解。
我想比较两个字符串,我希望输出只是两个字符串之间的匹配前缀部分(不打印差异)。
示例:
t1 = "hello my name is Tom"
t2 = "hello his name is Sawyer"
预期输出为:"hello "
我尝试了以下方法,但输出不是我想要的,因为它将输出打印为数组,并且不仅打印匹配部分:
#!/usr/bin/python
import difflib
t1 = "hello my name is Tom"
t2 = "hello his name is Sawyer"
seq = difflib.Differ()
seq = seq.compare(t1,t2)
print list(seq)
其他示例 2:
t1 = "20180628-153020"
t2 = "20180628-173020"
预期输出打印输出:
"20180628-1"
和后缀“3020”即使字符串的位置和字符都匹配,也应该忽略。
请帮帮我..谢谢...
更新 2018/07/02
我写了一段小代码来只获取两个字符串之间前缀的相似部分(不使用 takewhile
作为@Eugene 的第一个答案),但我认为@Eugene 在答案中编写的第二个代码是比我的更短、更高效。
这是我的代码:
def getprefix(s1, s2):
pref = ""
ls1 = list(s1)
ls2 = list(s2)
i=0
while i < len(ls1):
if ls1[i] not in ls2[i]:
return pref
pref += ls1[i]
i += 1
In [1]: from itertools import takewhile
In [2]: ''.join(a for (a, b) in takewhile(lambda (a, b): a == b, zip(t1, t2)))
Out[2]: '20180628-1'
这里我们将两个字符串压缩在一起,并在它们的前缀相等时对其进行迭代。
更新。不使用 itertools
的等效解决方案:
result = []
for a, b in zip(t1, t2):
if a != b:
break
result.append(a)
return ''.join(result)
我是 python 的新手,我需要一些关于 difflib 的帮助。我试着阅读了文档,但对我来说文档并不容易理解。
我想比较两个字符串,我希望输出只是两个字符串之间的匹配前缀部分(不打印差异)。
示例:
t1 = "hello my name is Tom"
t2 = "hello his name is Sawyer"
预期输出为:"hello "
我尝试了以下方法,但输出不是我想要的,因为它将输出打印为数组,并且不仅打印匹配部分:
#!/usr/bin/python
import difflib
t1 = "hello my name is Tom"
t2 = "hello his name is Sawyer"
seq = difflib.Differ()
seq = seq.compare(t1,t2)
print list(seq)
其他示例 2:
t1 = "20180628-153020"
t2 = "20180628-173020"
预期输出打印输出: "20180628-1" 和后缀“3020”即使字符串的位置和字符都匹配,也应该忽略。
请帮帮我..谢谢...
更新 2018/07/02
我写了一段小代码来只获取两个字符串之间前缀的相似部分(不使用 takewhile
作为@Eugene 的第一个答案),但我认为@Eugene 在答案中编写的第二个代码是比我的更短、更高效。
这是我的代码:
def getprefix(s1, s2):
pref = ""
ls1 = list(s1)
ls2 = list(s2)
i=0
while i < len(ls1):
if ls1[i] not in ls2[i]:
return pref
pref += ls1[i]
i += 1
In [1]: from itertools import takewhile
In [2]: ''.join(a for (a, b) in takewhile(lambda (a, b): a == b, zip(t1, t2)))
Out[2]: '20180628-1'
这里我们将两个字符串压缩在一起,并在它们的前缀相等时对其进行迭代。
更新。不使用 itertools
的等效解决方案:
result = []
for a, b in zip(t1, t2):
if a != b:
break
result.append(a)
return ''.join(result)