Python 中两个 Unicode 数组的交集

Intersection of two Unicode Arrays in Python

我的程序的工作: 1) 从文件 test.txt 我搜索包含单词“साधु”的行。 2)搜索该行后,我提取与其左右相邻的单词。 3)将这些词附加到数组后,我尝试在这两个数组中找到相交的词。

您可以使用以下代码将字符串解码为 un​​icode

mylist = map(lambda word: word.decode('utf-8'), mylist)

尽管出于交叉目的,您不需要对其进行解码。你可以做

#considering you have two lists 'list1' and 'list2'

intersection = set(list1).intersection(set(list2))