如何从另一个子列表列表的特定元素创建新的子列表列表
How to create new list of sublists from specific elements of another list of sublists
我有一个子列表列表。每个子列表都是一个带有字符串的句子。我想删除每个列表的第三个元素以从每个子列表创建一个新列表。
我的代码是这样的:
我更改了我的代码(更新版本):
for list in list_Pos:
liste_globale = []
nouvelle_liste = []
for elt in list:
first, second, third = elt.split()
#print(first)
#print(second)
#print(third)
nouvelle_liste.append(third)
liste_globale.append(nouvelle_liste)
print(liste_globale)
更新:我的子列表列表是这样的:
[ ['Moi\tPRO:PER\tmoi', 'je\tPRO:PER\tje', 'ne\tADV\tne', 'trouve\tVER:pres\ttrouver', 'pas\tADV\tpas', 'très\tADV\ttrès', 'esthétique\tADJ\testhétique', '.\tSENT\t.'], ['L’esthétique\tADJ\tL’esthétique', 'pêche\tNOM\tpêche', 'un\tDET:ART\tun', 'peu\tADV\tpeu', '.\tSENT\t.'], ['Cette\tPRO:DEM\tce', 'grosse\tADJ\tgros', 'prise\tNOM\tprise', 'là\tADV\tlà', '...\tPUN\t...'], ['Cette\tPRO:DEM\tce', 'prise\tNOM\tprise', 'puis\tADV\tpuis', 'la\tDET:ART\tle', 'borne\tNOM\tborne', ',\tPUN\t,', 'ça\tPRO:DEM\tcela', 'se\tPRO:PER\tse', 'voit\tVER:pres\tvoir', '.\tSENT\t.'], ['Derrière\tPRP\tderrière', 'la\tDET:ART\tle', 'télé\tNOM\ttélé', 'ça\tPRO:DEM\tcela', 'va\tVER:pres\taller', 'mais\tKON\tmais', '...\tPUN\t...'], ['Mais\tKON\tmais', 'vu\tVER:pper\tvoir', 'le\tDET:ART\tle', 'système\tNOM\tsystème', 'ça\tPRO:DEM\tcela', 'va\tVER:pres\taller', 'être\tVER:infi\têtre', 'difficile\tADJ\tdifficile', 'de\tPRP\tde', 'faire\tVER:infi\tfaire', 'plus\tADV\tplus', 'sobre\tADJ\tsobre', '!\tSENT\t!'], ['M\tNOM\tM', '.\tSENT\t.', 'Laudrel\tNAM\tLaudrel', 'est\tVER:pres\têtre', 'mort\tVER:pper\tmourir', 'hier\tADV\thier', 'soir\tNOM\tsoir', '.\tSENT\t.'], ['je\tPRO:PER\tje', 'viens\tVER:pres\tvenir', '2.2\tNUM\t@card@', ',\tPUN\t,', 'lo\tVER:pper\tlo', '.\tSENT\t.']]
我的输出是这样的:
[['je', 'venir', '@card@', ',', 'lo', '.'], ['je', 'venir', '@card@', ',', 'lo', '.'], ['je', 'venir', '@card@', ',', 'lo', '.'], ['je', 'venir', '@card@', ',', 'lo', '.'], ['je', 'venir', '@card@', ',', 'lo', '.'], ['je', 'venir', '@card@', ',', 'lo', '.']]
您可以在 \t
和 select 第三个元素上使用 list comprehension
和 split
每个字符串。使用列表中的第一个示例:
l=[['M\tNOM\tM', '.\tSENT\t.', 'Laudrel\tNAM\tLaudrel'],['Derrière\tPRP\tderrière','la\tDET:ART\tle', 'télé\tNOM\tt']]
你可以这样做:
[[i.split('\t')[2] for i in subl] for subl in l]
[['M', '.', 'Laudrel'], ['Derrière', 'la', 'télé']]
每个子列表的第三个元素沿制表符 ('\t') 拆分。
以下解决方案与您的输出示例匹配:
# -*- coding: utf-8 -*-
list_Pos = [
['M\tNOM\tM', '.\tSENT\t.', 'Laudrel\tNAM\tLaudrel'],
['Derrière\tPRP\tderrière','la\tDET:ART\tle', 'télé\tNOM\tt']
]
final_result = []
for sub_list in list_Pos:
final_result.append([r.split("\t")[2] for r in sub_list])
print(final_result)
输出:
[['M', '.', 'Laudrel'], ['derrière', 'le', 't']]
列表理解split()
然后获取[2]
个元素(第三个元素)
test_list=[['M\tNOM\tM', '.\tSENT\t.', 'Laudrel\tNAM\tLaudrel'],['Derrière\tPRP\tderrière','la\tDET:ART\tle', 'télé\tNOM\tt']]
[[i.split('\t')[2] for i in subl] for subl in test_list]
输出
[['M', '.', 'Laudrel'], ['derrière', 'le', 't']]
此外,如果您总是需要最后一个索引,请使用 -1
,如索引
[[i.split('\t')[-1] for i in subl] for subl in test_list]
根据原始编辑输出,您可以对子列表 1 长度范围内的每个子列表的每个元素使用列表理解(假设所有子列表的长度相同)
lst = [['M\tNOM\tM', '.\tSENT\t.', 'Laudrel\tNAM\tLaudrel',],['Derrière\tPRP\tderrière','la\tDET:ART\tle', 'télé\tNOM\tt',]]
final_result = []
for x in range(len(lst[1])):
lst1 = [[item.split('\t')[x] for item in sblst] for sblst in lst]
final_result.append(lst1)
print(final_result)
要仅获取第三个元素,请删除 for 循环和 运行
lst1 = [[item.split('\t')[2] for item in sblst] for sblst in lst]
, 其中 x 刚设置为 2.
我有一个子列表列表。每个子列表都是一个带有字符串的句子。我想删除每个列表的第三个元素以从每个子列表创建一个新列表。 我的代码是这样的:
我更改了我的代码(更新版本):
for list in list_Pos:
liste_globale = []
nouvelle_liste = []
for elt in list:
first, second, third = elt.split()
#print(first)
#print(second)
#print(third)
nouvelle_liste.append(third)
liste_globale.append(nouvelle_liste)
print(liste_globale)
更新:我的子列表列表是这样的:
[ ['Moi\tPRO:PER\tmoi', 'je\tPRO:PER\tje', 'ne\tADV\tne', 'trouve\tVER:pres\ttrouver', 'pas\tADV\tpas', 'très\tADV\ttrès', 'esthétique\tADJ\testhétique', '.\tSENT\t.'], ['L’esthétique\tADJ\tL’esthétique', 'pêche\tNOM\tpêche', 'un\tDET:ART\tun', 'peu\tADV\tpeu', '.\tSENT\t.'], ['Cette\tPRO:DEM\tce', 'grosse\tADJ\tgros', 'prise\tNOM\tprise', 'là\tADV\tlà', '...\tPUN\t...'], ['Cette\tPRO:DEM\tce', 'prise\tNOM\tprise', 'puis\tADV\tpuis', 'la\tDET:ART\tle', 'borne\tNOM\tborne', ',\tPUN\t,', 'ça\tPRO:DEM\tcela', 'se\tPRO:PER\tse', 'voit\tVER:pres\tvoir', '.\tSENT\t.'], ['Derrière\tPRP\tderrière', 'la\tDET:ART\tle', 'télé\tNOM\ttélé', 'ça\tPRO:DEM\tcela', 'va\tVER:pres\taller', 'mais\tKON\tmais', '...\tPUN\t...'], ['Mais\tKON\tmais', 'vu\tVER:pper\tvoir', 'le\tDET:ART\tle', 'système\tNOM\tsystème', 'ça\tPRO:DEM\tcela', 'va\tVER:pres\taller', 'être\tVER:infi\têtre', 'difficile\tADJ\tdifficile', 'de\tPRP\tde', 'faire\tVER:infi\tfaire', 'plus\tADV\tplus', 'sobre\tADJ\tsobre', '!\tSENT\t!'], ['M\tNOM\tM', '.\tSENT\t.', 'Laudrel\tNAM\tLaudrel', 'est\tVER:pres\têtre', 'mort\tVER:pper\tmourir', 'hier\tADV\thier', 'soir\tNOM\tsoir', '.\tSENT\t.'], ['je\tPRO:PER\tje', 'viens\tVER:pres\tvenir', '2.2\tNUM\t@card@', ',\tPUN\t,', 'lo\tVER:pper\tlo', '.\tSENT\t.']]
我的输出是这样的:
[['je', 'venir', '@card@', ',', 'lo', '.'], ['je', 'venir', '@card@', ',', 'lo', '.'], ['je', 'venir', '@card@', ',', 'lo', '.'], ['je', 'venir', '@card@', ',', 'lo', '.'], ['je', 'venir', '@card@', ',', 'lo', '.'], ['je', 'venir', '@card@', ',', 'lo', '.']]
您可以在 \t
和 select 第三个元素上使用 list comprehension
和 split
每个字符串。使用列表中的第一个示例:
l=[['M\tNOM\tM', '.\tSENT\t.', 'Laudrel\tNAM\tLaudrel'],['Derrière\tPRP\tderrière','la\tDET:ART\tle', 'télé\tNOM\tt']]
你可以这样做:
[[i.split('\t')[2] for i in subl] for subl in l]
[['M', '.', 'Laudrel'], ['Derrière', 'la', 'télé']]
每个子列表的第三个元素沿制表符 ('\t') 拆分。
以下解决方案与您的输出示例匹配:
# -*- coding: utf-8 -*-
list_Pos = [
['M\tNOM\tM', '.\tSENT\t.', 'Laudrel\tNAM\tLaudrel'],
['Derrière\tPRP\tderrière','la\tDET:ART\tle', 'télé\tNOM\tt']
]
final_result = []
for sub_list in list_Pos:
final_result.append([r.split("\t")[2] for r in sub_list])
print(final_result)
输出:
[['M', '.', 'Laudrel'], ['derrière', 'le', 't']]
列表理解split()
然后获取[2]
个元素(第三个元素)
test_list=[['M\tNOM\tM', '.\tSENT\t.', 'Laudrel\tNAM\tLaudrel'],['Derrière\tPRP\tderrière','la\tDET:ART\tle', 'télé\tNOM\tt']]
[[i.split('\t')[2] for i in subl] for subl in test_list]
输出
[['M', '.', 'Laudrel'], ['derrière', 'le', 't']]
此外,如果您总是需要最后一个索引,请使用 -1
,如索引
[[i.split('\t')[-1] for i in subl] for subl in test_list]
根据原始编辑输出,您可以对子列表 1 长度范围内的每个子列表的每个元素使用列表理解(假设所有子列表的长度相同)
lst = [['M\tNOM\tM', '.\tSENT\t.', 'Laudrel\tNAM\tLaudrel',],['Derrière\tPRP\tderrière','la\tDET:ART\tle', 'télé\tNOM\tt',]]
final_result = []
for x in range(len(lst[1])):
lst1 = [[item.split('\t')[x] for item in sblst] for sblst in lst]
final_result.append(lst1)
print(final_result)
要仅获取第三个元素,请删除 for 循环和 运行
lst1 = [[item.split('\t')[2] for item in sblst] for sblst in lst]
, 其中 x 刚设置为 2.