比较两个文本文件中的列并匹配行
Compare columns in two text files and match lines
我想比较文件 1 中的第二列(以空格分隔):
n01443537/n01443537_481.JPEG n01443537
n01629819/n01629819_420.JPEG n01629819
n02883205/n02883205_461.JPEG n02883205
文件 2 中的第二列(由空格分隔):
val_8447.JPEG n09256479
val_68.JPEG n01443537
val_1054.JPEG n01629819
val_1542.JPEG n02883205
val_8480.JPEG n03089624
如果有匹配,我想打印出file2对应的行。
本例中的期望输出:
val_68.JPEG n01443537
val_1054.JPEG n01629819
val_1542.JPEG n02883205
我尝试了以下操作,但输出文件为空:
awk -F' ' 'NR==FNR{c[]++;next};c[] > 0' file1.txt file2.txt > file3.txt
也试过这个,但结果是一样的(空输出文件):
awk 'NR==FNR{a[];next} in a' file1 file2 > file3.txt
使用 awk:
awk 'FNR==NR{a[$NF]; next} $NF in a' file1 file2
val_68.JPEG n01443537
val_1054.JPEG n01629819
val_1542.JPEG n02883205
这是一个 grep
带有进程替换的替代方案:
grep -f <(awk '{print " " $NF "$"}' file1) file2
使用 print " " $NF "$"
创建类似 " n01443537$"
的正则表达式,以便我们仅匹配 grep
中的最后一列。
GNU join
就是为了这个目的而存在的。
join -o "2.1 2.2" -j 2 <(sort -k 2 file1) <(sort -k 2 file2)
我想比较文件 1 中的第二列(以空格分隔):
n01443537/n01443537_481.JPEG n01443537
n01629819/n01629819_420.JPEG n01629819
n02883205/n02883205_461.JPEG n02883205
文件 2 中的第二列(由空格分隔):
val_8447.JPEG n09256479
val_68.JPEG n01443537
val_1054.JPEG n01629819
val_1542.JPEG n02883205
val_8480.JPEG n03089624
如果有匹配,我想打印出file2对应的行。
本例中的期望输出:
val_68.JPEG n01443537
val_1054.JPEG n01629819
val_1542.JPEG n02883205
我尝试了以下操作,但输出文件为空:
awk -F' ' 'NR==FNR{c[]++;next};c[] > 0' file1.txt file2.txt > file3.txt
也试过这个,但结果是一样的(空输出文件):
awk 'NR==FNR{a[];next} in a' file1 file2 > file3.txt
使用 awk:
awk 'FNR==NR{a[$NF]; next} $NF in a' file1 file2
val_68.JPEG n01443537
val_1054.JPEG n01629819
val_1542.JPEG n02883205
这是一个 grep
带有进程替换的替代方案:
grep -f <(awk '{print " " $NF "$"}' file1) file2
使用 print " " $NF "$"
创建类似 " n01443537$"
的正则表达式,以便我们仅匹配 grep
中的最后一列。
GNU join
就是为了这个目的而存在的。
join -o "2.1 2.2" -j 2 <(sort -k 2 file1) <(sort -k 2 file2)