grep 仅第三列但 return 整行
grep only the third column but return entire line
我只想在第三列中搜索以“6-1”开头的内容。所以像 '6-1*blahblah' 这样的东西应该被捕获,我想输出整行。我想知道正确的语法是什么?
一行示例输入将包括:
hg19_gold_AL122127.6-109525 0 1-18*anc 1 18 65S185M * 0 0 GAGAAACCAGGCCAGTCATGTGAGACTTCACCCACTCCTGTGTCCTCTCCACAGGTGCCCACTCCCAGGTTCAGCTGGTGCAGTCTGGAGCTGAGGTGAAGAAGCCTGGGGCCTCAGTGAAGGTCTCCTGCAAGGCTTCTGGTTACACCTTTACCAGCTATGGTATCAGCTGGGTGCGACAGGCCCCTGGACAAGGGCTTGAGTGGATGGGATGGATCAGCGCTTACAATGGTAACACAAACTATGCACA ?????@<BBDB@EDDDFGCG+FIFHIHHHFD>HIHII>AHHIIF5IHHHGIHDFEFHHGHHHHHIIFIDIGBAHIBHDH=BHIHG;IHHHFHF+HIHIIHDHGFI=H=H=FGG?FH7HHCHGGHGHHGDHFADEGFG2GFD@GGGGGBGCGEEGF*EGAGGFCFEFFGGFC0E;GCGEGCEFEFAEEGEE0EEGGECGGAGFEEEG?GCEHHHHF*ECF?G<FGEGFGAGGEEEEAGA8GE?GGEC?EGF AS:i:37
hg38_gold_AC246787.2-87811 16 6-1*anc 259 2 47M203S * AACTCTGTGACTCCCGAGGACACGGCTGTGTATTACTGTGCAAGAGACACAGTGAGGGGAAGTCAGTGTGAGCCCAGACACAAACCTCCCTGCAGGGATGCTCAGGACCCCAGAAGGCACCCAGCACTACCAGCGCAGGGCCCAGACCAGGAGCAGGTGTGGAGTTAAGCAAAAATGGAACTTCTTGCTGTGTCTTAAACTGTTGTTGTTTTTTTTTTTTTTTTGGCTCAGCAACAGAGATCATAGAAAA CGFEGEG:C:G4E;CGEE*CC?G:?GG?GGECFCHFAECF:FAFEG*GGE6?0GCGE;GGEFFCEG:GGG/ECGG+GGF?2GEGGEGDGEEEEEF/EECGGGGGEGGGFGGGGGEGDGEHGEFGF5EG=GGFEHGDFHFHEEIHGGFHHFGGIHGHHHHHI-IHIHHIIEFICIIAHGHFHHIHIDGFCHHIHEHHIIFIDIHIHHGHFIIGIHFIFIEHHIFIIHHIFFGFFFDDE?DDDEBBB????? AS:i:94 XS:i:68 XN:i:0 XM:i:0 XO:i:0 XG:i:0 NM:i:0 MD:Z:47 YT:Z:UU
但输出应该只是第二行
hg38_gold_AC246787.2-87811 16 6-1*anc 259 2 47M203S * AACTCTGTGACTCCCGAGGACACGGCTGTGTATTACTGTGCAAGAGACACAGTGAGGGGAAGTCAGTGTGAGCCCAGACACAAACCTCCCTGCAGGGATGCTCAGGACCCCAGAAGGCACCCAGCACTACCAGCGCAGGGCCCAGACCAGGAGCAGGTGTGGAGTTAAGCAAAAATGGAACTTCTTGCTGTGTCTTAAACTGTTGTTGTTTTTTTTTTTTTTTTGGCTCAGCAACAGAGATCATAGAAAA CGFEGEG:C:G4E;CGEE*CC?G:?GG?GGECFCHFAECF:FAFEG*GGE6?0GCGE;GGEFFCEG:GGG/ECGG+GGF?2GEGGEGDGEEEEEF/EECGGGGGEGGGFGGGGGEGDGEHGEFGF5EG=GGFEHGDFHFHEEIHGGFHHFGGIHGHHHHHI-IHIHHIIEFICIIAHGHFHHIHIDGFCHHIHEHHIIFIDIHIHHGHFIIGIHFIFIEHHIFIIHHIFFGFFFDDE?DDDEBBB????? AS:i:94 XS:i:68 XN:i:0 XM:i:0 XO:i:0 XG:i:0 NM:i:0 MD:Z:47 YT:Z:UU
如果你使用awk
,你可以这样做:
awk '~/^6-1/' file
hg38_gold_AC246787.2-87811 16 6-1*anc 259 2 47M203S * AACTCTGTGACTCCCGAGGACACGGCTGTGTATTACTGTGCAAGAGACACAGTGAGGGGAAGTCAGTGTGAGCCCAGACACAAACCTCCCTGCAGGGATGCTCAGGACCCCAGAAGGCACCCAGCACTACCAGCGCAGGGCCCAGACCAGGAGCAGGTGTGGAGTTAAGCAAAAATGGAACTTCTTGCTGTGTCTTAAACTGTTGTTGTTTTTTTTTTTTTTTTGGCTCAGCAACAGAGATCATAGAAAA CGFEGEG:C:G4E;CGEE*CC?G:?GG?GGECFCHFAECF:FAFEG*GGE6?0GCGE;GGEFFCEG:GGG/ECGG+GGF?2GEGGEGDGEEEEEF/EECGGGGGEGGGFGGGGGEGDGEHGEFGF5EG=GGFEHGDFHFHEEIHGGFHHFGGIHGHHHHHI-IHIHHIIEFICIIAHGHFHHIHIDGFCHHIHEHHIIFIDIHIHHGHFIIGIHFIFIEHHIFIIHHIFFGFFFDDE?DDDEBBB????? AS:i:94 XS:i:68 XN:i:0 XM:i:0 XO:i:0 XG:i:0 NM:i:0 MD:Z:47 YT:Z:UU
它只会获取第三个字段以 6-1
开头的行
我只想在第三列中搜索以“6-1”开头的内容。所以像 '6-1*blahblah' 这样的东西应该被捕获,我想输出整行。我想知道正确的语法是什么?
一行示例输入将包括:
hg19_gold_AL122127.6-109525 0 1-18*anc 1 18 65S185M * 0 0 GAGAAACCAGGCCAGTCATGTGAGACTTCACCCACTCCTGTGTCCTCTCCACAGGTGCCCACTCCCAGGTTCAGCTGGTGCAGTCTGGAGCTGAGGTGAAGAAGCCTGGGGCCTCAGTGAAGGTCTCCTGCAAGGCTTCTGGTTACACCTTTACCAGCTATGGTATCAGCTGGGTGCGACAGGCCCCTGGACAAGGGCTTGAGTGGATGGGATGGATCAGCGCTTACAATGGTAACACAAACTATGCACA ?????@<BBDB@EDDDFGCG+FIFHIHHHFD>HIHII>AHHIIF5IHHHGIHDFEFHHGHHHHHIIFIDIGBAHIBHDH=BHIHG;IHHHFHF+HIHIIHDHGFI=H=H=FGG?FH7HHCHGGHGHHGDHFADEGFG2GFD@GGGGGBGCGEEGF*EGAGGFCFEFFGGFC0E;GCGEGCEFEFAEEGEE0EEGGECGGAGFEEEG?GCEHHHHF*ECF?G<FGEGFGAGGEEEEAGA8GE?GGEC?EGF AS:i:37
hg38_gold_AC246787.2-87811 16 6-1*anc 259 2 47M203S * AACTCTGTGACTCCCGAGGACACGGCTGTGTATTACTGTGCAAGAGACACAGTGAGGGGAAGTCAGTGTGAGCCCAGACACAAACCTCCCTGCAGGGATGCTCAGGACCCCAGAAGGCACCCAGCACTACCAGCGCAGGGCCCAGACCAGGAGCAGGTGTGGAGTTAAGCAAAAATGGAACTTCTTGCTGTGTCTTAAACTGTTGTTGTTTTTTTTTTTTTTTTGGCTCAGCAACAGAGATCATAGAAAA CGFEGEG:C:G4E;CGEE*CC?G:?GG?GGECFCHFAECF:FAFEG*GGE6?0GCGE;GGEFFCEG:GGG/ECGG+GGF?2GEGGEGDGEEEEEF/EECGGGGGEGGGFGGGGGEGDGEHGEFGF5EG=GGFEHGDFHFHEEIHGGFHHFGGIHGHHHHHI-IHIHHIIEFICIIAHGHFHHIHIDGFCHHIHEHHIIFIDIHIHHGHFIIGIHFIFIEHHIFIIHHIFFGFFFDDE?DDDEBBB????? AS:i:94 XS:i:68 XN:i:0 XM:i:0 XO:i:0 XG:i:0 NM:i:0 MD:Z:47 YT:Z:UU
但输出应该只是第二行
hg38_gold_AC246787.2-87811 16 6-1*anc 259 2 47M203S * AACTCTGTGACTCCCGAGGACACGGCTGTGTATTACTGTGCAAGAGACACAGTGAGGGGAAGTCAGTGTGAGCCCAGACACAAACCTCCCTGCAGGGATGCTCAGGACCCCAGAAGGCACCCAGCACTACCAGCGCAGGGCCCAGACCAGGAGCAGGTGTGGAGTTAAGCAAAAATGGAACTTCTTGCTGTGTCTTAAACTGTTGTTGTTTTTTTTTTTTTTTTGGCTCAGCAACAGAGATCATAGAAAA CGFEGEG:C:G4E;CGEE*CC?G:?GG?GGECFCHFAECF:FAFEG*GGE6?0GCGE;GGEFFCEG:GGG/ECGG+GGF?2GEGGEGDGEEEEEF/EECGGGGGEGGGFGGGGGEGDGEHGEFGF5EG=GGFEHGDFHFHEEIHGGFHHFGGIHGHHHHHI-IHIHHIIEFICIIAHGHFHHIHIDGFCHHIHEHHIIFIDIHIHHGHFIIGIHFIFIEHHIFIIHHIFFGFFFDDE?DDDEBBB????? AS:i:94 XS:i:68 XN:i:0 XM:i:0 XO:i:0 XG:i:0 NM:i:0 MD:Z:47 YT:Z:UU
如果你使用awk
,你可以这样做:
awk '~/^6-1/' file
hg38_gold_AC246787.2-87811 16 6-1*anc 259 2 47M203S * AACTCTGTGACTCCCGAGGACACGGCTGTGTATTACTGTGCAAGAGACACAGTGAGGGGAAGTCAGTGTGAGCCCAGACACAAACCTCCCTGCAGGGATGCTCAGGACCCCAGAAGGCACCCAGCACTACCAGCGCAGGGCCCAGACCAGGAGCAGGTGTGGAGTTAAGCAAAAATGGAACTTCTTGCTGTGTCTTAAACTGTTGTTGTTTTTTTTTTTTTTTTGGCTCAGCAACAGAGATCATAGAAAA CGFEGEG:C:G4E;CGEE*CC?G:?GG?GGECFCHFAECF:FAFEG*GGE6?0GCGE;GGEFFCEG:GGG/ECGG+GGF?2GEGGEGDGEEEEEF/EECGGGGGEGGGFGGGGGEGDGEHGEFGF5EG=GGFEHGDFHFHEEIHGGFHHFGGIHGHHHHHI-IHIHHIIEFICIIAHGHFHHIHIDGFCHHIHEHHIIFIDIHIHHGHFIIGIHFIFIEHHIFIIHHIFFGFFFDDE?DDDEBBB????? AS:i:94 XS:i:68 XN:i:0 XM:i:0 XO:i:0 XG:i:0 NM:i:0 MD:Z:47 YT:Z:UU
它只会获取第三个字段以 6-1