在 Unix 中匹配文件字符串

Question

我在 $FILES_DIR

目录下有 3 个文件

1) File_Apple.txt
2) File_Samsung.txt
3) File_Huwaei.txt

Header rows of File_Apple.txt

    AAA1,BBB2,CCC3

Header rows of File_Samsung.txt

    DDD1,EEE2

Header rows of File_Huwaei.txt

    FFF1,GGG2,HHH3,III4

还有一个名为 head_config 的文件，其中包含上述 3 个文件的 header 行。

head_config.txt

AAA1,BBB2,CCC3
DDD1,EEE2
FFF1,GGG2,HHH3,III4

基本上我必须根据 head_config.txt 文件

匹配文件的 headers 是否正确

我可以通过一些繁琐的过程来做到这一点：分别复制每个文件的 header 行并附加到新文件。然后比较用 head.config.txt

创建的新文件

head -1 File_Apple.txt >> new_file.txt
head -1 File_Samsung.txt >> new_file.txt
head -1  File_Huwaei.txt >> new_file.txt

然后 cmp new_file.txt 到 head_config.txt

我怎样才能更有效地做到这一点？

Answer 1

首先，确保头文件中的行按 文件名 的字母顺序排序。所以 head_config.txt 变成：

AAA1,BBB2,CCC3
FFF1,GGG2,HHH3,III4
DDD1,EEE2AAA1,BBB2,CCC3

然后执行这条命令：

diff head_config.txt <(head -q -n1 File_*)

如果文件匹配，则不会有输出，$?将是0。

Answer 2

这是一个完成所有操作的命令，为每个匹配的文件打印 Good，为不匹配的文件打印 Bad：

$ awk 'FNR==NR{hdr[NR]=[=10=];next} {print FILENAME, (hdr[++i]==[=10=]?"Good":"Bad"); nextfile}' head_config.txt File_Apple.txt File_Samsung.txt File_Huwaei.txt 
File_Apple.txt Good
File_Samsung.txt Good
File_Huwaei.txt Good

输出非常灵活，可以更改以满足您的特殊需求。

工作原理

NR==NR{hdr[NR]=[=13=];next}

对于第一个文件 head_config.txt，这会将每一行读入数组 dhr。
print FILENAME, (hdr[++i]==[=16=]?"Good":"Bad"); nextfile

对于每个剩余的文件，这将检查其第一行是否与 hdr 的相应元素相匹配：hdr[++i]==[=18=]。如果是，则打印文件名和 Good。否则，打印文件名和 Bad。

Answer 3

用 AWK 检查这个

for file in ./File_*
do
  for line in `cat head_config.txt`
  do
    awk -v var="$line" '[=10=] ~ var && NR==1 {print FILENAME "PASSED TEST"}' $file
  done
done

在 Unix 中匹配文件字符串

Match strings of files in Unix

unix

shell

ksh

工作原理