使用 awk 从 CSV 文件中删除重复的乘法行

Question

我已经使用此代码从 2 个文件中删除了第 3 列中的重复项

awk -F, 'NR==FNR{seen[]; next} !( in seen)' dublicates.txt need_check.csv > output.csv

但是如果我想检查乘法列（#2、#3 和#4），如何检查重复项？

Answer 1

由于您的问题含糊不清，有两种可能的答案。

如果您将具有相同字段#2、#3 和#4 的记录视为重复记录，您应该运行:

awk -F, '{key= FS  FS } NR==FNR{a[key]; next} !(key in a) dublicates.txt need_check.csv > output.csv

如果只有一个字段重复时记录重复，那么您必须以另一种方式进行编码。

在 SO 中包含输入样本和所需的相应输出是一个很好的做法。

Removing duplicate multiply rows from CSV file using a awk