使用 awk 从 CSV 文件中删除重复的乘法行
Removing duplicate multiply rows from CSV file using a awk
我已经使用此代码从 2 个文件中删除了第 3 列中的重复项
awk -F, 'NR==FNR{seen[]; next} !( in seen)' dublicates.txt need_check.csv > output.csv
但是如果我想检查乘法列(#2、#3 和#4),如何检查重复项?
由于您的问题含糊不清,有两种可能的答案。
如果您将具有相同字段#2、#3 和#4 的记录视为重复记录,您应该运行:
awk -F, '{key= FS FS } NR==FNR{a[key]; next} !(key in a) dublicates.txt need_check.csv > output.csv
如果只有一个字段重复时记录重复,那么您必须以另一种方式进行编码。
在 SO 中包含输入样本和所需的相应输出是一个很好的做法。
我已经使用此代码从 2 个文件中删除了第 3 列中的重复项
awk -F, 'NR==FNR{seen[]; next} !( in seen)' dublicates.txt need_check.csv > output.csv
但是如果我想检查乘法列(#2、#3 和#4),如何检查重复项?
由于您的问题含糊不清,有两种可能的答案。
如果您将具有相同字段#2、#3 和#4 的记录视为重复记录,您应该运行:
awk -F, '{key= FS FS } NR==FNR{a[key]; next} !(key in a) dublicates.txt need_check.csv > output.csv
如果只有一个字段重复时记录重复,那么您必须以另一种方式进行编码。
在 SO 中包含输入样本和所需的相应输出是一个很好的做法。