Sed 在第二次出现时替换

Question

我想用 sed 删除模式，仅在第二次出现时。这是我想要的，删除一个模式，但在第二次出现时。

file.csv 中的内容：

a,Name(null)abc.csv,c,d,Name(null)abc.csv,f
a,Name(null)acb.csv,c,d,Name(null)acb.csv,f
a,Name(null)cba.csv,c,d,Name(null)cba.csv,f

想要的输出：

a,Name(null)abc.csv,c,d,Name,f
a,Name(null)acb.csv,c,d,Name,f
a,Name(null)cba.csv,c,d,Name,f

这是我试过的：

sed -r 's/(\(null)\).*csv//' file.csv

这里的问题是正则表达式太贪心了，但我无法停止。我也试过这个，跳过第一次出现的 "null":

sed -r '0,/null/! s/(\(null)\).*csv//' file.csv

也试过了，但贪婪的正则表达式仍然是问题。

sed -r 's/(\(null)\).*csv//2' file.csv

我读到 ? 可以使正则表达式 "lazy"，但我不能使它锻炼。

sed -r 's/(\(null)\).*?csv//' file.csv

Answer 1

更健壮的awk解决方案：

扩展示例文件 input.csv:

12,Name(null)randomstuff.csv,2,3,Name(null)randomstuff.csv, false,Name(null)randomstuff.csv
12,Name(null)AotherRandomStuff.csv,2,3,Name(null)AotherRandomStuff.csv, false,Name(null)randomstuff.csv
12,Name(null)alphaNumRandom.csv,2,3,Name(null)alphaNumRandom.csv, false,Name(null)randomstuff.csv

工作：

awk -F, '{ c=0; for(i=1;i<=NF;i++) if($i~/\(null\)/ && c++==1) sub(/\(null\).*/,"",$i) }1' OFS=',' input.csv

输出：

12,Name(null)randomstuff.csv,2,3,Name, false,Name(null)randomstuff.csv
12,Name(null)AotherRandomStuff.csv,2,3,Name, false,Name(null)randomstuff.csv
12,Name(null)alphaNumRandom.csv,2,3,Name, false,Name(null)randomstuff.csv

Answer 2

sed 确实提供了一种简单的方法来指定要替换的匹配项。只需在分隔符后添加数字

$ sed 's/(null)[^.]*\.csv//2' ip.csv
a,Name(null)abc.csv,c,d,Name,f
a,Name(null)acb.csv,c,d,Name,f
a,Name(null)cba.csv,c,d,Name,f

$ # or [^,] if there are no , within fields
$ sed 's/(null)[^,]*//2' ip.csv
a,Name(null)abc.csv,c,d,Name,f
a,Name(null)acb.csv,c,d,Name,f
a,Name(null)cba.csv,c,d,Name,f

此外，在不使用扩展正则表达式时无需转义()

Answer 3

执行：

awk '{sub(/.null.....csv,f/,",f")}1' file

输出应该是：

a,Name(null)abc.csv,c,d,Name,f
a,Name(null)acb.csv,c,d,Name,f
a,Name(null)cba.csv,c,d,Name,f

Sed 在第二次出现时替换

Sed replace at second occurrence

regex

bash

sed

non-greedy