如何使用csv剥离文本文件

How to strip textfile using csv

由于问题的基础性令人尴尬,预计会被否决并关闭:

但是,使用逗号分隔的单词列表查找和替换(删除)文本文档(或等效文本文档)中的单词的最简单方法是什么?我目前的选择是 a) 手动搜索和替换每个单词或 b) 从头开始​​编写一个 c 程序来为我完成这项工作。

例如文本文件包括

apraxic
aprepitant
Apresazide
Apresoline
Apri
apricot
apridae
aprifoliaceae
...

(即由 \n 划定)和包含

的 csv

apple,apricot,april,...

以上的最终结果将是

apraxic
aprepitant
Apresazide
Apresoline
Apri
apridae
aprifoliaceae
...

像这样:

fgrep -v -f <(tr ',' '\n' < verboten) textfile

其中 verboten 是包含禁用词列表的文件的名称。 <()process substitution,它使用括号内的结果创建一个伪文件 - 在这种情况下,我翻译了你的 verboten 中的所有逗号] 文件换行。 -v 否定搜索。

这是bash主义。如果您使用不同的 shell,您将需要 2 个步骤:

tr ',' '\n' < verboten > verboten.col    # Make line into column
fgrep -v -f verboten.col textfile