如何使用csv剥离文本文件
How to strip textfile using csv
由于问题的基础性令人尴尬,预计会被否决并关闭:
但是,使用逗号分隔的单词列表查找和替换(删除)文本文档(或等效文本文档)中的单词的最简单方法是什么?我目前的选择是 a) 手动搜索和替换每个单词或 b) 从头开始编写一个 c 程序来为我完成这项工作。
例如文本文件包括
apraxic
aprepitant
Apresazide
Apresoline
Apri
apricot
apridae
aprifoliaceae
...
(即由 \n 划定)和包含
的 csv
apple,apricot,april,...
以上的最终结果将是
apraxic
aprepitant
Apresazide
Apresoline
Apri
apridae
aprifoliaceae
...
像这样:
fgrep -v -f <(tr ',' '\n' < verboten) textfile
其中 verboten
是包含禁用词列表的文件的名称。 <()
是 process substitution,它使用括号内的结果创建一个伪文件 - 在这种情况下,我翻译了你的 verboten
中的所有逗号] 文件换行。 -v
否定搜索。
这是bash
主义。如果您使用不同的 shell,您将需要 2 个步骤:
tr ',' '\n' < verboten > verboten.col # Make line into column
fgrep -v -f verboten.col textfile
由于问题的基础性令人尴尬,预计会被否决并关闭:
但是,使用逗号分隔的单词列表查找和替换(删除)文本文档(或等效文本文档)中的单词的最简单方法是什么?我目前的选择是 a) 手动搜索和替换每个单词或 b) 从头开始编写一个 c 程序来为我完成这项工作。
例如文本文件包括
apraxic
aprepitant
Apresazide
Apresoline
Apri
apricot
apridae
aprifoliaceae
...
(即由 \n 划定)和包含
的 csvapple,apricot,april,...
以上的最终结果将是
apraxic
aprepitant
Apresazide
Apresoline
Apri
apridae
aprifoliaceae
...
像这样:
fgrep -v -f <(tr ',' '\n' < verboten) textfile
其中 verboten
是包含禁用词列表的文件的名称。 <()
是 process substitution,它使用括号内的结果创建一个伪文件 - 在这种情况下,我翻译了你的 verboten
中的所有逗号] 文件换行。 -v
否定搜索。
这是bash
主义。如果您使用不同的 shell,您将需要 2 个步骤:
tr ',' '\n' < verboten > verboten.col # Make line into column
fgrep -v -f verboten.col textfile