一种更快的方法来找出列表中的任何单词是否是较长单词的子字符串

Question

我有什么

我想知道的

目前我有 L 分成文件，每个文件一个字长 16.txt, 15.txt ... 04.txt
然后我从 n.txt --> 04.txt 遍历这些文件，基本上做

cat n.txt | while read w; do if [[ $s =~ $w ]] ; then echo $w; fi; done

速度慢得令人痛苦有更好的方法来做到这一点。

附加信息：

我不太懂语言（se 标签），但伪代码也可以

Answer 1

您可以在不拆分列表的情况下使用 grep:

grep -oFf list.txt <<< "$s"

A faster way to find out if any word in a list is a substring in a longer word