什么是 N-gram?
What are N-grams?
什么是 N-gram?
我想为 n=4(四格)、n=5(五格)、n=6(六格)、n=7(七格)找到 N-gram对于句子 - “狗叫不咬人”
我知道-
Unigrams(n=1): dog, that, barks, does, not, bite
Bigrams(n=2): dog that, that barks, bark does, does not, not bite
八卦(n=3):狗会叫,会叫,不会叫,不会咬人
我们可以为给定的句子找到多少个 N-gram?
N-Grams 存在于至少包含 'N' no.of 个单词的句子中。因此,在您的情况下 "dog that barks does not bite" 有 6 个单词,因此您最多可以构建 6-grams(1,2,3,4,5,6 - Grams)并且不超过 6 个。所以,结果将是
4- gram : 会叫的狗,不会叫的狗,不会叫的狗
咬一口,
5 - gram : 狗不会叫,不会咬人,
6 - 克:只会叫的狗不会咬人
什么是 N-gram?
我想为 n=4(四格)、n=5(五格)、n=6(六格)、n=7(七格)找到 N-gram对于句子 - “狗叫不咬人”
我知道-
Unigrams(n=1): dog, that, barks, does, not, bite
Bigrams(n=2): dog that, that barks, bark does, does not, not bite
八卦(n=3):狗会叫,会叫,不会叫,不会咬人
我们可以为给定的句子找到多少个 N-gram?
N-Grams 存在于至少包含 'N' no.of 个单词的句子中。因此,在您的情况下 "dog that barks does not bite" 有 6 个单词,因此您最多可以构建 6-grams(1,2,3,4,5,6 - Grams)并且不超过 6 个。所以,结果将是
4- gram : 会叫的狗,不会叫的狗,不会叫的狗 咬一口,
5 - gram : 狗不会叫,不会咬人,
6 - 克:只会叫的狗不会咬人