什么是 N-gram?

What are N-grams?

什么是 N-gram?

我想为 n=4(四格)、n=5(五格)、n=6(六格)、n=7(七格)找到 N-gram对于句子 - “狗叫不咬人

我知道-

Unigrams(n=1): dog, that, barks, does, not, bite

Bigrams(n=2): dog that, that barks, bark does, does not, not bite

八卦(n=3):狗会叫,会叫,不会叫,不会咬人

我们可以为给定的句子找到多少个 N-gram?

N-Grams 存在于至少包含 'N' no.of 个单词的句子中。因此,在您的情况下 "dog that barks does not bite" 有 6 个单词,因此您最多可以构建 6-grams(1,2,3,4,5,6 - Grams)并且不超过 6 个。所以,结果将是

  • 4- gram : 会叫的狗,不会叫的狗,不会叫的狗 咬一口,

  • 5 - gram : 狗不会叫,不会咬人,

  • 6 - 克:只会叫的狗不会咬人