我用 GLEU NLTK 比较两个相同的句子,但没有得到 1.0。为什么?

I compare two identical sentences with GLEU NLTK and don't get 1.0. Why?

我正在尝试使用 NLTK 的 GLEU 分数对机器翻译进行质量评估。我想用两个相同的句子检查这段代码,我比较的是两个句子而不是语料库。但结果我得到 0.015151515151515152。我究竟做错了什么?两个相同的句子应该得到 1.0 分。

我的代码:

from nltk.translate.gleu_score import sentence_gleu

hyp1 = ['It', 'is', 'a', 'guide', 'to', 'action', 'which', 'ensures', 'that', 'the', 'military', 'always', 'obeys', 'the', 'commands', 'of', 'the', 'party']

ref1a = ['It', 'is', 'a', 'guide', 'to', 'action', 'which', 'ensures', 'that', 'the', 'military', 'always', 'obeys', 'the', 'commands', 'of', 'the', 'party']

gleu_score = sentence_gleu(ref1a, hyp1)

print(gleu_score)

我的结果:

0.015151515151515152

进程已完成,退出代码为 0

我错了吗?请帮忙!

sentence_gleu的第一个参数应该是list of lists(参考句子的列表,其中每个句子都是单词的列表)。

试着这样称呼它:

gleu_score = sentence_gleu([ref1a], hyp1)