NLP的Word相似度±2window

The ± 2 window in Word similarity of NLP

下面有个问题说明:

//--------问题开始--------------------

考虑以下由三个句子组成的小型语料库:

The judge struck the gavel to silence the court. Buying the cheap saw is false economy. The nail was driven in when the hammer struck it hard.

使用分布相似性来确定单词 gavel 的意思是否更相似- 正在用锤子或锯子。要计算分布相似性,您必须 (1) 使用词袋 在目标周围 a ± 2 window 作为特征,(2)不以任何方式改变上下文词 (例如,通过词干提取或删除停用词)和 (3) 使用 Dice 度量来比较 特征向量。请务必展示您工作的所有阶段。

//--------问题结束--------------------

我不明白 (1) 中的 ± 2 window 是什么。有人会为我解释吗?非常感谢你们。

A ± 2 window表示目标词左边2个词,右边2个词。对于目标词 "silence",window 将是 ["gavel"、"to"、"the"、"court"],对于 "hammer" , 它将是 ["when", "the", "struck", "it"].