如何将 findAssocs() 限制为选定的单词?

How to restrict findAssocs() to selected words?

我只想找到几个词与输入之间的关联,例如,

{
data("crude")
tdm <- TermDocumentMatrix(crude)
findAssocs(tdm, c("oil", "opec", "xyz"), 0.1)
 }

在这里,我只想找到 c("oil", "opec", "xyz")soln = c("was","are","were","am","is","been","being","be") 之间的相关性,而不是整个 TDM。

如何实现?

我可以在计算后提取这些结果,但我希望它具有计算效率,因此只计算 soln 向量的关联,如上所示,而不是任何其他词。

我通过深入研究 findAssocs() 函数的实现解决了这个问题。它在内部使用 cor 来确定关联。因此,上述问题的解决方案类似于:

cd<- cor(termFreq1[j,], termFreq1[i,])