如何将 findAssocs() 限制为选定的单词?
How to restrict findAssocs() to selected words?
我只想找到几个词与输入之间的关联,例如,
{
data("crude")
tdm <- TermDocumentMatrix(crude)
findAssocs(tdm, c("oil", "opec", "xyz"), 0.1)
}
在这里,我只想找到 c("oil", "opec", "xyz")
和 soln = c("was","are","were","am","is","been","being","be")
之间的相关性,而不是整个 TDM。
如何实现?
我可以在计算后提取这些结果,但我希望它具有计算效率,因此只计算 soln
向量的关联,如上所示,而不是任何其他词。
我通过深入研究 findAssocs() 函数的实现解决了这个问题。它在内部使用 cor
来确定关联。因此,上述问题的解决方案类似于:
cd<- cor(termFreq1[j,], termFreq1[i,])
我只想找到几个词与输入之间的关联,例如,
{
data("crude")
tdm <- TermDocumentMatrix(crude)
findAssocs(tdm, c("oil", "opec", "xyz"), 0.1)
}
在这里,我只想找到 c("oil", "opec", "xyz")
和 soln = c("was","are","were","am","is","been","being","be")
之间的相关性,而不是整个 TDM。
如何实现?
我可以在计算后提取这些结果,但我希望它具有计算效率,因此只计算 soln
向量的关联,如上所示,而不是任何其他词。
我通过深入研究 findAssocs() 函数的实现解决了这个问题。它在内部使用 cor
来确定关联。因此,上述问题的解决方案类似于:
cd<- cor(termFreq1[j,], termFreq1[i,])