RBM:推导复制的 Softmax 模型 (RSM)
RBM: Deriving the Replicated Softmax Model (RSM)
我正在尝试推导可见变量的条件分布,,根据论文,对于复制 Softmax 模型 (RSM) 或等效的受限玻尔兹曼机 (RBM),用于字数统计: "Replicated Softmax: an Undirected Topic Model" 作者:Salakhutdinov 和 Hinton。
然而,尽管付出了所有努力,我还是无法理解条件如何变成 softmax 分布:
此外,我很困惑 is a 3D matrix and 是一个二维矩阵还是分别是二维矩阵和向量。我相信是后者。希望有人能证明推导。
我希望实现 RSM 以在 python 的 theano 中进行主题建模。我知道那里有代码,但我更愿意自己理解推导,这样我就可以扩展或优化代码而不会破坏模型。
p.s。抱歉,这是 https://math.stackexchange.com/questions/2085616/rbm-deriving-the-replicated-softmax-model-rsm 的转发,但我这样做是因为没有那么多 mathstackexchange 用户。
一段时间后,我发现了我误解的地方并设法推导出了方程式。请参考math.stackexchange:
https://math.stackexchange.com/questions/2085616/rbm-deriving-the-replicated-softmax-model-rsm/2087272#2087272
我正在尝试推导可见变量的条件分布,
然而,尽管付出了所有努力,我还是无法理解条件如何变成 softmax 分布:
此外,我很困惑
我希望实现 RSM 以在 python 的 theano 中进行主题建模。我知道那里有代码,但我更愿意自己理解推导,这样我就可以扩展或优化代码而不会破坏模型。
p.s。抱歉,这是 https://math.stackexchange.com/questions/2085616/rbm-deriving-the-replicated-softmax-model-rsm 的转发,但我这样做是因为没有那么多 mathstackexchange 用户。
一段时间后,我发现了我误解的地方并设法推导出了方程式。请参考math.stackexchange:
https://math.stackexchange.com/questions/2085616/rbm-deriving-the-replicated-softmax-model-rsm/2087272#2087272