RBM:推导复制的 Softmax 模型 (RSM)

RBM: Deriving the Replicated Softmax Model (RSM)

我正在尝试推导可见变量的条件分布,,根据论文,对于复制 Softmax 模型 (RSM) 或等效的受限玻尔兹曼机 (RBM),用于字数统计: "Replicated Softmax: an Undirected Topic Model" 作者:Salakhutdinov 和 Hinton。

可以在以下位置找到论文:http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=B04C8D67D381B8106FF6FA4203A86264?doi=10.1.1.164.71&rep=rep1&type=pdf

然而,尽管付出了所有努力,我还是无法理解条件如何变成 softmax 分布:

此外,我很困惑 is a 3D matrix and 是一个二维矩阵还是分别是二维矩阵和向量。我相信是后者。希望有人能证明推导。

我希望实现 RSM 以在 python 的 theano 中进行主题建模。我知道那里有代码,但我更愿意自己理解推导,这样我就可以扩展或优化代码而不会破坏模型。


p.s。抱歉,这是 https://math.stackexchange.com/questions/2085616/rbm-deriving-the-replicated-softmax-model-rsm 的转发,但我这样做是因为没有那么多 mathstackexchange 用户。

一段时间后,我发现了我误解的地方并设法推导出了方程式。请参考math.stackexchange:
https://math.stackexchange.com/questions/2085616/rbm-deriving-the-replicated-softmax-model-rsm/2087272#2087272