伯努利样本的梯度

Question

我正在尝试根据伯努利分布 w.r.t 计算样本的梯度。概率 p（样本为 1）。

我尝试使用 tensorflow.contrib.distributions 中提供的伯努利分布实现和我自己基于此的简单实现。但是，当我尝试计算梯度时，这两种方法都失败了。

使用 Bernoulli 实现：

import tensorflow as tf
from tensorflow.contrib.distributions import Bernoulli

p = tf.constant([0.2, 0.6])
b = Bernoulli(p=p)
s = b.sample()
g = tf.gradients(s, p)

with tf.Session() as session:
    print(session.run(g))

上面的代码给我以下错误：

TypeError: Fetch argument None has invalid type <class 'NoneType'>

使用我的实现：

import tensorflow as tf

p = tf.constant([0.2, 0.6])
shape = [1, 2]
s = tf.select(tf.random_uniform(shape) - p > 0.0, tf.ones(shape), tf.zeros(shape))
g = tf.gradients(s, p)

with tf.Session() as session:
    print(session.run(g))

同样的错误：

TypeError: Fetch argument None has invalid type <class 'NoneType'>

有没有办法计算伯努利样本的梯度？

（我的TensorFlow版本是0.12）。

Answer 1

由于显而易见的原因，您不能通过离散随机节点进行反向传播。由于未定义渐变。但是，如果您使用由温度参数控制的连续分布来近似伯努利，是的，您可以。

这个想法被称为重新参数化技巧，并在 Tensorflow Probability 的 RelaxedBernoulli 中实现（或者也在 TF.contrib 库中实现）

Relaxed bernoulli

您可以指定伯努利概率 p，这是您的随机变量，等等。

伯努利样本的梯度

Gradients of Bernoulli Samples

gradient

distribution

tensorflow