什么是负采样方法 - sigmoid 或 softmax?

What is negative sampling method use- sigmoid or softmax?

我最近正在阅读这篇论文:Word2Vec explained(https://arxiv.org/pdf/1402.3722.pdf)

还有一点不明白..

在第 3 页,他们说 p 是使用 softmax

定义的

$p(D=1|w, c, \theta) = \frac{1}{1+e^{-v_c\dotv_w}}$

enter image description here

但我很困惑,因为我在 sigmoid 函数中看到了那个公式,而不是 softmax 函数。

你是如何从 softmax 推导出这个定义的?

这可以说是作者有点滥用符号,但完全没问题。有时人们会互换使用 softmax 和 sigmoid。但是,在这种情况下,由于二进制 class 问题,它确实是一个 sigmoid 函数。