Stanford Dependency Parser - 如何获取短语向量?
Stanford Dependency Parser - How to get phrase vectors?
在 DependencyParser.java repository 中,我可以看到它使用的是递归神经网络。
从公开讲座 (http://cs224d.stanford.edu) 中,我了解到这些网络在解析树的每个节点计算短语向量。
我正在尝试让解析器输出短语向量,以便我可以在二维平面上绘制它们,但到目前为止我还没有弄清楚。 - 谁能告诉我计算它们的 java 对象和行号? (我怀疑他们会在765行~)
private void setupClassifierForTraining(List<CoreMap> trainSents, List<DependencyTree> trainTrees, String embedFile, String preModel) {
double[][] E = new double[knownWords.size() + knownPos.size() + knownLabels.size()][config.embeddingSize];
double[][] W1 = new double[config.hiddenSize][config.embeddingSize * config.numTokens];
double[] b1 = new double[config.hiddenSize];
double[][] W2 = new double[system.numTransitions()][config.hiddenSize];
如果这不是寻找短语向量的正确位置,如果您能指出我应该查看的 CoreNLP project 中的代码,我将不胜感激。
你指的是哪个讲座?
本文介绍了我们发布的神经网络依赖解析器:
http://cs.stanford.edu/people/danqi/papers/emnlp2014.pdf
我不相信它会创建短语嵌入;它为单词、词性标签和依赖标签创建嵌入。
在 DependencyParser.java repository 中,我可以看到它使用的是递归神经网络。 从公开讲座 (http://cs224d.stanford.edu) 中,我了解到这些网络在解析树的每个节点计算短语向量。
我正在尝试让解析器输出短语向量,以便我可以在二维平面上绘制它们,但到目前为止我还没有弄清楚。 - 谁能告诉我计算它们的 java 对象和行号? (我怀疑他们会在765行~)
private void setupClassifierForTraining(List<CoreMap> trainSents, List<DependencyTree> trainTrees, String embedFile, String preModel) {
double[][] E = new double[knownWords.size() + knownPos.size() + knownLabels.size()][config.embeddingSize];
double[][] W1 = new double[config.hiddenSize][config.embeddingSize * config.numTokens];
double[] b1 = new double[config.hiddenSize];
double[][] W2 = new double[system.numTransitions()][config.hiddenSize];
如果这不是寻找短语向量的正确位置,如果您能指出我应该查看的 CoreNLP project 中的代码,我将不胜感激。
你指的是哪个讲座?
本文介绍了我们发布的神经网络依赖解析器:
http://cs.stanford.edu/people/danqi/papers/emnlp2014.pdf
我不相信它会创建短语嵌入;它为单词、词性标签和依赖标签创建嵌入。