如何使用 syntaxnet 输出
How to use syntaxnet output
我两天前开始玩 Syntaxnet,我想知道如何以一种易于理解的格式 use/export 输出(ascii 树或 conll )解析(即:Json、XML、python 图)。
感谢您的帮助!
在进入 ascii 树之前(我想你正在关注 demo.sh),输入要经过标记和解析。删除命令管道中的最后一步。
您修改后的 demo.sh 文件将如下所示:-
PARSER_EVAL=bazel-bin/syntaxnet/parser_eval
MODEL_DIR=syntaxnet/models/parsey_mcparseface
[[ "" == "--conll" ]] && INPUT_FORMAT=stdin-conll || INPUT_FORMAT=stdin
$PARSER_EVAL \
--input=$INPUT_FORMAT \
--output=stdout-conll \
--hidden_layer_sizes=64 \
--arg_prefix=brain_tagger \
--graph_builder=structured \
--task_context=$MODEL_DIR/context.pbtxt \
--model_path=$MODEL_DIR/tagger-params \
--slim_model \
--batch_size=1024 \
--alsologtostderr \
| \
$PARSER_EVAL \
--input=stdin-conll \
--output=stdout-conll \
--hidden_layer_sizes=512,512 \
--arg_prefix=brain_parser \
--graph_builder=structured \
--task_context=$MODEL_DIR/context.pbtxt \
--model_path=$MODEL_DIR/parser-params \
--slim_model \
--batch_size=1024 \
--alsologtostderr \
然后你可以运行:-
$ echo 'Bob brought the pizza to Alice.' | syntaxnet/demo.sh 1>sample.txt 2>dev/null
您的结果将存储在 sample.txt 中,看起来像这样 :-
1 Bob _ NOUN NNP _ 2 nsubj _ _
2 brought _ VERB VBD _ 0 ROOT _ _
3 the _ DET DT _ 4 det _ _
4 pizza _ NOUN NN _ 2 dobj _ _
5 to _ ADP IN _ 2 prep _ _
6 Alice _ NOUN NNP _ 5 pobj _ _
7 . _ . . _ 2 punct _ _
从这里开始,通过\n
拆分数据,可以轻松获取每个词的中心词、词性、节点类型等信息
ascii树本身就是用上面的方法构建的。
我是来找词性输出的图例的。它是在已删除的答案中分享的——其他用户可能看不到。
到目前为止,词性缩写似乎与我的句子的 Penn Parts of Speech Tags 匹配。在这里引用 table 以防页面关闭或更改:
- CC Coordinating conjunction
- CD Cardinal number
- DT Determiner
- EX Existential there
- FW Foreign word
- IN Preposition or subordinating conjunction
- JJ Adjective
- JJR Adjective, comparative
- JJS Adjective, superlative
- LS List item marker
- MD Modal
- NN Noun, singular or mass
- NNS Noun, plural
- NNP Proper noun, singular
- NNPS Proper noun, plural
- PDT Predeterminer
- POS Possessive ending
- PRP Personal pronoun
- PRP$ Possessive pronoun
- RB Adverb
- RBR Adverb, comparative
- RBS Adverb, superlative
- RP Particle
- SYM Symbol
- TO to
- UH Interjection
- VB Verb, base form
- VBD Verb, past tense
- VBG Verb, gerund or present participle
- VBN Verb, past participle
- VBP Verb, non-3rd person singular present
- VBZ Verb, 3rd person singular present
- WDT Wh-determiner
- WP Wh-pronoun
- WP$ Possessive wh-pronoun
- WRB Wh-adverb
我写了一篇博客 post 解释了如何将任何给定语言的 SyntaxNet 输出输入 Python,特别是输入 NLTK,并将它的输出与依赖图和树一起使用 类.
您可以在这里查看:http://www.davidsbatista.net/blog/2017/03/25/syntaxnet/
我两天前开始玩 Syntaxnet,我想知道如何以一种易于理解的格式 use/export 输出(ascii 树或 conll )解析(即:Json、XML、python 图)。
感谢您的帮助!
在进入 ascii 树之前(我想你正在关注 demo.sh),输入要经过标记和解析。删除命令管道中的最后一步。
您修改后的 demo.sh 文件将如下所示:-
PARSER_EVAL=bazel-bin/syntaxnet/parser_eval
MODEL_DIR=syntaxnet/models/parsey_mcparseface
[[ "" == "--conll" ]] && INPUT_FORMAT=stdin-conll || INPUT_FORMAT=stdin
$PARSER_EVAL \
--input=$INPUT_FORMAT \
--output=stdout-conll \
--hidden_layer_sizes=64 \
--arg_prefix=brain_tagger \
--graph_builder=structured \
--task_context=$MODEL_DIR/context.pbtxt \
--model_path=$MODEL_DIR/tagger-params \
--slim_model \
--batch_size=1024 \
--alsologtostderr \
| \
$PARSER_EVAL \
--input=stdin-conll \
--output=stdout-conll \
--hidden_layer_sizes=512,512 \
--arg_prefix=brain_parser \
--graph_builder=structured \
--task_context=$MODEL_DIR/context.pbtxt \
--model_path=$MODEL_DIR/parser-params \
--slim_model \
--batch_size=1024 \
--alsologtostderr \
然后你可以运行:-
$ echo 'Bob brought the pizza to Alice.' | syntaxnet/demo.sh 1>sample.txt 2>dev/null
您的结果将存储在 sample.txt 中,看起来像这样 :-
1 Bob _ NOUN NNP _ 2 nsubj _ _
2 brought _ VERB VBD _ 0 ROOT _ _
3 the _ DET DT _ 4 det _ _
4 pizza _ NOUN NN _ 2 dobj _ _
5 to _ ADP IN _ 2 prep _ _
6 Alice _ NOUN NNP _ 5 pobj _ _
7 . _ . . _ 2 punct _ _
从这里开始,通过\n
拆分数据,可以轻松获取每个词的中心词、词性、节点类型等信息ascii树本身就是用上面的方法构建的。
我是来找词性输出的图例的。它是在已删除的答案中分享的——其他用户可能看不到。
到目前为止,词性缩写似乎与我的句子的 Penn Parts of Speech Tags 匹配。在这里引用 table 以防页面关闭或更改:
- CC Coordinating conjunction
- CD Cardinal number
- DT Determiner
- EX Existential there
- FW Foreign word
- IN Preposition or subordinating conjunction
- JJ Adjective
- JJR Adjective, comparative
- JJS Adjective, superlative
- LS List item marker
- MD Modal
- NN Noun, singular or mass
- NNS Noun, plural
- NNP Proper noun, singular
- NNPS Proper noun, plural
- PDT Predeterminer
- POS Possessive ending
- PRP Personal pronoun
- PRP$ Possessive pronoun
- RB Adverb
- RBR Adverb, comparative
- RBS Adverb, superlative
- RP Particle
- SYM Symbol
- TO to
- UH Interjection
- VB Verb, base form
- VBD Verb, past tense
- VBG Verb, gerund or present participle
- VBN Verb, past participle
- VBP Verb, non-3rd person singular present
- VBZ Verb, 3rd person singular present
- WDT Wh-determiner
- WP Wh-pronoun
- WP$ Possessive wh-pronoun
- WRB Wh-adverb
我写了一篇博客 post 解释了如何将任何给定语言的 SyntaxNet 输出输入 Python,特别是输入 NLTK,并将它的输出与依赖图和树一起使用 类.
您可以在这里查看:http://www.davidsbatista.net/blog/2017/03/25/syntaxnet/