Rasa NLU:带有实体提取的 Tensorflow 嵌入
Rasa NLU: Tensorflow embedding with entity extraction
Tensorflow 嵌入具有非常好的意图识别。
根据我的经验,与 spacy 相比,"Hello" 等简单输入的测试结果置信度从大约 45% 提高到 95%。
但开箱即用,它没有任何实体提取。
是否有任何管道配置可以解决这个问题?
配置
下面的配置包含 ner_crf 用于实体提取。
language: "en"
pipeline:
- name: "tokenizer_whitespace"
- name: "intent_entity_featurizer_regex"
- name: "ner_crf"
- name: "ner_synonyms"
- name: "intent_featurizer_count_vectors"
- name: "intent_classifier_tensorflow_embedding"
用法
WebAPI:
curl --noproxy '*' -X POST --header 'content-type: application/x-yml' --data-binary @${RASA_FILE} --url "${RASA_YML}:5000/train?project=${PROJECT}&model=${MODELNAME}"
配置已包含在 RASA_YML 中。 docs
Bash:
python -m rasa_nlu.train -v --config ${CONFIG} --data ${RASA_MD} --path projects --project ${PROJECT} --fixed_model_name ${MODELNAME}
版本
Rasa NLU:>=0.13.0
信用:github issue
Tensorflow 嵌入具有非常好的意图识别。
根据我的经验,与 spacy 相比,"Hello" 等简单输入的测试结果置信度从大约 45% 提高到 95%。
但开箱即用,它没有任何实体提取。
是否有任何管道配置可以解决这个问题?
配置
下面的配置包含 ner_crf 用于实体提取。
language: "en"
pipeline:
- name: "tokenizer_whitespace"
- name: "intent_entity_featurizer_regex"
- name: "ner_crf"
- name: "ner_synonyms"
- name: "intent_featurizer_count_vectors"
- name: "intent_classifier_tensorflow_embedding"
用法
WebAPI:
curl --noproxy '*' -X POST --header 'content-type: application/x-yml' --data-binary @${RASA_FILE} --url "${RASA_YML}:5000/train?project=${PROJECT}&model=${MODELNAME}"
配置已包含在 RASA_YML 中。 docs
Bash:
python -m rasa_nlu.train -v --config ${CONFIG} --data ${RASA_MD} --path projects --project ${PROJECT} --fixed_model_name ${MODELNAME}
版本
Rasa NLU:>=0.13.0
信用:github issue