训练或自定义 Word 实体类型?
Train or Custom Word Entity Types?
我浏览了 documentation and testing Google's Natural Language API 并注意到其中有很多人、事件、组织和位置不正确 - 它似乎使用维基百科作为主要数据源,所以如果它不在维基百科中它似乎无法识别各种单词的类型。此外,如果某些单词出现在名称(专有名词)中,它似乎总是将实体标识为某种类型,这并不总是正确的。
例如:"Congress" 似乎总是被认为是一个组织 [政府],即使它是事件名称的一部分。名称 "WordCamp" 显示为位置,但它是一个事件。
有没有办法训练自然语言引擎或提供一组自定义的组织、位置、事件等,以便它为不太流行的实体提供更准确的类型信息?
我是这个产品的产品经理。当前不支持自定义实体类型。根据您对某些实体类型不正确的评论,这对任何 NLP 系统都是正确的,但我们的目标是不断改进。我们正在想方设法让您就我们犯错的情况向我们提供反馈,以提高我们的准确性,并将很快分享详细信息。请注意,我们已经在多个数据源上训练了我们的模型,而不仅仅是维基百科数据。 API return 是与检测到的实体最相关的维基百科文章,因此如果实体有多种解释,我们只会 return 最常用的解释。
我浏览了 documentation and testing Google's Natural Language API 并注意到其中有很多人、事件、组织和位置不正确 - 它似乎使用维基百科作为主要数据源,所以如果它不在维基百科中它似乎无法识别各种单词的类型。此外,如果某些单词出现在名称(专有名词)中,它似乎总是将实体标识为某种类型,这并不总是正确的。
例如:"Congress" 似乎总是被认为是一个组织 [政府],即使它是事件名称的一部分。名称 "WordCamp" 显示为位置,但它是一个事件。
有没有办法训练自然语言引擎或提供一组自定义的组织、位置、事件等,以便它为不太流行的实体提供更准确的类型信息?
我是这个产品的产品经理。当前不支持自定义实体类型。根据您对某些实体类型不正确的评论,这对任何 NLP 系统都是正确的,但我们的目标是不断改进。我们正在想方设法让您就我们犯错的情况向我们提供反馈,以提高我们的准确性,并将很快分享详细信息。请注意,我们已经在多个数据源上训练了我们的模型,而不仅仅是维基百科数据。 API return 是与检测到的实体最相关的维基百科文章,因此如果实体有多种解释,我们只会 return 最常用的解释。