ConceptNet 相关调优
ConceptNet RelatedTo Tuning
我正在使用 ConceptNet http://conceptnet.io 尝试使用它们的 relatedto 和 edge/query 端点来获取相关关键字。数据很棒,但是我遇到了一些我无法理解的行为。
如果您在主站点上查询 "relatedto" 关键字 "person" 且限制为 20,您会得到:
http://conceptnet.io/c/en/person?rel=/r/RelatedTo&limit=20
或者这个单词列表:
doll
character
statue
person
servant
body
farmer
child
man
baby
guard
name
doctor
captain
people
neighbour
boy
非常棒吧?非常有话题性和实用性。
另一方面,如果您查询 API 时使用的格式与 API 格式相同:
http://api.conceptnet.io/related/c/en/person?filter=/c/en&limit=20
为清楚起见已缩短(请参阅上面的 link 了解完整回复):
{
"@id": "/c/en/person",
"related": [
{
"@id": "/c/en/person",
"weight": 1.0
},
{
"@id": "/c/en/sean_connery",
"weight": 0.963
},
{
"@id": "/c/en/steve_ballmer",
"weight": 0.962
},
{
"@id": "/c/en/norman_jewison",
"weight": 0.962
},
{
"@id": "/c/en/aretha_franklin",
"weight": 0.962
}
]
}
嗯。那里发生什么了?那用处就小了很多。我们得到的只是名称,而不是非常相关的术语。
所以我的问题是:如何获得类似列表?
他们是否使用一些复杂的边缘分析(使用标准,与查询无关)来获取网站上的相关术语?
或
我是不是漏掉了什么我想不通的东西?
非常感谢任何帮助。
谢谢
要查询包含节点 /c/en/person
的标有 /r/RelatedTo
的现有边,您应该查询:http://api.conceptnet.io/query?node=/c/en/person&rel=/r/RelatedTo
该查询的结果与网站匹配。
/related
端点不同,仅存在于 API 中。它应用一些机器学习来预测相关的节点,无论连接它们的边是否已经存在于 ConceptNet 中。对于更具体的概念,它比 "person" 更好。试试 "teacher" 例如:http://api.conceptnet.io/related/c/en/teacher?filter=/c/en&limit=20
我正在使用 ConceptNet http://conceptnet.io 尝试使用它们的 relatedto 和 edge/query 端点来获取相关关键字。数据很棒,但是我遇到了一些我无法理解的行为。
如果您在主站点上查询 "relatedto" 关键字 "person" 且限制为 20,您会得到:
http://conceptnet.io/c/en/person?rel=/r/RelatedTo&limit=20
或者这个单词列表:
doll
character
statue
person
servant
body
farmer
child
man
baby
guard
name
doctor
captain
people
neighbour
boy
非常棒吧?非常有话题性和实用性。
另一方面,如果您查询 API 时使用的格式与 API 格式相同:
http://api.conceptnet.io/related/c/en/person?filter=/c/en&limit=20
为清楚起见已缩短(请参阅上面的 link 了解完整回复):
{
"@id": "/c/en/person",
"related": [
{
"@id": "/c/en/person",
"weight": 1.0
},
{
"@id": "/c/en/sean_connery",
"weight": 0.963
},
{
"@id": "/c/en/steve_ballmer",
"weight": 0.962
},
{
"@id": "/c/en/norman_jewison",
"weight": 0.962
},
{
"@id": "/c/en/aretha_franklin",
"weight": 0.962
}
]
}
嗯。那里发生什么了?那用处就小了很多。我们得到的只是名称,而不是非常相关的术语。
所以我的问题是:如何获得类似列表?
他们是否使用一些复杂的边缘分析(使用标准,与查询无关)来获取网站上的相关术语?
或
我是不是漏掉了什么我想不通的东西?
非常感谢任何帮助。
谢谢
要查询包含节点 /c/en/person
的标有 /r/RelatedTo
的现有边,您应该查询:http://api.conceptnet.io/query?node=/c/en/person&rel=/r/RelatedTo
该查询的结果与网站匹配。
/related
端点不同,仅存在于 API 中。它应用一些机器学习来预测相关的节点,无论连接它们的边是否已经存在于 ConceptNet 中。对于更具体的概念,它比 "person" 更好。试试 "teacher" 例如:http://api.conceptnet.io/related/c/en/teacher?filter=/c/en&limit=20