java 中的 dbpedia Spotlight Web 服务

dbpedia spotlight web service in java

我想从文本中获取实体的 dbpedia link。我已经看到 DBpedia spotlight 是最好的方法。所以我用 curl 命令尝试了一下,输出看起来不错。 我正在使用 DBpedia Spotlight Web ServiceJava 中的 HttpClient 处理文本,如此 link http://hi.baidu.com/shirleyzzzhen/item/e757e17bfdf98125d6a89c00 中给出。我想每天处理数百万份文件。可以用这种方法处理我的文件吗?访问网络服务是否有每日限制?

"I want to process millions of documents daily. Is it possible to process my documents by this method?"

是的,但我认为使用 url 参数而不是文本是个好主意。例如。 http://spotlight.dbpedia.org/rest/annotate?url=http://edition.cnn.com/2015/04/29/asia/nepal-earthquake/index.html

"Is there any daily limit for accessing the web service?"

不,没有。但请记住 spotlight.dbpedia.org 是一项演示服务。我建议拥有自己的实例以便对其进行处理。