librdf raptor 处理对象中的整数值

librdf raptor deal with integer value in object

当 ntriple 的对象中有一个整数值时,我得到一个错误。如何直接获取整数值?而不是得到一个错误。谢谢。

详情:

  1. rdf 三元组

    <http://rdf.freebase.com/ns/g.124x8gtbc> <http://rdf.freebase.com/ns/measurement_unit.dated_percentage.rate> 1.27 .

  2. 代码

下面是我的代码。

void process_nt_file(string file_path, raptor_statement_handler pro_handler){
  unsigned char *uri_string;
  raptor_uri *uri, *base_uri;
  raptor_parser *rdf_parser;
  
  raptor_world *world = raptor_new_world();
  rdf_parser = raptor_new_parser(world, "ntriples");
  raptor_parser_set_statement_handler(rdf_parser, NULL, pro_handler);
  
  uri_string = raptor_uri_filename_to_uri_string(file_path.c_str());
  uri = raptor_new_uri(world, uri_string);
  base_uri = raptor_uri_copy(uri);

  time_t start_t, end_t;
  time(&start_t);
  
  raptor_parser_parse_file(rdf_parser, uri, base_uri);
  
  time(&end_t);
  double diff_time = difftime(end_t, start_t);
  printf("Duration: %.2lf s", diff_time);
  
  raptor_free_parser(rdf_parser);
}

问题是您的数据不是有效的 NTriples,因此 libraptor 拒绝它是完全正确的。您的数据片段正在使用称为纯文字的语法压缩,这在 NTriples 中无效。

此压缩实际上来自 Turtle 格式(它是 NTriples 的超集),因此您需要将数据解析为 Turtle。

所以代替这一行:

rdf_parser = raptor_new_parser(world, "ntriples");

使用这一行:

rdf_parser = raptor_new_parser(world, "turtle");

请注意,Freebase 数据因包含大量无效数据而臭名昭著,因此即使进行了此更改,您仍可能 运行 出错。