如何配置 RDF4J Rio writer 来编写带有特殊字符的 IRI?

How to configure RDF4J Rio writer to write IRIs with special characters?

我想用 rdf/turtle 格式写一个 rdf4j.model.Model。该模型应包含带有字符 {}.

的 IRI

当我尝试用 rdf4j.rio.Rio 编写 RDF 模型时,{} 个字符被写为 %7B%7D。有没有办法克服这个问题?例如用 path and query variables 创建一个 rdf4j.model.IRI 或配置编写器以保留 {} 个字符?

我正在使用 org.eclipse.rdf4j:rdf4j-runtime:3.6.2

示例片段:

import org.eclipse.rdf4j.model.BNode;
import org.eclipse.rdf4j.model.IRI;
import org.eclipse.rdf4j.model.Model;
import org.eclipse.rdf4j.model.impl.SimpleValueFactory;
import org.eclipse.rdf4j.model.util.ModelBuilder;
import org.eclipse.rdf4j.rio.*;
import org.eclipse.rdf4j.rio.helpers.BasicWriterSettings;

import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.util.logging.Level;
import java.util.logging.Logger;

public class ExamplePathVariable {

    private final static Logger LOG = Logger.getLogger(ExamplePathVariable.class.getCanonicalName());
    public static void main(String[] args) {

        SimpleValueFactory rdf = SimpleValueFactory.getInstance();
        ModelBuilder modelBuilder = new ModelBuilder();

        BNode subject = rdf.createBNode();
        IRI predicate = rdf.createIRI("http://example.org/onto#hasURI");

        // IRI with special characters !
        IRI object = rdf.createIRI("http://example.org/{token}");

        modelBuilder.add(subject, predicate, object);

        String turtleStr = writeToString(RDFFormat.TURTLE, modelBuilder.build());
        LOG.log(Level.INFO, turtleStr);
    }

    static String writeToString(RDFFormat format, Model model) {
        OutputStream out = new ByteArrayOutputStream();

        try {
            Rio.write(model, out, format,
                    new WriterConfig().set(BasicWriterSettings.INLINE_BLANK_NODES, true));
        } finally {
            try {
                out.close();
            } catch (IOException e) {
                LOG.log(Level.WARNING, e.getMessage());
            }
        }

        return out.toString();
    }
}

这是我得到的:

INFO: 
[] <http://example.org/onto#hasURI> <http://example.org/%7Btoken%7D> .

没有简单的方法来做你想做的事,因为这会导致 Turtle 中的语法无效 URI 表示。

字符“{”和“}”即使实际上不是 URI 中的保留字符,也不允许以未编码的形式存在于 URI 中(请参阅 https://datatracker.ietf.org/doc/html/rfc3987)。合法序列化它们的唯一方法是对它们进行百分比编码。

顺便说一句,这段代码的唯一原因是:

IRI object = rdf.createIRI("http://example.org/{token}");

成功是因为您使用的SimpleValueFactory没有进行字符验证(出于性能原因)。如果您改为使用 recommended approach(自 RDF4J 3.5 起)使用 Values 静态工厂:

IRI object = Values.iri("http://example.org/{token}");

...您会立即收到验证错误。

如果你想在事先不知道它是否包含任何无效字符的地方输入一个字符串,并希望有一个最大努力的方法将它转换为合法的 URI,你可以使用 ParsedIRI.create:

IRI object = Values.iri(ParsedIRI.create("http://example.org/{token}").toString());