如何将xhtml文档加载为文本并在marklogic中搜索关键字
How to load the xhtml document as a text and search the keyword in marklogic
我已经在 marklogic 中加载了 XHTML 文件。但需要对属性、元素和文本进行搜索。
所以我需要 get/load 文档作为文本并对文档执行搜索。
下面是 XHTML 文件。
<?xml version="1.0" encoding="UTF-8"?>
<html xmlns="http://www.w3.org/1999/xhtml">
<meta>
</meta>
<body class="Default">
</body>
</html>
Using below code I am ble to save text file but it will aloow to save (>0.2KB )small size file. I need to save upto 1 to 50MB files in marklogic DB.
Using below code I am able to save file as text but big file not able to save.
ContentCreateOptions createOptions = ContentCreateOptions.newTextInstance();
Content content = ContentFactory.newContent("/"+uID,filetext, createOptions);
mlSession.insertContent(content);
仍然不太确定这背后的用例,但你可以:
如果您真的想搜索元素名称、属性和文本的全文而不加区别,您最好在摄取时将其作为文本插入。例如:
xdmp:document-insert(
"/my.xhtml",
text {
xdmp:quote(
<html xmlns="http://www.w3.org/1999/xhtml">
...
</html>
)
}
)
或者:
xdmp:document-load(
"/server/path/to/my.xhtml",
<options xmlns="xdmp:document-load">
<format>text</format>
</options>
)
之后你可以简单地做:
cts:search(collection(), "mytagorattrorterm")
或者,您可以在执行 cts:contains 或 fn:contains 之前使用 xdmp:quote,但这种扩展非常糟糕,因此您最好同时对一个或几个文档执行此操作时间.
HTH!
我已经在 marklogic 中加载了 XHTML 文件。但需要对属性、元素和文本进行搜索。 所以我需要 get/load 文档作为文本并对文档执行搜索。
下面是 XHTML 文件。
<?xml version="1.0" encoding="UTF-8"?>
<html xmlns="http://www.w3.org/1999/xhtml">
<meta>
</meta>
<body class="Default">
</body>
</html>
Using below code I am ble to save text file but it will aloow to save (>0.2KB )small size file. I need to save upto 1 to 50MB files in marklogic DB.
Using below code I am able to save file as text but big file not able to save.
ContentCreateOptions createOptions = ContentCreateOptions.newTextInstance();
Content content = ContentFactory.newContent("/"+uID,filetext, createOptions);
mlSession.insertContent(content);
仍然不太确定这背后的用例,但你可以:
如果您真的想搜索元素名称、属性和文本的全文而不加区别,您最好在摄取时将其作为文本插入。例如:
xdmp:document-insert(
"/my.xhtml",
text {
xdmp:quote(
<html xmlns="http://www.w3.org/1999/xhtml">
...
</html>
)
}
)
或者:
xdmp:document-load(
"/server/path/to/my.xhtml",
<options xmlns="xdmp:document-load">
<format>text</format>
</options>
)
之后你可以简单地做:
cts:search(collection(), "mytagorattrorterm")
或者,您可以在执行 cts:contains 或 fn:contains 之前使用 xdmp:quote,但这种扩展非常糟糕,因此您最好同时对一个或几个文档执行此操作时间.
HTH!