将 sqlplus 结果假脱机到 xml 文件时不需要的新行
Unwanted new lines when spooling an sqlplus result to xml file
我正在尝试从我的数据库中提取一些数据到一个 XML 文件中。
为此,请使用调用 sqlplus 命令的 bash 脚本并将结果假脱机到新文件中。
提取结果后出现问题。我的 xml 文件不再有效,因为添加了一些不需要的新行...
这是我想要的示例:
<xml>
<element>John</element>
<element>some data</element>
<element>a longer data line</element>
</xml>
这是我得到的:
<xml>
<element>John</element>
<element>some data</eleme
nt>
<element>a longer data
line</element>
</xml>
似乎最长的行被剪掉了,但我在 Sqlplus 中将 linesize 设置为 32767,这些行并没有那么长...
这是我的 sqlplus 命令的样子:
sqlplus -s {connection} << EOF
set serveroutput on size unlimited
set feedback off
set termout off
set linesize 32767
spool file.xml;
DECLARE
l_xmltype XMLTYPE;
l_ctx dbms_xmlgen.ctxhandle;
v_clob CLOB;
v_clob_length INTEGER;
pos INTEGER;
buffer VARCHAR2(32767);
amount BINARY_INTEGER := 32767;
BEGIN
l_ctx := dbms_xmlgen.newcontext('SELECT a.rowid, a.* FROM mytable a');
l_xmltype := dbms_xmlgen.getXmlType(l_ctx);
dbms_xmlgen.closeContext(l_ctx);
v_clob := l_xmltype.getClobVal;
v_clob_length := length(v_clob);
WHILE pos < clob_length LOOP
dbms_lob.read(v_clob, amount, pos, buffer);
dbms_output.put_line(buffer);
pos := pos + amount;
END LOOP;
END;
/
EOF
Spool off;
你有什么线索可以帮我解决这个问题吗?
谢谢!
正如@kfinity 所建议的,这与 CLOB 处理有关,但也与 dbms_output
的工作方式有关。您正在以 32k 的块读取 CLOB,并使用 put_line()
写出每个块,这会在每个 32k 的块之后附加一个换行符。这些与您的 XML 文档中的任何现有换行符都不对齐,因此您会得到原始的换行符,然后是额外的换行符 - 它们看起来有些随机且位于文本中间,但实际上位于可预测的位置。
一个明显的解决方案是从 put_line()
切换到 put()
,但这会破坏最大缓冲区大小并抛出类似 "ORU-10028: line length overflow, limit of 32767 bytes per line".
的内容
您可以一次读取一行,而不是读取固定的 32k 块; CLOB 并不真正理解行本身,但您可以查找换行符,例如:
WHILE pos < v_clob_length LOOP
-- read to next newline if there is one, rest of CLOB if not
if dbms_lob.instr(v_clob, chr(10), pos) > 0 then
amount := dbms_lob.instr(v_clob, chr(10), pos) - pos;
dbms_lob.read(v_clob, amount, pos, buffer);
pos := pos + amount + 1; -- skip newline character
else
amount := 32767;
dbms_lob.read(v_clob, amount, pos, buffer);
pos := pos + amount;
end if;
dbms_output.put_line(buffer);
END LOOP;
if
在当前位置之后寻找换行符。如果它找到一个,那么数量计算为从当前位置到新行的字符数(或者更确切地说,减去一个 - 因为你不想要换行本身),它读取那么多字符,然后调整位置按阅读量加一(跳过换行符 - 你不需要 want/need 因为 put_line()
仍然加一)。
如果找不到,那么它最多读取 32k - 希望只有一次;如果有更多的字符没有换行符,那么它会进行第二次读取,但仍然添加那个流氓额外的新行并打破那条线。但是,使用 dbms_output
您无能为力,您需要切换到 utl_file
写入服务器而不是假脱机到客户端。
我正在尝试从我的数据库中提取一些数据到一个 XML 文件中。 为此,请使用调用 sqlplus 命令的 bash 脚本并将结果假脱机到新文件中。
提取结果后出现问题。我的 xml 文件不再有效,因为添加了一些不需要的新行...
这是我想要的示例:
<xml>
<element>John</element>
<element>some data</element>
<element>a longer data line</element>
</xml>
这是我得到的:
<xml>
<element>John</element>
<element>some data</eleme
nt>
<element>a longer data
line</element>
</xml>
似乎最长的行被剪掉了,但我在 Sqlplus 中将 linesize 设置为 32767,这些行并没有那么长...
这是我的 sqlplus 命令的样子:
sqlplus -s {connection} << EOF
set serveroutput on size unlimited
set feedback off
set termout off
set linesize 32767
spool file.xml;
DECLARE
l_xmltype XMLTYPE;
l_ctx dbms_xmlgen.ctxhandle;
v_clob CLOB;
v_clob_length INTEGER;
pos INTEGER;
buffer VARCHAR2(32767);
amount BINARY_INTEGER := 32767;
BEGIN
l_ctx := dbms_xmlgen.newcontext('SELECT a.rowid, a.* FROM mytable a');
l_xmltype := dbms_xmlgen.getXmlType(l_ctx);
dbms_xmlgen.closeContext(l_ctx);
v_clob := l_xmltype.getClobVal;
v_clob_length := length(v_clob);
WHILE pos < clob_length LOOP
dbms_lob.read(v_clob, amount, pos, buffer);
dbms_output.put_line(buffer);
pos := pos + amount;
END LOOP;
END;
/
EOF
Spool off;
你有什么线索可以帮我解决这个问题吗?
谢谢!
正如@kfinity 所建议的,这与 CLOB 处理有关,但也与 dbms_output
的工作方式有关。您正在以 32k 的块读取 CLOB,并使用 put_line()
写出每个块,这会在每个 32k 的块之后附加一个换行符。这些与您的 XML 文档中的任何现有换行符都不对齐,因此您会得到原始的换行符,然后是额外的换行符 - 它们看起来有些随机且位于文本中间,但实际上位于可预测的位置。
一个明显的解决方案是从 put_line()
切换到 put()
,但这会破坏最大缓冲区大小并抛出类似 "ORU-10028: line length overflow, limit of 32767 bytes per line".
您可以一次读取一行,而不是读取固定的 32k 块; CLOB 并不真正理解行本身,但您可以查找换行符,例如:
WHILE pos < v_clob_length LOOP
-- read to next newline if there is one, rest of CLOB if not
if dbms_lob.instr(v_clob, chr(10), pos) > 0 then
amount := dbms_lob.instr(v_clob, chr(10), pos) - pos;
dbms_lob.read(v_clob, amount, pos, buffer);
pos := pos + amount + 1; -- skip newline character
else
amount := 32767;
dbms_lob.read(v_clob, amount, pos, buffer);
pos := pos + amount;
end if;
dbms_output.put_line(buffer);
END LOOP;
if
在当前位置之后寻找换行符。如果它找到一个,那么数量计算为从当前位置到新行的字符数(或者更确切地说,减去一个 - 因为你不想要换行本身),它读取那么多字符,然后调整位置按阅读量加一(跳过换行符 - 你不需要 want/need 因为 put_line()
仍然加一)。
如果找不到,那么它最多读取 32k - 希望只有一次;如果有更多的字符没有换行符,那么它会进行第二次读取,但仍然添加那个流氓额外的新行并打破那条线。但是,使用 dbms_output
您无能为力,您需要切换到 utl_file
写入服务器而不是假脱机到客户端。