将 sqlplus 结果假脱机到 xml 文件时不需要的新行

Question

我正在尝试从我的数据库中提取一些数据到一个 XML 文件中。为此，请使用调用 sqlplus 命令的 bash 脚本并将结果假脱机到新文件中。

提取结果后出现问题。我的 xml 文件不再有效，因为添加了一些不需要的新行...

这是我想要的示例：

<xml>
 <element>John</element>
 <element>some data</element>
 <element>a longer data line</element>
</xml>

这是我得到的：

<xml>
 <element>John</element>
 <element>some data</eleme
 nt>
 <element>a longer data 
 line</element>
</xml>

似乎最长的行被剪掉了，但我在 Sqlplus 中将 linesize 设置为 32767，这些行并没有那么长...

这是我的 sqlplus 命令的样子：

sqlplus -s {connection} << EOF
set serveroutput on size unlimited
set feedback off
set termout off
set linesize 32767

spool file.xml;

DECLARE
l_xmltype XMLTYPE;
l_ctx dbms_xmlgen.ctxhandle;
v_clob CLOB;
v_clob_length INTEGER;
pos INTEGER;
buffer VARCHAR2(32767);
amount BINARY_INTEGER := 32767;

BEGIN

l_ctx := dbms_xmlgen.newcontext('SELECT a.rowid, a.* FROM mytable a');
l_xmltype := dbms_xmlgen.getXmlType(l_ctx);
dbms_xmlgen.closeContext(l_ctx);

v_clob := l_xmltype.getClobVal;
v_clob_length := length(v_clob);

WHILE pos < clob_length LOOP
 dbms_lob.read(v_clob, amount, pos, buffer);
 dbms_output.put_line(buffer);
 pos := pos + amount;
END LOOP;

END;
/
EOF
Spool off;

你有什么线索可以帮我解决这个问题吗？

谢谢！

Answer 1

正如@kfinity 所建议的，这与 CLOB 处理有关，但也与 dbms_output 的工作方式有关。您正在以 32k 的块读取 CLOB，并使用 put_line() 写出每个块，这会在每个 32k 的块之后附加一个换行符。这些与您的 XML 文档中的任何现有换行符都不对齐，因此您会得到原始的换行符，然后是额外的换行符 - 它们看起来有些随机且位于文本中间，但实际上位于可预测的位置。

一个明显的解决方案是从 put_line() 切换到 put()，但这会破坏最大缓冲区大小并抛出类似 "ORU-10028: line length overflow, limit of 32767 bytes per line".

的内容

您可以一次读取一行，而不是读取固定的 32k 块； CLOB 并不真正理解行本身，但您可以查找换行符，例如：

WHILE pos < v_clob_length LOOP
  -- read to next newline if there is one, rest of CLOB if not
  if dbms_lob.instr(v_clob, chr(10), pos) > 0 then
    amount := dbms_lob.instr(v_clob, chr(10), pos) - pos;
    dbms_lob.read(v_clob, amount, pos, buffer);
    pos := pos + amount + 1; -- skip newline character
  else
    amount := 32767;
    dbms_lob.read(v_clob, amount, pos, buffer);
    pos := pos + amount;
  end if;

  dbms_output.put_line(buffer);
END LOOP;

if 在当前位置之后寻找换行符。如果它找到一个，那么数量计算为从当前位置到新行的字符数（或者更确切地说，减去一个 - 因为你不想要换行本身），它读取那么多字符，然后调整位置按阅读量加一（跳过换行符 - 你不需要 want/need 因为 put_line() 仍然加一）。

如果找不到，那么它最多读取 32k - 希望只有一次；如果有更多的字符没有换行符，那么它会进行第二次读取，但仍然添加那个流氓额外的新行并打破那条线。但是，使用 dbms_output 您无能为力，您需要切换到 utl_file 写入服务器而不是假脱机到客户端。

将 sqlplus 结果假脱机到 xml 文件时不需要的新行

Unwanted new lines when spooling an sqlplus result to xml file

xml

linux

oracle

sqlplus

spool