将 EBCDIC 转换为 ASCII 文件格式 - 用于配置单元的 SerDe。如何克服 EBCDIC 文件中的分隔符问题

Converting EBCDIC to ASCII file format- SerDe for hive. How to overcome issue of delimiter in EBCDIC file

ebcdic 中没有类似 /n 的东西。 ebcdic 不支持换行。 我应该如何转换它。 ebcdic 中没有定界符。所以在转换这个文件的时候。我怎么知道新线路已经到来? 请提出建议。

实际上有一个换行符(x'15')。正常的 ZOS 文件不使用换行符。 ZOS 是围绕固定宽度、VB、VSAM 等文件构建的。

选项包括:

  1. 如果它是文本文件(不太可能),请在从大型机传输文件时将文件转换为 ascii。
  2. 在主机上将文件转换为文本,并在离开主机时进行转换。
  3. 使用商业包。 Sync-Sort有DMX-h,还有Datameer
  4. 如果你有 Cobol copybook,看看这些开源包:
  5. JRecord 可以与 Cobol Copybook、Plain Java 代码或 Xml 文件描述一起使用 6.

EBCDIC 中的新行通常由 carriage-return 字符(十六进制 0D)和 line-feed(十六进制 25)组成。在 ASCII 中,carriage-return 也是十六进制的 0D,但 line-feed 字符需要转换为十六进制的 0A。 希望这有帮助。