带有自定义行定界符的 Csv 有界源
Csv bounded source with a custom line Delimitter
我想读取一个 csv 文件,其中的行分隔符不是默认的行分隔符。每个 csv 记录跨越多行,因此 TextIO.Read 是不够的。
我应该扩展 FileBasedSource 还是有任何现有的 CsvBasedSource(带有自定义 line/fields 分隔符)。
我正在查看 splitIntoBundles() api,XmlSource 没有覆盖 isSplittable(),因此它可以拆分成包,我想知道 XmlSource 是如何处理这个的,因为拆分可以发生在 的中间,因为拆分仅基于 desiredBundleSize 发生。
没错,这需要自定义 FileBasedSource 实现才能工作。关于 XMLSource,记录和根元素名称必须是唯一的(即没有其他元素可以具有这些名称)。我们将更新文档以反映这一点,并在未来考虑对此进行改进。
我想读取一个 csv 文件,其中的行分隔符不是默认的行分隔符。每个 csv 记录跨越多行,因此 TextIO.Read 是不够的。
我应该扩展 FileBasedSource 还是有任何现有的 CsvBasedSource(带有自定义 line/fields 分隔符)。
我正在查看 splitIntoBundles() api,XmlSource 没有覆盖 isSplittable(),因此它可以拆分成包,我想知道 XmlSource 是如何处理这个的,因为拆分可以发生在
没错,这需要自定义 FileBasedSource 实现才能工作。关于 XMLSource,记录和根元素名称必须是唯一的(即没有其他元素可以具有这些名称)。我们将更新文档以反映这一点,并在未来考虑对此进行改进。