Apache Drill 检查目录中文件的结构
Apache Drill check structure of files in directory
我正在使用来自 java 代码的 Apache Drill。 Drill 能够查询包含一堆文件的目录 table。但如果目录中的文件具有不同的结构,查询将失败。我知道这不是很常见的用例查询目录,其中包含不同结构的文件,但是是否有任何内置函数或查询允许我在对目录进行任何实际查询之前检查目录中的所有文件是否具有相同的结构?
我知道我可以做简单的事情
select * from path.to.directory limit 1;
并捕获异常,但我正在搜索 Drill 内置函数。我在文档中搜索,但没有找到任何内容。
似乎没有用于在使用前检查数据存储的开箱即用功能。这对我来说并不奇怪。例如,如果您考虑关系数据库,则不会在每次执行 select.
时显式检查与数据库的连接或检查数据是否未损坏。
但是,如果您真的需要这个,您可以考虑编写一个文件的临时检查代码或为此编写一个自定义钻取函数,如 here 所述。
我正在使用来自 java 代码的 Apache Drill。 Drill 能够查询包含一堆文件的目录 table。但如果目录中的文件具有不同的结构,查询将失败。我知道这不是很常见的用例查询目录,其中包含不同结构的文件,但是是否有任何内置函数或查询允许我在对目录进行任何实际查询之前检查目录中的所有文件是否具有相同的结构?
我知道我可以做简单的事情
select * from path.to.directory limit 1;
并捕获异常,但我正在搜索 Drill 内置函数。我在文档中搜索,但没有找到任何内容。
似乎没有用于在使用前检查数据存储的开箱即用功能。这对我来说并不奇怪。例如,如果您考虑关系数据库,则不会在每次执行 select.
时显式检查与数据库的连接或检查数据是否未损坏。但是,如果您真的需要这个,您可以考虑编写一个文件的临时检查代码或为此编写一个自定义钻取函数,如 here 所述。