我如何使用列名从数据框中访问数据

how do i access data from a dataframe using the column name

我有一个 oracle table,其中存储了 xml 数据(xml类型)。我正在尝试使用以下命令将其 sqoop 到 hdfs。 xml 字段在 hdfs 文件中显示为 null。

sqoop import --connect jdbc:oracle:thin:@DBconnString 
             --username uname --password pwd 
             --delete-target-dir 
             --table sample 
             --map-column-java column1=String

谁能指出我做错了什么?

这是sqoop的限制,不支持xmlType。

https://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html#_supported_data_types

这里有一个解决方法https://issues.apache.org/jira/browse/SQOOP-2749,它本质上是将您的 xmlType 转换为 clob,然后使用以下选项将其映射到字符串

--map-column-java "XMLRECORD=String"