table 上的 sqoop 增量导入,数据混乱且没有修改时间列
incremental import in sqoop on a table with jumbled data and no modified time column
假设我有一个 table 客户:
CustomerID CustomerName CustomerBill
7 John 100
2 Bill 500
4 Mark 200
这里 CustomerID 是主键,但记录没有特定的顺序。数据库中对应的table没有修改时间列。以前的条目也可以更改。如何对数据进行增量导入?
我使用的数据库是Sybase,导入Hive
Records are in no particular order.
append
模式无法使用
There is no modified time column in the corresponding table in the database.
lastmodified
模式无法使用
Sqoop 确实做任何特别的事情。它需要增加 ID 或更新时间戳来进行 SQL 查询以获取 ONLY inserted/updated 已记录。
假设我有一个 table 客户:
CustomerID CustomerName CustomerBill
7 John 100
2 Bill 500
4 Mark 200
这里 CustomerID 是主键,但记录没有特定的顺序。数据库中对应的table没有修改时间列。以前的条目也可以更改。如何对数据进行增量导入?
我使用的数据库是Sybase,导入Hive
Records are in no particular order.
append
模式无法使用
There is no modified time column in the corresponding table in the database.
lastmodified
模式无法使用
Sqoop 确实做任何特别的事情。它需要增加 ID 或更新时间戳来进行 SQL 查询以获取 ONLY inserted/updated 已记录。