尽管使用了 distinct,但在 sas 中获取重复值,如何删除它们?

Getting duplicate values in sas inspite of using distinct, how can I delete them?

PROGRAM(追加两张表存入后一张):

proc sql;
   create table tdstagng.aa as
   select distinct * from tdstagng.aa
   outer union corr
   select distinct * from WORK.DYNAMIC
   ORDER by Cdate;`
quit;

输出

此图像是代码的输出,Cdate 是获取当前日期的列。)程序的目标是构建历史数据以标记随时间的变化。

在 2018 年 10 月 15 日这个日期有重复的值,尽管整行都是相同的(而不是那个日期的 7 行,而是 14 行),我该如何摆脱这个?我用箭头标记了重复的行。

您选择了两个不同的集合,然后将它们连接起来,而不是仅仅合并它们。这就是导致重复行的原因。

您是否尝试删除 outer 关键字?这是使用 SASHELP.CLASS 数据的示例。

23   proc sql ;
24   create table test1 as
25   select * from sashelp.class where name like 'A%'
26   union corr
27   select * from sashelp.class where sex = 'F'
28   ;
NOTE: Table WORK.TEST1 created, with 10 rows and 5 columns.

29   create table test2 as
30   select * from sashelp.class where name like 'A%'
31   outer union corr
32   select * from sashelp.class where sex = 'F'
33   ;
NOTE: Table WORK.TEST2 created, with 11 rows and 5 columns.

或者进行子查询?

45
46   create table test3 as
47   select distinct * from
48   (
49   select * from sashelp.class where name like 'A%'
50   outer union corr
51   select * from sashelp.class where sex = 'F'
52   )
53   ;
NOTE: Table WORK.TEST3 created, with 10 rows and 5 columns.
proc sql;
   create table tdstagng.aa as
   select distinct * from tdstagng.aa
   union
   select distinct * from WORK.DYNAMIC
   ORDER by Cdate;
quit;

尝试移除外部和 CORR。

CDate 列中的日期格式是什么? 这可能是由于 DD/MM/YYYY HH:MM 格式——原始日期值中隐藏了时间;

如果是这种情况,您可以使用函数 datepart(CDate) 定义计算列——它只保留日期时间值之外的日期