尽管使用了 distinct,但在 sas 中获取重复值,如何删除它们?
Getting duplicate values in sas inspite of using distinct, how can I delete them?
PROGRAM(追加两张表存入后一张):
proc sql;
create table tdstagng.aa as
select distinct * from tdstagng.aa
outer union corr
select distinct * from WORK.DYNAMIC
ORDER by Cdate;`
quit;
输出
此图像是代码的输出,Cdate 是获取当前日期的列。)程序的目标是构建历史数据以标记随时间的变化。
在 2018 年 10 月 15 日这个日期有重复的值,尽管整行都是相同的(而不是那个日期的 7 行,而是 14 行),我该如何摆脱这个?我用箭头标记了重复的行。
您选择了两个不同的集合,然后将它们连接起来,而不是仅仅合并它们。这就是导致重复行的原因。
您是否尝试删除 outer
关键字?这是使用 SASHELP.CLASS 数据的示例。
23 proc sql ;
24 create table test1 as
25 select * from sashelp.class where name like 'A%'
26 union corr
27 select * from sashelp.class where sex = 'F'
28 ;
NOTE: Table WORK.TEST1 created, with 10 rows and 5 columns.
29 create table test2 as
30 select * from sashelp.class where name like 'A%'
31 outer union corr
32 select * from sashelp.class where sex = 'F'
33 ;
NOTE: Table WORK.TEST2 created, with 11 rows and 5 columns.
或者进行子查询?
45
46 create table test3 as
47 select distinct * from
48 (
49 select * from sashelp.class where name like 'A%'
50 outer union corr
51 select * from sashelp.class where sex = 'F'
52 )
53 ;
NOTE: Table WORK.TEST3 created, with 10 rows and 5 columns.
proc sql;
create table tdstagng.aa as
select distinct * from tdstagng.aa
union
select distinct * from WORK.DYNAMIC
ORDER by Cdate;
quit;
尝试移除外部和 CORR。
CDate 列中的日期格式是什么?
这可能是由于 DD/MM/YYYY HH:MM 格式——原始日期值中隐藏了时间;
如果是这种情况,您可以使用函数 datepart(CDate)
定义计算列——它只保留日期时间值之外的日期
proc sql;
create table tdstagng.aa as
select distinct * from tdstagng.aa
outer union corr
select distinct * from WORK.DYNAMIC
ORDER by Cdate;`
quit;
输出
此图像是代码的输出,Cdate 是获取当前日期的列。)程序的目标是构建历史数据以标记随时间的变化。
在 2018 年 10 月 15 日这个日期有重复的值,尽管整行都是相同的(而不是那个日期的 7 行,而是 14 行),我该如何摆脱这个?我用箭头标记了重复的行。
您选择了两个不同的集合,然后将它们连接起来,而不是仅仅合并它们。这就是导致重复行的原因。
您是否尝试删除 outer
关键字?这是使用 SASHELP.CLASS 数据的示例。
23 proc sql ;
24 create table test1 as
25 select * from sashelp.class where name like 'A%'
26 union corr
27 select * from sashelp.class where sex = 'F'
28 ;
NOTE: Table WORK.TEST1 created, with 10 rows and 5 columns.
29 create table test2 as
30 select * from sashelp.class where name like 'A%'
31 outer union corr
32 select * from sashelp.class where sex = 'F'
33 ;
NOTE: Table WORK.TEST2 created, with 11 rows and 5 columns.
或者进行子查询?
45
46 create table test3 as
47 select distinct * from
48 (
49 select * from sashelp.class where name like 'A%'
50 outer union corr
51 select * from sashelp.class where sex = 'F'
52 )
53 ;
NOTE: Table WORK.TEST3 created, with 10 rows and 5 columns.
proc sql;
create table tdstagng.aa as
select distinct * from tdstagng.aa
union
select distinct * from WORK.DYNAMIC
ORDER by Cdate;
quit;
尝试移除外部和 CORR。
CDate 列中的日期格式是什么? 这可能是由于 DD/MM/YYYY HH:MM 格式——原始日期值中隐藏了时间;
如果是这种情况,您可以使用函数 datepart(CDate)
定义计算列——它只保留日期时间值之外的日期