使用 NEWID() 而不会丢失 distinct？

Question

我正在尝试从（设计糟糕的）sql 数据库中创建新的数据提取。客户要求我添加一个 distinctidentifier，我正尝试使用 NEWID() 函数来执行此操作。不幸的是，这会导致返回多个重复记录。

经过一些研究，我发现 NEWID() 函数确实 'undo' 使用了 distinct 关键字，但我不知道为什么或如何克服这个问题。

我尝试编写的查询示例如下：

select distinct

    NEWID() as UUID
    ,Histo_Results_File.ISRN
    ,Histo_Results_File.Internal_Patient_No
    ,Histo_Results_File.Date_of_Birth
    ,Histo_Result_freetext.histo_report
    ,Histo_Report.Date_Report_Updated  as [Investigation_Result_Date]

from apex.Histo_Results_File
            inner join apex.Histo_Report on (Histo_Report.Histo_Results_File = Histo_Results_File.ID)

如果我错过 select 块中的 NEWID() 行，我会返回 569 条记录，这是正确的，但如果我包含该行，那么我会得到超过 30,000 条记录，这些都是重复的原始 569，但具有不同的 ID。谁能提出解决此问题的方法？

提前致谢

Answer 1

您可以使用子查询来解决这个问题，例如.....

SELECT NEWID() as UUID
      ,*
FROM (
select distinct
     Histo_Results_File.ISRN
    ,Histo_Results_File.Internal_Patient_No
    ,Histo_Results_File.Date_of_Birth
    ,Histo_Result_freetext.histo_report
    ,Histo_Report.Date_Report_Updated  as [Investigation_Result_Date]

from apex.Histo_Results_File
            inner join apex.Histo_Report 
 on (Histo_Report.Histo_Results_File = Histo_Results_File.ID)
 ) t

Answer 2

使用子查询是最简单的方法。

SELECT NEWID() as UUID
, * -- this is everything from below
FROM (
select distinct
     Histo_Results_File.ISRN
    ,Histo_Results_File.Internal_Patient_No
    ,Histo_Results_File.Date_of_Birth
    ,Histo_Result_freetext.histo_report
    ,Histo_Report.Date_Report_Updated  as [Investigation_Result_Date]

from apex.Histo_Results_File
            inner join apex.Histo_Report on (Histo_Report.Histo_Results_File = Histo_Results_File.ID)) as mySub

Answer 3

select NEWID() as UUID
    ,ISRN
    ,Internal_Patient_No
    ,Date_of_Birth
    ,histo_report
    ,Investigation_Result_Date
from (
select distinct
    ,Histo_Results_File.ISRN
    ,Histo_Results_File.Internal_Patient_No
    ,Histo_Results_File.Date_of_Birth
    ,Histo_Result_freetext.histo_report
    ,Histo_Report.Date_Report_Updated  as [Investigation_Result_Date]

from apex.Histo_Results_File
            inner join apex.Histo_Report on (Histo_Report.Histo_Results_File = Histo_Results_File.ID)) t

使用 NEWID() 而不会丢失 distinct？

Use NEWID() without losing distinct?

distinct

newid

sql-server-2008