从内部 table 中提取唯一值

Extracting unique values from an internal table

从内部 table 的一列或多列中提取唯一值的最有效方法是什么?

在 ABAP 7.40 的 SP08 版本之前,从内部 table 或 itab 中提取唯一值的最有效方法如下:

LOOP AT lt_itab ASSIGNING <ls_itab>.
    APPEND <ls_itab>-value TO lt_values.
ENDLOOP.
SORT lt_values.
DELETE ADJACENT DUPLICATES FROM lt_values.

在将给定 <ls_itab>-value 添加到内部 table 之前检查其是否存在是保证唯一性的另一种方法,但在插入到标准 table。对于排序或散列目标 tables,使用:

LOOP AT lt_itab ASSIGNING <ls_itab>.
    READ TABLE lt_sorted_values WITH KEY table_line = <ls_itab>-value BINARY SEARCH.
    IF sy-subrc <> 0.
        APPEND <ls_itab>-value TO lt_sorted_values.
    ENDIF.
ENDLOOP.

请注意,使用第一种方法但将值插入虚拟 table 后跟 APPEND LINES OF lt_dummy INTO lt_sorted_values 可能 更快,但中间 tables 可以混淆。


自 ABAP 7.40 Support Package 08 however, the GROUP BY 起,循环提供了一种提取唯一值的更好方法。顾名思义,这些功能类似于 SQL 的 GROUP BY。例如,以下代码将从内部 table:

中提取唯一的项目编号
LOOP AT lt_project_data ASSIGNING FIELD-SYMBOL(<ls_grp_proj>)
    GROUP BY ( project = <ls_grp_proj>-proj_number ) ASCENDING
    WITHOUT MEMBERS
    ASSIGNING FIELD-SYMBOL(<ls_grp_unique_proj>).
        APPEND <ls_grp_unique_proj>-project TO lt_unique_projects.
ENDLOOP.

可以扩展相同的逻辑来检索唯一对,例如 EKPO table、EBELN("Purchasing Document"、po_nr) 和 EBELP ("Item Number of Purchasing Document", po_item):

LOOP AT lt_purchasing_document_items ASSIGNING FIELD-SYMBOL(<ls_grp_po>)
    GROUP BY ( number = <ls_grp_po>-po_nr
               item   = <ls_grp_po>-po_item ) ASCENDING
    WITHOUT MEMBERS
    ASSIGNING FIELD-SYMBOL(<ls_grp_po_item>).
        APPEND VALUE #( ebeln = <ls_grp_po_item>-number
                        ebelp = <ls_grp_po_item>-item ) TO lt_unique_po_items.
ENDLOOP.

根据新 ABAP 7.40 版本的 SAP 设计师之一 Horst Keller 的说法,the performance of GROUP BY loops is likely to be the same 作为这些 LOOP 的手动实现。取决于如何(不)有效地实现这种自定义循环,它甚至可能更快。请注意,对于 GROUP BY 循环不可用的系统,这些方法比上面给出的两种方法更快。


请注意,在大多数情况下,查询数据库到 return DISTINCT 值会快得多 并且性能方面这样做会破坏任何 ABAP 代码在 HANA 系统上使用内部 tables,尤其是

这个怎么样?

lt_unique[] = lt_itab[].
SORT lt_unique[] BY field1 field2 field3...
DELETE ADJACENT DUPLICATES FROM lt_values COMPARING field1 field2 field3...

如果您有 7.40 SP08 或更高版本,您可以简单地使用内联语法来填充目标 table(不需要 LOOP GROUP BY):

DATA: it_unique TYPE STANDARD TABLE OF fieldtype.
it_unique = VALUE #(
  FOR GROUPS value OF <line> IN it_itab
  GROUP BY <line>-field WITHOUT MEMBERS ( value ) ).

这适用于任何类型的目标 table。


对于 旧版本 使用:

DATA: it_unique TYPE HASHED TABLE OF fieldtype WITH UNIQUE KEY table_line.
LOOP AT it_itab ASSIGNING <line>.
  INSERT <line>-field INTO TABLE lt_unique.
ENDLOOP.

以上也适用于已排序的 tables。虽然我不建议为此目的使用排序的 tables,除非你真的确定结果中只有几行。

INSERT 的非零值 sy-subrc 直接忽略。无需进行两次密钥查找(一次用于检查存在,一次用于插入)。


如果目标必须是 STANDARD TABLE 并且您有一个 旧的 ABAP 堆栈 您也可以使用

DATA: it_unique TYPE STANDARD TABLE OF fieldtype.
LOOP AT it_itab ASSIGNING <line>.
  READ TABLE lt_unique WITH TABLE KEY table_line = <line>-field
    TRANSPORTING NO FIELDS BINARY SEARCH.
  INSERT <line>-field INTO lt_unique INDEX sy-tabix.
ENDLOOP.

这提供了与排序 table 相同的行为,但使用标准 table。 这是否比 SORT / DELETE ADJACENT DUPLICATES 更有效取决于 itab 中重复条目的数量。存在的重复条目越多,上述解决方案就会越快,因为它避免了不必要的附加到目标 table。但另一方面,追加比插入快。