SpringBatch JpaPagingItemReader 排序顺序

Question

我使用的是 SpringBatch 版本 3.0.7、Hibernate 4.3.11 和 H2 数据库。使用 JpaPagingItemReader 时，JPQL 是否需要唯一的排序顺序？我发现 JdbcPagingItemReader 需要它（请参阅 BATCH-2465）。

在一个步骤中，我使用 JpaPagingItemReader 从数据库加载实体，然后将它们写入平面文件。我希望平面文件包含按 JPQL 指定的顺序排序的唯一实体。如果我将页面大小设置为较小的值（例如 1），然后提供一个 JPQL 语句来对具有非唯一键的实体进行排序，我会看到同一实体在输出文件中重复多次。如果我按唯一键排序，则没有 "duplicates"。如果我设置页面大小 >= 实体总数，那么只有 1 页，没有 "duplicates".

根据经验，JpaPagingItemReader 似乎需要 JPQL 具有唯一的排序键。

Answer 1

查看 JpaPagingItemReader 的实现，您会发现方法 doReadPage():

@Override
@SuppressWarnings("unchecked")
protected void doReadPage() {

    EntityTransaction tx = null;

    if (transacted) {
        tx = entityManager.getTransaction();
        tx.begin();

        entityManager.flush();
        entityManager.clear();
    }//end if

    Query query = createQuery().setFirstResult(getPage() * getPageSize()).setMaxResults(getPageSize());

    if (parameterValues != null) {
        for (Map.Entry<String, Object> me : parameterValues.entrySet()) {
            query.setParameter(me.getKey(), me.getValue());
        }
    }

    if (results == null) {
        results = new CopyOnWriteArrayList<T>();
    }
    else {
        results.clear();
    }

    if (!transacted) {
        List<T> queryResult = query.getResultList();
        for (T entity : queryResult) {
            entityManager.detach(entity);
            results.add(entity);
        }//end if
    } else {
        results.addAll(query.getResultList());
        tx.commit();
    }//end if
}

如您所见，对于读取的每个页面，都会为每个页面创建一个新查询。因此，必须确保您的查询 returns 始终 相同数量 的元素完全相同的顺序，因此，它需要 'unique sort key'。否则您将有重复项和缺失项（每个重复项都会有一个缺失项，因为总行数将相同）。

SpringBatch JpaPagingItemReader 排序顺序

SpringBatch JpaPagingItemReader SortOrder

spring-batch