双向变得比单向慢得多

Bi-direction becomes much slower than uni-direction

在一个 Java/Hibernate 应用程序中,我有两个 类 CatKitten 的双向关系,如下所示:

public class Cat {
  ...
  @OneToMany(mappedBy="cat", fetch = FetchType.LAZY)
  @OnDelete(action = OnDeleteAction.CASCADE)
  @LazyCollection(LazyCollectionOption.EXTRA)
  @Getter
  @Setter
  private List<Kitten> kittens = new LinkedList();
  public void addKitten(Kitten k) {
    kittens.add(k);
  }
  ...
}  

public class Kitten {
  ...   
  @ManyToOne(fetch=FetchType.LAZY)
  @Getter
  @Setter
  private Cat cat;
  ...
}

在一个巨大的 for 循环中,20000 Kitten 被添加到先前创建的不同 Cat 实体中。 for 循环中的重要代码如下所示:

....
Kitten k = new Kitten();
k.setAttribut("foo");
k.setCat(currentCat);     // (a) line
currentCat.addKitten(k);  // (b) line
daoFactory.getKittenDao().save(k);
...

代码运行正常,但不知何故性能很慢。在之前的迭代(单向)中,应用程序要快得多。由于最终版本应该在 1000000 Kitten 上工作,因此必须有改进的方法。如果我对上面代码的时间进行基准测试,大约需要 40 秒。如果我通过删除行 (a) 或 (b) 来模拟单向,在这两种情况下都需要 10 秒(但如果我访问对象,稍后会崩溃)。

所以我的问题是: 我错过了什么,或者在 Hibernate 中双向关系的内部维护非常慢?由于模拟单向速度要快得多,我预计双向运行时间约为 15 秒。

更新:

保存实体的代码在 SAX-Parser DefaultHandler 实现中。因此,在解析 XML 结构时,首先将 Cat 保存在 startElement() 函数中,然后 Kitten 将保存在另一个 startElement() 调用中。 关于@Bartun 的 suggestions/questions:我查看了批处理。问题是,通过使用 DAO 和 startElement() 函数,很难判断何时保存了 50 个实体来刷新会话。不过,计数器可以解决问题。但是,它没有通过建立双向来解释性能影响。 由于事务管理 Spring @Transactional 用于启动 XML 解析的函数。

您在哪里进行交易?确保您使用的是一笔交易

你还应该对这样的数量使用批处理查询

有关批处理的更多信息https://vladmihalcea.com/how-to-batch-insert-and-update-statements-with-hibernate/

您还可以使用休眠静态检查刷新计数和其他内容 https://www.thoughts-on-java.org/how-to-activate-hibernate-statistics-to-analyze-performance-issues/

当你处理如此多的插件时,你需要完全控制 flushes/batching

我已将处理时间减少到我可以接受的值。它并没有真正解决我的问题,但大大减少了时间。如果其他人有同样的问题,这里是当前代码和简短的解释。

public class Cat {
  ...
  @OneToMany(mappedBy="cat", fetch = FetchType.LAZY)
  @OnDelete(action = OnDeleteAction.CASCADE)
  @LazyCollection(LazyCollectionOption.EXTRA)
  @Getter
  @Setter
  private Set<Kitten> kittens = new HashSet();
  public void addKitten(Kitten k) {
     k.setCat(this);
     if (Hibernate.isInitialized(kittens)) kittens.add(k); //line X
  }
  ...
}  

public class Kitten {
  ...   
  @ManyToOne(fetch=FetchType.LAZY)
  @OnDelete(action = OnDeleteAction.CASCADE)
  @Getter
  @Setter
  private Cat cat;
  ...
}
  • 最重要的是line X。在原始代码中,每次添加一只小猫时,都会从数据库中加载整个小猫列表。正如我发现 ,如果列表尚未初始化,则不能添加小猫。我知道,这必须小心完成,因为在列表首次初始化之前,每只小猫都必须保存在数据库中。否则一切都会不同步。
  • 上面的代码中没有说明,我更改了小猫持久性的结构以启用批量插入(Thx Bartun 提供链接)。现在,所有小猫都在解析过程结束时使用批处理保存,而不是单独保存每只小猫。
  • 还有一个小改进是从 List 更改为 Set,以便稍后在代码中启用多个 fetch joins