RDBM - 一对一 -> 检查条目是否存在并且 insert/update 或者总是删除并且只插入?
RDBM - one to one -> check if entry exists and insert/update OR always delete and only insert?
不幸的是,我不知道如何命名这个问题,所以如果你有更好的建议,请继续编辑它:-)
多年以来,我一直在使用这种方法来尝试 insert/update 一对一资源:执行 DELETE
以确保没有具有此类 PK 的行,然后执行 INSERT
而已。我一直认为这是性能和简单性的最佳案例。当谈到性能时,我指的是双方——数据库和应用程序层(即执行 DELETE
查询似乎比执行 SELECT
并检查结果更便宜,而且考虑到有数据双向转移)。
但当然还有其他方法,如 INSERT ... ON DUPLICATE KEY UPDATE ...
、IF EXISTS (SELECT ...) UPDATE ... ELSE INSERT...
或 UPDATE ... ;IF ROWCOUNT = 0 INSERT ...
(取决于底层 RDBMS),当然也可以在应用层执行相同的操作,即首先检查该条目是否存在,如果确实存在,则执行 UPDATE
,否则执行 INSERT
(或执行 UPDATE
并检查受影响的行数,如果为零,则执行 INSERT
[这带来了另一个复杂性,因为如果 UPDATE
不更改基础资源,它也会 return 为零,因为受影响的行数因此跟随 INSERT
将 return a 重复PK错误])...
我现在很好奇什么是最好的方法?最好的意思是,如果您考虑性能、最佳实践等...
使用 ON DUPLICATE KEY UPDATE
是唯一明智的做法;它更简单,意图也很明确——易于阅读。它也会表现得更好,因为不需要更改索引条目。
如果两个进程尝试同时更新同一个密钥,则使用 DELETE
然后 INSERT
容易受到竞争条件的影响,这将导致其中一个进程的唯一密钥违规。它也慢得多,因为不仅必须物理删除行并插入新行,还必须删除然后插入索引条目。
使用 IF EXISTS
也不是一个好的选择,因为您必须在存储过程中执行此操作,因此它被锁定到该调用选择并且不能移植到应用程序中。另外,它只是尝试复制 ON DUPLICATE KEY UPDATE
内置命令,因此它永远不会那么高效。
回应关于程序员性能的评论,即效率,恕我直言,这也非常重要。
如果你想避免重复参数,为方便起见添加一点重构:
void applyTwice(PreparedStatement stmt, int fromIndex, Object... values) {
for (int i = 0; i < values.length; i++) {
stmt.setObject(i + fromIndex, values[i]);
stmt.setObject(i + fromIndex + values.length, values[i]);
}
}
这样称呼:
applyTwice(stmt, 3, "foo", "bar", 99);
将有效地做到这一点:
stmt.setObject(3, "foo");
stmt.setObject(4, "bar");
stmt.setObject(5, 99);
stmt.setObject(6, "foo");
stmt.setObject(7, "bar");
stmt.setObject(8, 99);
fromIndex
参数允许在查询中不重复的非重复参数,例如 ID 等。
您还可以制作一个简单的方法,在多个索引上应用单个值:
void apply(PreparedStatement stmt, Object value, int... indexes) {
for (int i = 0; i < indexes.length; i++) {
stmt.setObject(indexes[i], value);
}
}
你会这样称呼:
apply(stmt, "foo", 3, 6);
不幸的是,我不知道如何命名这个问题,所以如果你有更好的建议,请继续编辑它:-)
多年以来,我一直在使用这种方法来尝试 insert/update 一对一资源:执行 DELETE
以确保没有具有此类 PK 的行,然后执行 INSERT
而已。我一直认为这是性能和简单性的最佳案例。当谈到性能时,我指的是双方——数据库和应用程序层(即执行 DELETE
查询似乎比执行 SELECT
并检查结果更便宜,而且考虑到有数据双向转移)。
但当然还有其他方法,如 INSERT ... ON DUPLICATE KEY UPDATE ...
、IF EXISTS (SELECT ...) UPDATE ... ELSE INSERT...
或 UPDATE ... ;IF ROWCOUNT = 0 INSERT ...
(取决于底层 RDBMS),当然也可以在应用层执行相同的操作,即首先检查该条目是否存在,如果确实存在,则执行 UPDATE
,否则执行 INSERT
(或执行 UPDATE
并检查受影响的行数,如果为零,则执行 INSERT
[这带来了另一个复杂性,因为如果 UPDATE
不更改基础资源,它也会 return 为零,因为受影响的行数因此跟随 INSERT
将 return a 重复PK错误])...
我现在很好奇什么是最好的方法?最好的意思是,如果您考虑性能、最佳实践等...
使用 ON DUPLICATE KEY UPDATE
是唯一明智的做法;它更简单,意图也很明确——易于阅读。它也会表现得更好,因为不需要更改索引条目。
如果两个进程尝试同时更新同一个密钥,则使用 DELETE
然后 INSERT
容易受到竞争条件的影响,这将导致其中一个进程的唯一密钥违规。它也慢得多,因为不仅必须物理删除行并插入新行,还必须删除然后插入索引条目。
使用 IF EXISTS
也不是一个好的选择,因为您必须在存储过程中执行此操作,因此它被锁定到该调用选择并且不能移植到应用程序中。另外,它只是尝试复制 ON DUPLICATE KEY UPDATE
内置命令,因此它永远不会那么高效。
回应关于程序员性能的评论,即效率,恕我直言,这也非常重要。
如果你想避免重复参数,为方便起见添加一点重构:
void applyTwice(PreparedStatement stmt, int fromIndex, Object... values) {
for (int i = 0; i < values.length; i++) {
stmt.setObject(i + fromIndex, values[i]);
stmt.setObject(i + fromIndex + values.length, values[i]);
}
}
这样称呼:
applyTwice(stmt, 3, "foo", "bar", 99);
将有效地做到这一点:
stmt.setObject(3, "foo");
stmt.setObject(4, "bar");
stmt.setObject(5, 99);
stmt.setObject(6, "foo");
stmt.setObject(7, "bar");
stmt.setObject(8, 99);
fromIndex
参数允许在查询中不重复的非重复参数,例如 ID 等。
您还可以制作一个简单的方法,在多个索引上应用单个值:
void apply(PreparedStatement stmt, Object value, int... indexes) {
for (int i = 0; i < indexes.length; i++) {
stmt.setObject(indexes[i], value);
}
}
你会这样称呼:
apply(stmt, "foo", 3, 6);