在 sql 中检索 post 的 "likes" 的有效方法是什么？

Question

所以我有两个 table，'videos' 和 'video_likes'。 'videos' table 看起来像这样：

id | creator | url        | likes
1  |  5      |https://... |  10
2  |  8      |https://... |  20
3  |  4      |https://... |  30
4  |  2      |https://... |  40

而 'video_likes' table 看起来像这样：

id | video_id | like_user_id
1  |  2       |   8
2  |  2       |   5
3  |  4       |   2

如您所见，两者都是基本的 table。好的，现在是有趣的部分。当用户 likes/dislikes a post，而不是从 'videos' table 递增和递减点赞数时，我只是将它们更新为与 post 中的行数相同=41=] table，像这样：

UPDATE videos SET likes = (SELECT COUNT(id) FROM video_likes WHERE video_id = '$video_id') WHERE id = '$video_id'

什么时候取号。喜欢的视频，我只是这样做：

SELECT likes FROM videos WHERE id = '$video_id' LIMIT 1

问题是每次用户喜欢或不喜欢视频时都会调用更新查询，我猜这可能非常昂贵。我有三个与此问题相关的问题：

1) 当 'video_likes' table 增长到一个很大的数字，比如一百万或十亿时，是否存在性能问题？

2) sql 在更新计数时是否锁定了 table？如果是，新插入（用户在更新进行时喜欢 post）会失败吗？如果是这样，如何防止这种情况？

3) 达到相同结果的最快最有效的方法是什么？我不想增加或减少 likes 字段，因为这只是一个非规范化，实际的 likes 计数可能会不一致。这样做的正确方法是什么？
这是这几天一直困扰我的几个问题。希望你能回答。问候。

Answer 1

我推荐

不要重新计算；那只会变得越来越慢。
在你 INSERT 点赞的同时增加计数器 table。
当您忙到每秒有数百次写入（插入、更新）时，将类似计数器拆分为并行 table（“垂直分区”）。这将有助于避免在增加单个视频喜欢计数时由于行锁（不是 table 锁）而导致的冲突，而不是对 table.
SELECT likes FROM videos WHERE id = '$video_id' LIMIT 1 没有意义 - videos table 中的视频是否不止一行？为什么？如果有，你想要哪一个(limit 1)？
您是否也想要一个“不喜欢”计数器？或者你会简单地 'decrement'。想想看。
video_likes 不需要 id。相反，PRIMARY KEY(video_id, user_id)。这将使您可以防止用户反复增加计数。（但是，这需要在进行增量之前进行检查。）
等等

不喜欢

如果“不喜欢”不是一个功能，但“不喜欢”是，我建议“不喜欢”实现类似

START TRANSACTION;
DELETE FROM video_likes WHERE ...;
UPDATE videos SET like_ct = like_ct - 1 WHERE ...;
COMMIT;

这样，两个“喜欢”的机制就会保持完美同步。这在某种程度上是“喜欢”代码的镜像。

限制 1

想想 LIMIT 只是为了控制你得到多少输出。

当只有一行时，LIMIT 1 不会改变查询所需的时间。
当查询要排序（ORDER BY）来决定哪个是first/last/whatever时，那么它已经做了很多工作； LIMIT 只是减少了交付的行数。
另一方面，当 INDEX 可用于 ORDER BY 时，排序可能会消失。因此 LIMIT 控制传递的行数。

AUTO_INCREMENT是否

一个table必须有一个PRIMARY KEY.
如果您没有明确指定 PK，则会为您生成一个。（不建议。）
一场自然而然发生的“自然”PK。例如，table 个国家/地区可以（应该）使用标准的 2 字母“国家/地区代码”——美国、法国、印度、俄罗斯、中国、瑞士、意大利等。
id INT UNSIGNED NOT NULL AUTO_INCREMENT 对于没有“自然”PK 的 table 很有用。或者自然PK是一长串。

在具有 4 字节 ID 和 2 字节国家代码的示例中，您需要两个索引：

PRIMARY KEY(id), INDEX(country_code)

对一个：

PRIMARY KEY(country_code)

而 table 和 id 更大。（虽然在这个示例中还不够大，但真正重要。）

在“多对多”的情况下，例如您的 video_likes，id 会影响性能。我讨论 here.

在 sql 中检索 post 的 "likes" 的有效方法是什么？

What's the efficient way to retrieve "likes" of a post in sql?

mysql

query-optimization

database-performance