在 sql 中检索 post 的 "likes" 的有效方法是什么?

What's the efficient way to retrieve "likes" of a post in sql?

所以我有两个 table,'videos' 和 'video_likes'。 'videos' table 看起来像这样:

id | creator | url        | likes
1  |  5      |https://... |  10
2  |  8      |https://... |  20
3  |  4      |https://... |  30
4  |  2      |https://... |  40

而 'video_likes' table 看起来像这样:

id | video_id | like_user_id
1  |  2       |   8
2  |  2       |   5
3  |  4       |   2

如您所见,两者都是基本的 table。好的,现在是有趣的部分。当用户 likes/dislikes a post,而不是从 'videos' table 递增和递减点赞数时,我只是将它们更新为与 post 中的行数相同=41=] table,像这样:

UPDATE videos SET likes = (SELECT COUNT(id) FROM video_likes WHERE video_id = '$video_id') WHERE id = '$video_id'

什么时候取号。喜欢的视频,我只是这样做:

SELECT likes FROM videos WHERE id = '$video_id' LIMIT 1

问题是每次用户喜欢或不喜欢视频时都会调用更新查询,我猜这可能非常昂贵。我有三个与此问题相关的问题:

1) 当 'video_likes' table 增长到一个很大的数字,比如一百万或十亿时,是否存在性能问题?

2) sql 在更新计数时是否锁定了 table?如果是,新插入(用户在更新进行时喜欢 post)会失败吗?如果是这样,如何防止这种情况?

3) 达到相同结果的最快最有效的方法是什么?我不想增加或减少 likes 字段,因为这只是一个非规范化,实际的 likes 计数可能会不一致。这样做的正确方法是什么?
这是这几天一直困扰我的几个问题。希望你能回答。问候。

我推荐

  • 不要重新计算;那只会变得越来越慢。
  • 在你 INSERT 点赞的同时增加计数器 table。
  • 当您忙到每 有数百次写入(插入、更新)时,将类似计数器拆分为并行 table(“垂直分区”)。这将有助于避免在增加单个视频喜欢计数时由于行锁(不是 table 锁)而导致的冲突,而不是对 table.
  • 的其他访问。
  • SELECT likes FROM videos WHERE id = '$video_id' LIMIT 1 没有意义 - videos table 中的视频是否不止一行?为什么?如果有,你想要哪一个(limit 1)?
  • 您是否也想要一个“不喜欢”计数器?或者你会简单地 'decrement'。想想看。
  • video_likes 不需要 id。相反,PRIMARY KEY(video_id, user_id)。这将使您可以防止用户反复增加计数。 (但是,这需要在进行增量之前进行检查。)
  • 等等

不喜欢

如果“不喜欢”不是一个功能,但“不喜欢”是,我建议“不喜欢”实现类似

START TRANSACTION;
DELETE FROM video_likes WHERE ...;
UPDATE videos SET like_ct = like_ct - 1 WHERE ...;
COMMIT;

这样,两个“喜欢”的机制就会保持完美同步。这在某种程度上是“喜欢”代码的镜像。

限制 1

想想 LIMIT 只是为了控制你得到多少输出。

  • 当只有一行时,LIMIT 1 不会改变查询所需的时间。
  • 当查询要排序(ORDER BY)来决定哪个是first/last/whatever时,那么它已经做了很多工作; LIMIT 只是减少了交付的行数。
  • 另一方面,当 INDEX 可用于 ORDER BY 时,排序可能会消失。因此 LIMIT 控制传递的行数。

AUTO_INCREMENT是否

  • 一个table必须有一个PRIMARY KEY.
  • 如果您没有明确指定 PK,则会为您生成一个。 (不建议。)
  • 一场自然而然发生的“自然”PK。例如,table 个国家/地区可以(应该)使用标准的 2 字母“国家/地区代码”——美国、法国、印度、俄罗斯、中国、瑞士、意大利等。
  • id INT UNSIGNED NOT NULL AUTO_INCREMENT 对于没有“自然”PK 的 table 很有用。或者自然PK是一长串。

在具有 4 字节 ID 和 2 字节国家代码的示例中,您需要两个索引:

PRIMARY KEY(id), INDEX(country_code)

对一个:

PRIMARY KEY(country_code)

而 table 和 id 更大。 (虽然在 这个 示例中还不够大,但真正重要。)

在“多对多”的情况下,例如您的 video_likesid 会影响性能。我讨论 here.