在 sql 中检索 post 的 "likes" 的有效方法是什么?
What's the efficient way to retrieve "likes" of a post in sql?
所以我有两个 table,'videos' 和 'video_likes'。 'videos' table 看起来像这样:
id | creator | url | likes
1 | 5 |https://... | 10
2 | 8 |https://... | 20
3 | 4 |https://... | 30
4 | 2 |https://... | 40
而 'video_likes' table 看起来像这样:
id | video_id | like_user_id
1 | 2 | 8
2 | 2 | 5
3 | 4 | 2
如您所见,两者都是基本的 table。好的,现在是有趣的部分。当用户 likes/dislikes a post,而不是从 'videos' table 递增和递减点赞数时,我只是将它们更新为与 post 中的行数相同=41=] table,像这样:
UPDATE videos SET likes = (SELECT COUNT(id) FROM video_likes WHERE video_id = '$video_id') WHERE id = '$video_id'
什么时候取号。喜欢的视频,我只是这样做:
SELECT likes FROM videos WHERE id = '$video_id' LIMIT 1
问题是每次用户喜欢或不喜欢视频时都会调用更新查询,我猜这可能非常昂贵。我有三个与此问题相关的问题:
1) 当 'video_likes' table 增长到一个很大的数字,比如一百万或十亿时,是否存在性能问题?
2) sql 在更新计数时是否锁定了 table?如果是,新插入(用户在更新进行时喜欢 post)会失败吗?如果是这样,如何防止这种情况?
3) 达到相同结果的最快最有效的方法是什么?我不想增加或减少 likes 字段,因为这只是一个非规范化,实际的 likes 计数可能会不一致。这样做的正确方法是什么?
这是这几天一直困扰我的几个问题。希望你能回答。问候。
我推荐
- 不要重新计算;那只会变得越来越慢。
- 在你
INSERT
点赞的同时增加计数器 table。
- 当您忙到每 秒 有数百次写入(插入、更新)时,将类似计数器拆分为并行 table(“垂直分区”)。这将有助于避免在增加单个视频喜欢计数时由于行锁(不是 table 锁)而导致的冲突,而不是对 table.
的其他访问。
SELECT likes FROM videos WHERE id = '$video_id' LIMIT 1
没有意义 - videos
table 中的视频是否不止一行?为什么?如果有,你想要哪一个(limit 1
)?
- 您是否也想要一个“不喜欢”计数器?或者你会简单地 'decrement'。想想看。
video_likes
不需要 id
。相反,PRIMARY KEY(video_id, user_id)
。这将使您可以防止用户反复增加计数。 (但是,这需要在进行增量之前进行检查。)
- 等等
不喜欢
如果“不喜欢”不是一个功能,但“不喜欢”是,我建议“不喜欢”实现类似
START TRANSACTION;
DELETE FROM video_likes WHERE ...;
UPDATE videos SET like_ct = like_ct - 1 WHERE ...;
COMMIT;
这样,两个“喜欢”的机制就会保持完美同步。这在某种程度上是“喜欢”代码的镜像。
限制 1
想想 LIMIT
只是为了控制你得到多少输出。
- 当只有一行时,
LIMIT 1
不会改变查询所需的时间。
- 当查询要排序(
ORDER BY
)来决定哪个是first/last/whatever时,那么它已经做了很多工作; LIMIT
只是减少了交付的行数。
- 另一方面,当
INDEX
可用于 ORDER BY
时,排序可能会消失。因此 LIMIT
控制传递的行数。
AUTO_INCREMENT是否
- 一个table必须有一个
PRIMARY KEY
.
- 如果您没有明确指定 PK,则会为您生成一个。 (不建议。)
- 一场自然而然发生的“自然”PK。例如,table 个国家/地区可以(应该)使用标准的 2 字母“国家/地区代码”——美国、法国、印度、俄罗斯、中国、瑞士、意大利等。
id INT UNSIGNED NOT NULL AUTO_INCREMENT
对于没有“自然”PK 的 table 很有用。或者自然PK是一长串。
在具有 4 字节 ID 和 2 字节国家代码的示例中,您需要两个索引:
PRIMARY KEY(id), INDEX(country_code)
对一个:
PRIMARY KEY(country_code)
而 table 和 id
更大。 (虽然在 这个 示例中还不够大,但真正重要。)
在“多对多”的情况下,例如您的 video_likes
,id
会影响性能。我讨论 here.
所以我有两个 table,'videos' 和 'video_likes'。 'videos' table 看起来像这样:
id | creator | url | likes
1 | 5 |https://... | 10
2 | 8 |https://... | 20
3 | 4 |https://... | 30
4 | 2 |https://... | 40
而 'video_likes' table 看起来像这样:
id | video_id | like_user_id
1 | 2 | 8
2 | 2 | 5
3 | 4 | 2
如您所见,两者都是基本的 table。好的,现在是有趣的部分。当用户 likes/dislikes a post,而不是从 'videos' table 递增和递减点赞数时,我只是将它们更新为与 post 中的行数相同=41=] table,像这样:
UPDATE videos SET likes = (SELECT COUNT(id) FROM video_likes WHERE video_id = '$video_id') WHERE id = '$video_id'
什么时候取号。喜欢的视频,我只是这样做:
SELECT likes FROM videos WHERE id = '$video_id' LIMIT 1
问题是每次用户喜欢或不喜欢视频时都会调用更新查询,我猜这可能非常昂贵。我有三个与此问题相关的问题:
1) 当 'video_likes' table 增长到一个很大的数字,比如一百万或十亿时,是否存在性能问题?
2) sql 在更新计数时是否锁定了 table?如果是,新插入(用户在更新进行时喜欢 post)会失败吗?如果是这样,如何防止这种情况?
3) 达到相同结果的最快最有效的方法是什么?我不想增加或减少 likes 字段,因为这只是一个非规范化,实际的 likes 计数可能会不一致。这样做的正确方法是什么?
这是这几天一直困扰我的几个问题。希望你能回答。问候。
我推荐
- 不要重新计算;那只会变得越来越慢。
- 在你
INSERT
点赞的同时增加计数器 table。 - 当您忙到每 秒 有数百次写入(插入、更新)时,将类似计数器拆分为并行 table(“垂直分区”)。这将有助于避免在增加单个视频喜欢计数时由于行锁(不是 table 锁)而导致的冲突,而不是对 table. 的其他访问。
SELECT likes FROM videos WHERE id = '$video_id' LIMIT 1
没有意义 -videos
table 中的视频是否不止一行?为什么?如果有,你想要哪一个(limit 1
)?- 您是否也想要一个“不喜欢”计数器?或者你会简单地 'decrement'。想想看。
video_likes
不需要id
。相反,PRIMARY KEY(video_id, user_id)
。这将使您可以防止用户反复增加计数。 (但是,这需要在进行增量之前进行检查。)- 等等
不喜欢
如果“不喜欢”不是一个功能,但“不喜欢”是,我建议“不喜欢”实现类似
START TRANSACTION;
DELETE FROM video_likes WHERE ...;
UPDATE videos SET like_ct = like_ct - 1 WHERE ...;
COMMIT;
这样,两个“喜欢”的机制就会保持完美同步。这在某种程度上是“喜欢”代码的镜像。
限制 1
想想 LIMIT
只是为了控制你得到多少输出。
- 当只有一行时,
LIMIT 1
不会改变查询所需的时间。 - 当查询要排序(
ORDER BY
)来决定哪个是first/last/whatever时,那么它已经做了很多工作;LIMIT
只是减少了交付的行数。 - 另一方面,当
INDEX
可用于ORDER BY
时,排序可能会消失。因此LIMIT
控制传递的行数。
AUTO_INCREMENT是否
- 一个table必须有一个
PRIMARY KEY
. - 如果您没有明确指定 PK,则会为您生成一个。 (不建议。)
- 一场自然而然发生的“自然”PK。例如,table 个国家/地区可以(应该)使用标准的 2 字母“国家/地区代码”——美国、法国、印度、俄罗斯、中国、瑞士、意大利等。
id INT UNSIGNED NOT NULL AUTO_INCREMENT
对于没有“自然”PK 的 table 很有用。或者自然PK是一长串。
在具有 4 字节 ID 和 2 字节国家代码的示例中,您需要两个索引:
PRIMARY KEY(id), INDEX(country_code)
对一个:
PRIMARY KEY(country_code)
而 table 和 id
更大。 (虽然在 这个 示例中还不够大,但真正重要。)
在“多对多”的情况下,例如您的 video_likes
,id
会影响性能。我讨论 here.