使用 IN/INTERSECT、INNER JOIN 或 EXISTS 进行交叉查询?
Cross-query with IN/INTERSECT, INNER JOIN or EXISTS?
我正在使用 IMDb 数据来找出一些选定电影的完整工作人员信息。
我有一个叫做movie的table,我把符合我要求的电影隔离出来,总共476行,其中movie_id是每部电影的唯一标识符。
我有一个名为 crew_info 的 table,它有列 movie_id,person_id 和 role_id.
作为第一步,我想创建一个新的 table,只隔离那些参与过我的 电影 table 电影的人].我想要一个不同人物的列表,所以即使同一个人在 movie.
中的多部电影中工作,也不会重复
我想到了几种方法,不知道有没有difference/which更好的。首先,我创建了一个新的 table:
CREATE TABLE person
(
id INTEGER PRIMARY KEY AUTOINCREMENT,
person_id INTEGER,
person_name TEXT,
person_birth INTEGER
);
现在我想我需要执行以下操作之一:
INSERT INTO person (person_id)
SELECT DISTINCT person_id
FROM cast_info
WHERE movie_id IN
(
SELECT movie_id
FROM cast_info
INTERSECT
SELECT movie_id
FROM movie
);
或者
INSERT INTO person (person_id)
SELECT DISTINCT person_id
FROM cast_info
INNER JOIN movie
ON cast_info.movie_id=movie.movie_id;
或者
INSERT INTO person (person_id)
SELECT DISTINCT person_id
FROM cast_info
WHERE EXISTS
(
SELECT movie_id
FROM cast_info
WHERE cast_info.movie_id=movie.movie_id
);
稍后我打算用 person_name 和 person_birth 值更新 table使用类似的语句从其他相关 table 交叉查询。
这些表达式是否会产生相同的结果?如果不是,哪个效果最好?
您将从所有三个中获得相同的结果。我会推荐 INNER JOIN
,因为它最容易编写。性能的提高可能总是可以忽略不计,但查询 2 和查询 3 将需要少一次索引扫描。查询 1 将扫描 cast_info 两次。
要更新 table 之后,您可以这样做:
UPDATE P
SET P.Person_Name = T.Person_Name
FROM Person P
INNER JOIN OtherTable T on T.Person_ID = P.Person_ID
当然,运行 和 SELECT
总是好的,验证您的列,然后将前两行更改为更新并充满信心地启动。
SELECT P.Person_ID, P.Person_Name, T.Person_ID, T.Person_Name
FROM Person P
INNER JOIN OtherTable T on T.Person_ID = P.Person_ID
这个交叉点是多余的
WHERE movie_id IN
(
SELECT movie_id
FROM cast_info
INTERSECT
SELECT movie_id
FROM movie
);
我觉得join是最直接的
INSERT INTO person (person_id)
SELECT DISTINCT person_id
FROM cast_info
INNER JOIN movie
ON cast_info.movie_id=movie.movie_id;
为什么?
CREATE TABLE person
( id INTEGER PRIMARY KEY AUTOINCREMENT
只需使用 person_id 作为主键
并使用日期作为生日
我正在使用 IMDb 数据来找出一些选定电影的完整工作人员信息。
我有一个叫做movie的table,我把符合我要求的电影隔离出来,总共476行,其中movie_id是每部电影的唯一标识符。
我有一个名为 crew_info 的 table,它有列 movie_id,person_id 和 role_id.
作为第一步,我想创建一个新的 table,只隔离那些参与过我的 电影 table 电影的人].我想要一个不同人物的列表,所以即使同一个人在 movie.
中的多部电影中工作,也不会重复我想到了几种方法,不知道有没有difference/which更好的。首先,我创建了一个新的 table:
CREATE TABLE person
(
id INTEGER PRIMARY KEY AUTOINCREMENT,
person_id INTEGER,
person_name TEXT,
person_birth INTEGER
);
现在我想我需要执行以下操作之一:
INSERT INTO person (person_id)
SELECT DISTINCT person_id
FROM cast_info
WHERE movie_id IN
(
SELECT movie_id
FROM cast_info
INTERSECT
SELECT movie_id
FROM movie
);
或者
INSERT INTO person (person_id)
SELECT DISTINCT person_id
FROM cast_info
INNER JOIN movie
ON cast_info.movie_id=movie.movie_id;
或者
INSERT INTO person (person_id)
SELECT DISTINCT person_id
FROM cast_info
WHERE EXISTS
(
SELECT movie_id
FROM cast_info
WHERE cast_info.movie_id=movie.movie_id
);
稍后我打算用 person_name 和 person_birth 值更新 table使用类似的语句从其他相关 table 交叉查询。
这些表达式是否会产生相同的结果?如果不是,哪个效果最好?
您将从所有三个中获得相同的结果。我会推荐 INNER JOIN
,因为它最容易编写。性能的提高可能总是可以忽略不计,但查询 2 和查询 3 将需要少一次索引扫描。查询 1 将扫描 cast_info 两次。
要更新 table 之后,您可以这样做:
UPDATE P
SET P.Person_Name = T.Person_Name
FROM Person P
INNER JOIN OtherTable T on T.Person_ID = P.Person_ID
当然,运行 和 SELECT
总是好的,验证您的列,然后将前两行更改为更新并充满信心地启动。
SELECT P.Person_ID, P.Person_Name, T.Person_ID, T.Person_Name
FROM Person P
INNER JOIN OtherTable T on T.Person_ID = P.Person_ID
这个交叉点是多余的
WHERE movie_id IN
(
SELECT movie_id
FROM cast_info
INTERSECT
SELECT movie_id
FROM movie
);
我觉得join是最直接的
INSERT INTO person (person_id)
SELECT DISTINCT person_id
FROM cast_info
INNER JOIN movie
ON cast_info.movie_id=movie.movie_id;
为什么?
CREATE TABLE person
( id INTEGER PRIMARY KEY AUTOINCREMENT
只需使用 person_id 作为主键
并使用日期作为生日