MySQL高效数据结table查询
MySQL efficient data to junction table query
问题:
我想将类别链接从 table companies_1 移动到 company_categories table。 company_idcompany_categoriestable中的company_id需要等于id 的 companies_2 table。 companies_1 和 companies_2 table 的记录由“名称”-列。
- 下面的代码折腾了我一个晚上,还没写完!我想学习提高效率并加快这一进程。我觉得有很多需要优化的地方,因为有很多公司记录。
- 另一个问题是我发现无法在循环时检查查询的位置(导致无法检查进度)。因为进展花了很长时间,所以我终止了查询,我正在寻找更好的方法来解决这个问题。
信息:
table 有这样的公司:
----------------------------------------
| companies_1 |
----------------------------------------
| id | category_id | name |
----------------------------------------
| 1 | 1 | example-1 |
| 2 | 2 | example-1 |
| 3 | 1 | example-2 |
| 4 | 2 | example-2 |
| 5 | 3 | example-2 |
| 6 | 1 | example-3 |
----------------------------------------
A table 具有不同的公司名称:
-------------------------
| companies_2 |
-------------------------
| id | name |
-------------------------
| 1 | example-1 |
| 2 | example-2 |
| 3 | example-3 |
-------------------------
一个类别table,比如:
-------------------------
| categories |
-------------------------
| id | name |
-------------------------
还有一个路口table,比如:
---------------------------------
| company_categories |
---------------------------------
| company_id | category_id |
---------------------------------
当前代码:
此代码有效,但效率不高。
DELIMITER $$
DROP PROCEDURE IF EXISTS fill_junc_table$$
CREATE PROCEDURE fill_junc_table()
BEGIN
DECLARE r INT;
DECLARE i INT;
DECLARE i2 INT;
DECLARE loop_length INT;
DECLARE company_old_len INT;
DECLARE _href VARCHAR(255);
DECLARE cat_id INT;
DECLARE comp_id INT;
SET r = 0;
SET i = 0;
SET company_old_len = 0;
SELECT COUNT(*) INTO loop_length FROM companies;
WHILE i < loop_length DO
SELECT href INTO _href FROM company_old LIMIT i,1;
SELECT id INTO comp_id FROM companies WHERE site_href=_href;
SELECT COUNT(*) INTO company_old_len FROM company_old WHERE href=_href;
SET i2 = 0;
WHILE i2 < company_old_len DO
SELECT category_id INTO cat_id FROM company_old WHERE href=_href LIMIT i2,1;
INSERT INTO company_categories (company_id, category_id) VALUES (comp_id, cat_id);
SET r = r + 1;
SET i2 = i2 + 1;
END WHILE;
SET i = i + 1;
END WHILE;
SELECT r;
END$$
DELIMITER ;
CALL fill_junc_table();
编辑(新想法):
我将测试另一种解决此问题的方法,方法是完全复制 companies_1 table 和以下列(company_id 复制时为空):
---------------------------------------------
| company_id | category_id | name |
---------------------------------------------
然后,我将遍历 companies_2 table 以填写与名称列相关的正确 company_id。
希望您能就此发表您的看法。当我完成测试后,我会把结果留在这里给其他人。
澄清一下,我在 company_categories
中没有看到任何 PIVOT
转换。我看到的是您想要一个 JUNCTION TABLE,因为 companies
和 categories
表似乎有 many-to-many
关系。
在您的情况下,您有 company
,其中有 多个 categories
。你也有 categories
分配给 multiple companies
.
现在根据您的要求:
I want to move the links of the categories from the table companies_1
into the company_categories table. The company_id in the
company_categories table need to be equal to the id of the companies_2
table. The records of the companies_1 and the companies_2 table are
linked by the "name"-column.
我收到了这个查询:
INSERT INTO company_categories (company_id, category_id)
SELECT C2.id
, C1.category_id
FROM companies_1 C1
INNER JOIN companies_2 C2 ON C2.name = C1.name
如果可行,请告诉我。您创建的嵌套循环确实需要一段时间。
正如@DanielE 指出的那样,此查询将在 company_categories
为空的假设下工作。否则我们将需要使用 UPDATE
。
为什么不直接更新 companies_1?
ALTER TABLE companies_1 ADD (company_id INT)
UPDATE companies_1 SET company_id = (SELECT id FROM companies_2 WHERE name=companies_1.name)
ALTER TABLE companies_1 DROP name, RENAME TO company_categories
SELECT * FROM `company_categories`
输出
id category_id company_id
1 1 1
2 2 1
3 1 2
4 2 2
5 3 2
6 1 3
问题:
我想将类别链接从 table companies_1 移动到 company_categories table。 company_idcompany_categoriestable中的company_id需要等于id 的 companies_2 table。 companies_1 和 companies_2 table 的记录由“名称”-列。
- 下面的代码折腾了我一个晚上,还没写完!我想学习提高效率并加快这一进程。我觉得有很多需要优化的地方,因为有很多公司记录。
- 另一个问题是我发现无法在循环时检查查询的位置(导致无法检查进度)。因为进展花了很长时间,所以我终止了查询,我正在寻找更好的方法来解决这个问题。
信息:
table 有这样的公司:
----------------------------------------
| companies_1 |
----------------------------------------
| id | category_id | name |
----------------------------------------
| 1 | 1 | example-1 |
| 2 | 2 | example-1 |
| 3 | 1 | example-2 |
| 4 | 2 | example-2 |
| 5 | 3 | example-2 |
| 6 | 1 | example-3 |
----------------------------------------
A table 具有不同的公司名称:
-------------------------
| companies_2 |
-------------------------
| id | name |
-------------------------
| 1 | example-1 |
| 2 | example-2 |
| 3 | example-3 |
-------------------------
一个类别table,比如:
-------------------------
| categories |
-------------------------
| id | name |
-------------------------
还有一个路口table,比如:
---------------------------------
| company_categories |
---------------------------------
| company_id | category_id |
---------------------------------
当前代码:
此代码有效,但效率不高。
DELIMITER $$
DROP PROCEDURE IF EXISTS fill_junc_table$$
CREATE PROCEDURE fill_junc_table()
BEGIN
DECLARE r INT;
DECLARE i INT;
DECLARE i2 INT;
DECLARE loop_length INT;
DECLARE company_old_len INT;
DECLARE _href VARCHAR(255);
DECLARE cat_id INT;
DECLARE comp_id INT;
SET r = 0;
SET i = 0;
SET company_old_len = 0;
SELECT COUNT(*) INTO loop_length FROM companies;
WHILE i < loop_length DO
SELECT href INTO _href FROM company_old LIMIT i,1;
SELECT id INTO comp_id FROM companies WHERE site_href=_href;
SELECT COUNT(*) INTO company_old_len FROM company_old WHERE href=_href;
SET i2 = 0;
WHILE i2 < company_old_len DO
SELECT category_id INTO cat_id FROM company_old WHERE href=_href LIMIT i2,1;
INSERT INTO company_categories (company_id, category_id) VALUES (comp_id, cat_id);
SET r = r + 1;
SET i2 = i2 + 1;
END WHILE;
SET i = i + 1;
END WHILE;
SELECT r;
END$$
DELIMITER ;
CALL fill_junc_table();
编辑(新想法):
我将测试另一种解决此问题的方法,方法是完全复制 companies_1 table 和以下列(company_id 复制时为空):
---------------------------------------------
| company_id | category_id | name |
---------------------------------------------
然后,我将遍历 companies_2 table 以填写与名称列相关的正确 company_id。
希望您能就此发表您的看法。当我完成测试后,我会把结果留在这里给其他人。
澄清一下,我在 company_categories
中没有看到任何 PIVOT
转换。我看到的是您想要一个 JUNCTION TABLE,因为 companies
和 categories
表似乎有 many-to-many
关系。
在您的情况下,您有 company
,其中有 多个 categories
。你也有 categories
分配给 multiple companies
.
现在根据您的要求:
I want to move the links of the categories from the table companies_1 into the company_categories table. The company_id in the company_categories table need to be equal to the id of the companies_2 table. The records of the companies_1 and the companies_2 table are linked by the "name"-column.
我收到了这个查询:
INSERT INTO company_categories (company_id, category_id)
SELECT C2.id
, C1.category_id
FROM companies_1 C1
INNER JOIN companies_2 C2 ON C2.name = C1.name
如果可行,请告诉我。您创建的嵌套循环确实需要一段时间。
正如@DanielE 指出的那样,此查询将在 company_categories
为空的假设下工作。否则我们将需要使用 UPDATE
。
为什么不直接更新 companies_1?
ALTER TABLE companies_1 ADD (company_id INT)
UPDATE companies_1 SET company_id = (SELECT id FROM companies_2 WHERE name=companies_1.name)
ALTER TABLE companies_1 DROP name, RENAME TO company_categories
SELECT * FROM `company_categories`
输出
id category_id company_id
1 1 1
2 2 1
3 1 2
4 2 2
5 3 2
6 1 3