为什么当记录数量增加时我的查询变得太慢
Why my query become too slow when number of records increased
我在 SQL 服务器中有一个插入语句。
我尝试了一个较小的子集,速度很快
将数量增加到 100 万条记录,速度快 1 分 10 秒
现在我把它加倍了,它似乎卡住了它已经 运行 10 分钟了,但没有结果
我在 5 分钟时包含了计划。
https://www.brentozar.com/pastetheplan/?id=r15MPuC5u
也许有人可以告诉我如何改进流程。
PS。我在标签 (RepID) 上添加了非聚集索引。
Tag(iiD) 是主键
Reps(RepID) 是主键。
在我写这篇文章的时候。该过程在 11:47
结束
https://www.brentozar.com/pastetheplan/?id=HJd9uOCcu
这是我的代码
insert into R3..Tags (iID,DT,RepID,Tag,xmiID,iBegin,iEnd,Confidence,Polarity,Uncertainty,Conditional,Generic,HistoryOf,CodingScheme,Code,CUI,TUI,PreferredText,ValueBegin,ValueEnd,Value,Deleted,sKey,RepType)
SELECT T.iID,T.DT,T.RepID,T.Tag,T.xmiID,T.iBegin,T.iEnd,T.Confidence,T.Polarity,T.Uncertainty,T.Conditional,T.Generic,T.HistoryOf,T.CodingScheme,T.Code,T.CUI,T.TUI,T.PreferredText,T.ValueBegin,T.ValueEnd,T.Value,T.Deleted,T.sKey,R.RepType
FROM Recovery..tags T inner join Recovery..Reps R on T.RepID = R.RepID
where T.iID between 2000001 and 4000000
(评论里放不下,放在这里)
我认为,您几乎无能为力,这取决于您的硬件,11 分钟实际上还不错,在执行计划中,我可以看到一切正常。
但据您所知,该插入语句的瓶颈是从 T"Recovery..tags" table 读取数据,这占用了您 07 分钟的查询时间。(它使用了完整扫描,没问题考虑到它需要读取 200 万行和 return 很多列)
所以你唯一能做的就是找到一种方法来加快从链接服务器“恢复”中读取的速度。
链接服务器通常是性能不佳的根源,特别是巨大的数据,这可能是由于网络不佳或网络繁忙等...
无论如何,一种解决方案是:
- 将数据从链接服务器拉到 table 到 R3 服务器(直接),服务器在 middle.which 取决于你的场景你可以
- 更改您的查询以反对 table
这可以显着缩短您的查询时间
我在 SQL 服务器中有一个插入语句。
我尝试了一个较小的子集,速度很快
将数量增加到 100 万条记录,速度快 1 分 10 秒
现在我把它加倍了,它似乎卡住了它已经 运行 10 分钟了,但没有结果
我在 5 分钟时包含了计划。
https://www.brentozar.com/pastetheplan/?id=r15MPuC5u
也许有人可以告诉我如何改进流程。
PS。我在标签 (RepID) 上添加了非聚集索引。
Tag(iiD) 是主键
Reps(RepID) 是主键。
在我写这篇文章的时候。该过程在 11:47
结束https://www.brentozar.com/pastetheplan/?id=HJd9uOCcu
这是我的代码
insert into R3..Tags (iID,DT,RepID,Tag,xmiID,iBegin,iEnd,Confidence,Polarity,Uncertainty,Conditional,Generic,HistoryOf,CodingScheme,Code,CUI,TUI,PreferredText,ValueBegin,ValueEnd,Value,Deleted,sKey,RepType)
SELECT T.iID,T.DT,T.RepID,T.Tag,T.xmiID,T.iBegin,T.iEnd,T.Confidence,T.Polarity,T.Uncertainty,T.Conditional,T.Generic,T.HistoryOf,T.CodingScheme,T.Code,T.CUI,T.TUI,T.PreferredText,T.ValueBegin,T.ValueEnd,T.Value,T.Deleted,T.sKey,R.RepType
FROM Recovery..tags T inner join Recovery..Reps R on T.RepID = R.RepID
where T.iID between 2000001 and 4000000
(评论里放不下,放在这里)
我认为,您几乎无能为力,这取决于您的硬件,11 分钟实际上还不错,在执行计划中,我可以看到一切正常。
但据您所知,该插入语句的瓶颈是从 T"Recovery..tags" table 读取数据,这占用了您 07 分钟的查询时间。(它使用了完整扫描,没问题考虑到它需要读取 200 万行和 return 很多列)
所以你唯一能做的就是找到一种方法来加快从链接服务器“恢复”中读取的速度。 链接服务器通常是性能不佳的根源,特别是巨大的数据,这可能是由于网络不佳或网络繁忙等...
无论如何,一种解决方案是:
- 将数据从链接服务器拉到 table 到 R3 服务器(直接),服务器在 middle.which 取决于你的场景你可以
- 更改您的查询以反对 table
这可以显着缩短您的查询时间