为什么当记录数量增加时我的查询变得太慢

Why my query become too slow when number of records increased

我在 SQL 服务器中有一个插入语句。

我尝试了一个较小的子集,速度很快

将数量增加到 100 万条记录,速度快 1 分 10 秒

现在我把它加倍了,它似乎卡住了它已经 运行 10 分钟了,但没有结果

我在 5 分钟时包含了计划。

https://www.brentozar.com/pastetheplan/?id=r15MPuC5u

也许有人可以告诉我如何改进流程。

PS。我在标签 (RepID) 上添加了非聚集索引。

Tag(iiD) 是主键

Reps(RepID) 是主键。

在我写这篇文章的时候。该过程在 11:47

结束

https://www.brentozar.com/pastetheplan/?id=HJd9uOCcu

这是我的代码

insert into R3..Tags (iID,DT,RepID,Tag,xmiID,iBegin,iEnd,Confidence,Polarity,Uncertainty,Conditional,Generic,HistoryOf,CodingScheme,Code,CUI,TUI,PreferredText,ValueBegin,ValueEnd,Value,Deleted,sKey,RepType)
SELECT T.iID,T.DT,T.RepID,T.Tag,T.xmiID,T.iBegin,T.iEnd,T.Confidence,T.Polarity,T.Uncertainty,T.Conditional,T.Generic,T.HistoryOf,T.CodingScheme,T.Code,T.CUI,T.TUI,T.PreferredText,T.ValueBegin,T.ValueEnd,T.Value,T.Deleted,T.sKey,R.RepType
FROM Recovery..tags  T inner join Recovery..Reps R on T.RepID = R.RepID
where T.iID between 2000001 and 4000000

(评论里放不下,放在这里)

我认为,您几乎无能为力,这取决于您的硬件,11 分钟实际上还不错,在执行计划中,我可以看到一切正常。

但据您所知,该插入语句的瓶颈是从 T"Recovery..tags" table 读取数据,这占用了您 07 分钟的查询时间。(它使用了完整扫描,没问题考虑到它需要读取 200 万行和 return 很多列)

所以你唯一能做的就是找到一种方法来加快从链接服务器“恢复”中读取的速度。 链接服务器通常是性能不佳的根源,特别是巨大的数据,这可能是由于网络不佳或网络繁忙等...

无论如何,一种解决方案是:

  • 将数据从链接服务器拉到 table 到 R3 服务器(直接),服务器在 middle.which 取决于你的场景你可以
  • 更改您的查询以反对 table

这可以显着缩短您的查询时间