Windows 创意者版更新后 QHD/4K 屏幕上的 ExtTextOut 50 性能下降

ExtTextOutW x50 performance drop on QHD/4K screens after Windows Creators edition update

出于某些奇怪的原因,调用 WinAPI 的 ExtTextOutW 函数在高分辨率位图 (2560x1440/3840x2160) 上绘制剪切文本会导致在使用 Creators Edition 更新 Windows 10 后性能下降约 x50。从我的用户的测试和调试日志来看,位图或字体大小的细微差异似乎会触发性能下降。

这是显示性能命中的调试日志:

10/05/2017 15:51:50 [   63227,186] : Calculate Rect
10/05/2017 15:51:50 [   63227,190] : Rect : Left=263, Top=504, Right=3561, Bottom=2155
10/05/2017 15:51:50 [   63227,193] : Set Shadow Color
10/05/2017 15:51:50 [   63227,198] : Render Text Shadow
10/05/2017 15:51:50 [   63236,650] : Set Text Color
10/05/2017 15:51:50 [   63236,661] : Render Text "Kingdom come Deliverance"
10/05/2017 15:51:50 [   63246,062] : Rendering complete

正如您从日志中看到的那样,对 ExtTextgOutW 的单次调用耗时约 9.5 毫秒,而在创建者更新之前,同一调用耗时不到 1 毫秒。

这是您可以与上面的调试输出进行比较的实际代码:

  {$IFDEF TEXTRENDERTRACE}DebugMsgFT('c:\log\.TextRender.txt','Calculate Rect');{$ENDIF}
  cRect    := Rect(X,Y,Width+X,MainForm.Monitor.Height-(1+(MainForm.Monitor.Height div 540)));
  {$IFDEF TEXTRENDERTRACE}DebugMsgFT('c:\log\.TextRender.txt','Rect : Left='+IntToStr(cRect.Left)+', Top='+IntToStr(cRect.Top)+', Right='+IntToStr(cRect.Right)+', Bottom='+IntToStr(cRect.Bottom));{$ENDIF}
  {$IFDEF TEXTRENDERTRACE}DebugMsgFT('c:\log\.TextRender.txt','Set Shadow Color');{$ENDIF}
  srcColor := txtCanvas.Font.Color;
  txtCanvas.Font.Color := OutLineColor;
  {$IFDEF TEXTRENDERTRACE}DebugMsgFT('c:\log\.TextRender.txt','Render Text Shadow');{$ENDIF}
  Windows.ExtTextOutW(txtCanvas.Handle,X  ,Y+(MainForm.Monitor.Height div 540),ETO_CLIPPED,@cRect,@S[1],I,nil);
  {$IFDEF TEXTRENDERTRACE}DebugMsgFT('c:\log\.TextRender.txt','Set Text Color');{$ENDIF}
  txtCanvas.Font.Color := srcColor;
  {$IFDEF TEXTRENDERTRACE}DebugMsgFT('c:\log\.TextRender.txt','Render Text "'+S+'"');{$ENDIF}
  Windows.ExtTextOutW(txtCanvas.Handle,X  ,Y  ,ETO_CLIPPED,@cRect,@S[1],I,nil);
  {$IFDEF TEXTRENDERTRACE}DebugMsgFT('c:\log\.TextRender.txt','Rendering complete'+CRLF);{$ENDIF}

这段代码通过两次渲染相同的文本来实现非常简单的投影效果,但 Y 轴偏移和颜色略有不同。

这是与我的论坛用户的完整讨论,我们在其中尝试在各种硬件上调试问题(其他调试日志包含在 post 中): http://forum.inmatrix.com/index.php?showtopic=14995&page=2

我们在 DPI 设置为 100% 的情况下进行了测试,以确保触发器与 Creators Edition 中引入的 DPI 更改无关。

有谁知道是什么触发了这个?有解决办法吗?

***** 更新 1 *****

至少在初始测试中,"DrawTextExW" 似乎也受到了性能损失的影响。测试期间使用的字体是 Arial,性能问题似乎与字体大小有关,因为用户报告说,向屏幕添加更多较小尺寸的线条(更多文本以较低分辨率呈现)会大大提高性能。

***** 更新 2 *****

我写了一个小工具来分析这个问题,您可以在这个 GitHub 存储库中找到它: https://github.com/bLightZP/WindowsTextRenderingProfiler

这个问题似乎取决于字体大小,例如,在 2560x1440 屏幕上,渲染一行 "Arial" 大小为“35”的字体文本需要 21 毫秒才能渲染,同时大小为“ 34" 花了 2 毫秒。

这是渲染到具有 32 位像素格式的 Delphi TBitmap 的 HDC,禁用剪裁对性能的影响很小。

***** 更新 3 *****

Sebastian Z 在下面的回答确实恢复了 pre-creators 版本的性能水平,我已经更新了 GitHub 上的示例代码以反映他的回答,但我已经能够通过 [=50] 重现该问题=] 7 64bit 和 1920x1080 屏幕,所以它不限于 Windows 10 creators edition 或高分辨率显示器,只是当字体质量设置为 ANTIALIASED 时触发阈值更高。在 Windows 7 下的测试中,使用字体 Arial,触发点是字体大小“109”(快速)与字体大小“110”(x10 较慢或更差的性能)。在使用 Sebastian Z 的答案禁用 cleartype 后,Windows 10 中存在相同的触发阈值。

Delphi 使用 lfQuality := DEFAULT_QUALITY; 创建字体。默认质量曾经是抗锯齿质量。但是自从 Windows 10 Creators 更新后,它现在默认为 cleartype。这很慢。所以解决方案是手动强制抗锯齿质量。

如果您使用的是当前 Delphi 版本,那么您只需设置 Font.Quality 属性:

Procedure RenderText(oBitmap : TBitmap; X,Y : Integer; cRect : TRect; S : WideString; testFunction : Integer; TxtEffect : Integer; EffectColor : TColor; Clipping : Boolean);
// [...]
begin
  obitmap.Canvas.Font.Quality := fqClearType;

在旧的 Delphi 版本中,它有点复杂:

var
  lf: TLogFont;
begin
  if GetObject(oBitmap.Canvas.Font.Handle, SizeOf(TLogFont), @lf) = sizeof(TLogFont) then
  begin
    lf.lfQuality := ANTIALIASED_QUALITY;
    oBitmap.Canvas.Font.Handle := CreateFontIndirect(lf);
  end;

这是 Windows 10 Creators Update 中的一个陷阱,因为 ClearType 文本并不总是合适的,并且可能会导致意外结果。