SFML 怎么这么快?

How is SFML so fast?

我需要用 c++ 在 window 上逐个像素地绘制一些图形。为此,我创建了一个 SFML window、精灵和纹理。我将我想要的图形绘制到 uint8_t 数组,然后用它更新纹理和精灵。此过程大约需要 2500 us。绘制两个填满整个 window 的三角形只需要 10 us。这种巨大的差异怎么可能?我尝试过对逐像素绘图进行多线程处理,但仍然存在两个数量级的差异。我也尝试过使用点图绘制像素,但没有任何改进。我知道 SFML 在后台使用了一些 GPU 加速,但简单地循环并将值分配给像素数组已经花费了数百微秒。

有谁知道在 window 中分配像素值的更有效方法?

这是我用来比较三角形和逐像素绘图速度的代码示例:

#include <SFML/Graphics.hpp>
#include <chrono>
using namespace std::chrono;
#include <iostream>
#include<cmath>

uint8_t* pixels;

int main(int, char const**)
{
    const unsigned int width=1200;
    const unsigned int height=1200;
    sf::RenderWindow window(sf::VideoMode(width, height), "MA: Rasterization Test");
    pixels = new uint8_t[width*height*4];
    sf::Texture pixels_texture;
    pixels_texture.create(width, height);
    sf::Sprite pixels_sprite(pixels_texture);
    sf::Clock clock;
    sf::VertexArray triangle(sf::Triangles, 3);

    triangle[0].position = sf::Vector2f(0, height);
    triangle[1].position = sf::Vector2f(width, height);
    triangle[2].position = sf::Vector2f(width/2, height-std::sqrt(std::pow(width,2)-std::pow(width/2,2)));
    triangle[0].color = sf::Color::Red;
    triangle[1].color = sf::Color::Blue;
    triangle[2].color = sf::Color::Green;
    
    
    while (window.isOpen()){
        sf::Event event;
        while (window.pollEvent(event)) {
            if (event.type == sf::Event::Closed) {
                window.close();
            }
            if (event.type == sf::Event::KeyPressed && event.key.code == sf::Keyboard::Escape) {
                window.close();
            }
        }

        window.clear(sf::Color(255,255,255,255));

        // Pixel-by-pixel
        int us = duration_cast< microseconds >(system_clock::now().time_since_epoch()).count();
        for(int i=0;i!=width*height*4;++i){
            pixels[i]=255;
        }
        pixels_texture.update(pixels);
        window.draw(pixels_sprite);
        int duration=duration_cast< microseconds >(system_clock::now().time_since_epoch()).count()-us;
        std::cout<<"Background: "<<duration<<" us\n";

        // Triangle
        us = duration_cast< microseconds >(system_clock::now().time_since_epoch()).count();
        window.draw(triangle);
         duration=duration_cast< microseconds >(system_clock::now().time_since_epoch()).count()-us;
        std::cout<<"Triangle: "<<duration<<" us\n";

        window.display();
    }
    return EXIT_SUCCESS;
}

图形在现代设备中使用图形卡绘制,绘制速度取决于您发送到图形内存的数据中有多少个三角形。这就是为什么只画两个三角形很快。

正如你提到的多线程,如果你使用OpenGL(我不记得SFML使用的是什么,但应该是一样的),你认为你正在绘制的基本上是向显卡发送命令和数据,所以多线程这里不是很有用,显卡有自己的线程来做这个。

如果您对显卡的工作原理感到好奇,this 教程是 你应该读的书。

P.S。当你编辑你的问题时,我猜持续时间 2500us vs 10us 是因为你 for 循环创建了一个纹理(即使纹理是纯白色背景)(以及 for 循环,你可能需要在 for 循环之后开始计数),并将纹理发送到显卡需要时间,而绘制三角形只发送几个点。尽管如此,我还是建议阅读教程,逐个像素地创建纹理可能证明对 GPU 工作原理的误解。