在 TraceRaysKHR 之后复制一个 VkImage 到 CPU
Copy a VkImage after TraceRaysKHR to CPU
将用于渲染的 VkImage
复制到屏幕外帧缓冲区会产生黑色图像。
当使用光栅器时,渲染的图像是非空的,但一旦我切换到光线追踪,输出图像就为空:
// Offscreen render pass
vk::RenderPassBeginInfo offscreenRenderPassBeginInfo;
// setup framebuffer ..
if(useRaytracer) {
helloVk.raytrace(cmdBuf, clearColor);
} else {
cmdBuf.beginRenderPass(offscreenRenderPassBeginInfo, vk::SubpassContents::eInline);
helloVk.rasterize(cmdBuf);
cmdBuf.endRenderPass();
}
// saving to image
if(write_to_image)
{
helloVk.copy_to_image(cmdBuf);
}
光线追踪器和光栅化器都通过共享描述符集使用相同的资源(例如输出图像)。我还有一个 post 处理阶段,输出被色调映射并渲染到交换链。
我通过线性图像和vkCmdCopyImage
复制图像。
我已经试了很多了,但是还有很多问题
如何获得光线追踪图像?是否可以像我使用的那样仅在单个命令缓冲区中通过内存屏障获取输出?我应该创建一个独立的命令缓冲区并在同步障碍后获取输出吗?光线追踪是否需要特殊 VkPipelineStageFlags
?
目前已解决:
将命令缓冲区提交到队列时,它需要额外的 vkQueueWaitIdle(m_queue)
,因为光线追踪以一定的延迟完成
您始终需要考虑 Vulkan 中的同步。了解它的工作原理是个好主意,因为在我看来这是最重要的事情之一。
这里是其中一篇博客:
https://www.khronos.org/blog/understanding-vulkan-synchronization
懒人总结:
- 障碍(命令和内存),将命令分成组并确保组按顺序执行而不是并行执行,以同步一个队列中流水线阶段的内存访问。
- 事件,类似于障碍,但使用用户定义的“阶段”,比障碍慢。
- 子通道依赖,同步子通道。
- 信号量,同步多个队列,用于同步GPU上的共享数据。
- Fences,和semaphores一样,但是用来同步共享数据GPU->CPU.
- 时间线信号量(自 Vulkan 1.2 起),同步 CPU 和 GPU 之间的双向工作。
- 等待空闲的队列,与栅栏一样,同步 GPU->CPU,但对于整个队列,不仅是一个特定的提交。
- 等待空闲的设备,与等待空闲的队列一样,同步GPU->CPU,但对所有队列。
将用于渲染的 VkImage
复制到屏幕外帧缓冲区会产生黑色图像。
当使用光栅器时,渲染的图像是非空的,但一旦我切换到光线追踪,输出图像就为空:
// Offscreen render pass
vk::RenderPassBeginInfo offscreenRenderPassBeginInfo;
// setup framebuffer ..
if(useRaytracer) {
helloVk.raytrace(cmdBuf, clearColor);
} else {
cmdBuf.beginRenderPass(offscreenRenderPassBeginInfo, vk::SubpassContents::eInline);
helloVk.rasterize(cmdBuf);
cmdBuf.endRenderPass();
}
// saving to image
if(write_to_image)
{
helloVk.copy_to_image(cmdBuf);
}
光线追踪器和光栅化器都通过共享描述符集使用相同的资源(例如输出图像)。我还有一个 post 处理阶段,输出被色调映射并渲染到交换链。
我通过线性图像和vkCmdCopyImage
复制图像。
我已经试了很多了,但是还有很多问题
如何获得光线追踪图像?是否可以像我使用的那样仅在单个命令缓冲区中通过内存屏障获取输出?我应该创建一个独立的命令缓冲区并在同步障碍后获取输出吗?光线追踪是否需要特殊 VkPipelineStageFlags
?
目前已解决:
将命令缓冲区提交到队列时,它需要额外的 vkQueueWaitIdle(m_queue)
,因为光线追踪以一定的延迟完成
您始终需要考虑 Vulkan 中的同步。了解它的工作原理是个好主意,因为在我看来这是最重要的事情之一。
这里是其中一篇博客: https://www.khronos.org/blog/understanding-vulkan-synchronization
懒人总结:
- 障碍(命令和内存),将命令分成组并确保组按顺序执行而不是并行执行,以同步一个队列中流水线阶段的内存访问。
- 事件,类似于障碍,但使用用户定义的“阶段”,比障碍慢。
- 子通道依赖,同步子通道。
- 信号量,同步多个队列,用于同步GPU上的共享数据。
- Fences,和semaphores一样,但是用来同步共享数据GPU->CPU.
- 时间线信号量(自 Vulkan 1.2 起),同步 CPU 和 GPU 之间的双向工作。
- 等待空闲的队列,与栅栏一样,同步 GPU->CPU,但对于整个队列,不仅是一个特定的提交。
- 等待空闲的设备,与等待空闲的队列一样,同步GPU->CPU,但对所有队列。