Haskell 中惰性数组的适当表示
Appropriate representation for lazy array in Haskell
我正在尝试制作一个程序,该程序对一个大型数组进行大量更新,但只评估几次。我希望计算尽可能惰性,但我无法找出哪种 Array 表示形式适合我的情况。
具体来说,我希望我的数组:
- 有固定尺寸
- 常量访问
- 在 O(n) 中更新 n 个元素
- 懒惰评价
如何处理这些要求?作为一个子问题:是否有专门针对此用例的库?
编辑:
也许我的问题不够具体,所以我会尝试更多地解释我的情况。
我正在尝试表示各种尺寸的图像,这些图像可以相对较小(大约 1200x800),也可以比它大得多(至少 8000x8000)。此外,一张图像会有很多层,这意味着如果我想在屏幕上绘制图像,帧缓冲区图像会有很多更新。我想如果我可以利用 haskell 的惰性求值特性,我将能够只在帧缓冲区上写入一次,而不是在每次更新时覆盖相同的像素。
我知道在 haskell 中表示数组的几个选项,但所有这些似乎都不适合我的情况。例如:
- Data.Seq, Data.IntTrie : 无法在常数时间内访问
- Data.Vector, Data.Array : 更新 n 个元素花费的时间超过 O(n)
- 未装箱变体:未进行惰性评估(我猜?)
在这种情况下我应该采取什么方法?
要考虑的一个库是 repa
. One of the key ideas in repa
is that the Array
类型在其底层表示上进行了参数化。其中的一个示例是
- 数组的延迟表示
D
"aren't real" - 它们只是按需计算元素;
- 未装箱数据的未装箱矢量表示
U
- 盒装数据的盒装矢量表示
V
(仅当您不能创建数据的 Unbox
实例时使用)
- 对外部缓冲区的引用
F
,如果您想写入某些外部位图图形缓冲区 ,尤其有用
编译代码时,延迟数组将被优化掉。不用说,未装箱的数组具有 O(1)
访问权限。对于您的情况,您可能只使用形状数组 DIM2
(二维数组)。
出于演示目的,这里有一个程序可以执行与您想要的类似的操作:它接收位图图层列表及其偏移量,以及背景位图。然后,它在位图背景之上绘制这些图层。这取决于 repa-io
将图像加载到 repa
数组中。
import Data.Array.Repa.IO.BMP
import Data.Array.Repa.Shape
import Data.Array.Repa
import Data.Word
-- This is our internal representation of a bitmap
type Image s = Array s DIM2 (Word8, Word8, Word8)
data Layer s = Layer { image :: Image s, offset :: (Int, Int) }
drawLayersOnBg :: Image U -> [Layer U] -> Image D
drawLayersOnBg background layers = foldl (\bg (Layer im (x,y)) -> overlay bg (ix2 y x) im) (delay background) layers
where
overlay :: Image D -> DIM2 -> Image U -> Image D
overlay bg off ov = backpermuteDft bg
(\i -> let i' = i `subDim` off
in if extent ov `inShape` I'
then Just i'
else Nothing)
ov
subDim :: DIM2 -> DIM2 -> DIM2
subDim (Z :. y :. x) (Z :. dy :. dx) = ix2 (y - dy) (x - dx)
main = do
Right bg <- readImageFromBMP "background.bmp"
Right l1 <- readImageFromBMP "layer1.bmp"
Right l2 <- readImageFromBMP "layer2.bmp"
Right l3 <- readImageFromBMP "layer3.bmp"
out <- computeP $ drawLayersOnBg bg [ Layer l1 (200,100) , Layer l2 (100, 200), Layer l3 (-300,400) ]
writeImageToBMP "out.bmp" out
使用来自互联网的一些随机位图,我将其作为输出:
如果我愿意,我什至可以使用 fromForeignPtr
直接从一些外部内存缓冲区读取位图,并使用 computeIntoP
而不是 computeP
将位图输出直接写入一些外部内存缓冲区(无中间分配)。如果您需要高性能,这些特别有趣。
我正在尝试制作一个程序,该程序对一个大型数组进行大量更新,但只评估几次。我希望计算尽可能惰性,但我无法找出哪种 Array 表示形式适合我的情况。 具体来说,我希望我的数组:
- 有固定尺寸
- 常量访问
- 在 O(n) 中更新 n 个元素
- 懒惰评价
如何处理这些要求?作为一个子问题:是否有专门针对此用例的库?
编辑:
也许我的问题不够具体,所以我会尝试更多地解释我的情况。
我正在尝试表示各种尺寸的图像,这些图像可以相对较小(大约 1200x800),也可以比它大得多(至少 8000x8000)。此外,一张图像会有很多层,这意味着如果我想在屏幕上绘制图像,帧缓冲区图像会有很多更新。我想如果我可以利用 haskell 的惰性求值特性,我将能够只在帧缓冲区上写入一次,而不是在每次更新时覆盖相同的像素。
我知道在 haskell 中表示数组的几个选项,但所有这些似乎都不适合我的情况。例如:
- Data.Seq, Data.IntTrie : 无法在常数时间内访问
- Data.Vector, Data.Array : 更新 n 个元素花费的时间超过 O(n)
- 未装箱变体:未进行惰性评估(我猜?)
在这种情况下我应该采取什么方法?
要考虑的一个库是 repa
. One of the key ideas in repa
is that the Array
类型在其底层表示上进行了参数化。其中的一个示例是
- 数组的延迟表示
D
"aren't real" - 它们只是按需计算元素; - 未装箱数据的未装箱矢量表示
U
- 盒装数据的盒装矢量表示
V
(仅当您不能创建数据的Unbox
实例时使用) - 对外部缓冲区的引用
F
,如果您想写入某些外部位图图形缓冲区 ,尤其有用
编译代码时,延迟数组将被优化掉。不用说,未装箱的数组具有 O(1)
访问权限。对于您的情况,您可能只使用形状数组 DIM2
(二维数组)。
出于演示目的,这里有一个程序可以执行与您想要的类似的操作:它接收位图图层列表及其偏移量,以及背景位图。然后,它在位图背景之上绘制这些图层。这取决于 repa-io
将图像加载到 repa
数组中。
import Data.Array.Repa.IO.BMP
import Data.Array.Repa.Shape
import Data.Array.Repa
import Data.Word
-- This is our internal representation of a bitmap
type Image s = Array s DIM2 (Word8, Word8, Word8)
data Layer s = Layer { image :: Image s, offset :: (Int, Int) }
drawLayersOnBg :: Image U -> [Layer U] -> Image D
drawLayersOnBg background layers = foldl (\bg (Layer im (x,y)) -> overlay bg (ix2 y x) im) (delay background) layers
where
overlay :: Image D -> DIM2 -> Image U -> Image D
overlay bg off ov = backpermuteDft bg
(\i -> let i' = i `subDim` off
in if extent ov `inShape` I'
then Just i'
else Nothing)
ov
subDim :: DIM2 -> DIM2 -> DIM2
subDim (Z :. y :. x) (Z :. dy :. dx) = ix2 (y - dy) (x - dx)
main = do
Right bg <- readImageFromBMP "background.bmp"
Right l1 <- readImageFromBMP "layer1.bmp"
Right l2 <- readImageFromBMP "layer2.bmp"
Right l3 <- readImageFromBMP "layer3.bmp"
out <- computeP $ drawLayersOnBg bg [ Layer l1 (200,100) , Layer l2 (100, 200), Layer l3 (-300,400) ]
writeImageToBMP "out.bmp" out
使用来自互联网的一些随机位图,我将其作为输出:
如果我愿意,我什至可以使用 fromForeignPtr
直接从一些外部内存缓冲区读取位图,并使用 computeIntoP
而不是 computeP
将位图输出直接写入一些外部内存缓冲区(无中间分配)。如果您需要高性能,这些特别有趣。