如何使用 float 参数生成 Halide 函数

How to Generate Halide Function with float argument

我正在尝试创建一个 (C++) 辅助函数,该函数将在我的 C++ 代码中计算的查找 table 转换为 Halide Func,该函数将浮点数作为参数并在 LUT 中的样本之间插入.

这里的用例是用户使用样条生成了一条色调曲线,其中包含我们想要应用 Halide 的一系列控制点。所以我在一堆点对这条样条曲线进行采样,我想编写一个 Halide 函数,让我在这些样本之间进行线性插值。这是我目前的尝试:

#include <Halide.h>

using namespace Halide;
using namespace std;

static Func LutFunc(const vector<float> &lut) {
    Func result;
    Var val;

    // Copy the LUT into a Halide Buffer.
    int lutSize = (int) lut.size();
    Buffer<float> lutbuf(lutSize);
    for(int i = 0; i < lut.size(); i++) {
        lutbuf(i) = lut[i];
    }

    // Compute the offset into the LUT along with the blending factor
    // for the 2 samples we'll take.
    auto y = val * ((float) lutSize - 1);
    auto index = clamp(cast<int>(y), 0, lutSize - 2);
    auto fract = y - cast<float>(index);

    // interpolate between the 2 nearest samples
    result(val) = (lutbuf(index) * (1.0f - fract)) + (lutbuf(index + 1) * fract);

    return result;
}

问题是,如果我随后尝试将此函数包含到我的 Halide 管道中,我会收到此错误:

Implicit cast from float32 to int in argument 1 in call to "f" is not allowed. Use an explicit cast.

我如何向 Halide 解释这个函数的参数应该是 float,而不是 int?

这里有一个简短的测试程序,希望对您有所帮助:

int main(int argc, char *argv[]) {
    vector<float> lut = { 0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0 };
    auto f = LutFunc(lut);

    Buffer<float> testData(4);
    testData(0) = 0.05;
    testData(1) = 0.15;
    testData(2) = 0.25;
    testData(3) = 0.35;

    Func testFn;
    Var x;

    testFn(x) = f(testData(x));

    Buffer<float> resultBuf(4);
    testFn.realize(resultBuf);

    for(int i = 0; i < 4; i++) {
        cout << i << " = " << resultBuf(i) << endl;
    }

    return 0;
}

(如果有更简单的方法来生成这些 lerping LUT 函数(特别是如果它能够利用 GPU 上的采样器硬件),我也很想知道)

好的,所以似乎无法使用 Func() 执行此操作:Func 似乎它们的预期用例是封装对源数据的转换——它们有一个约束,即它们的参数是整数,预期用例是指定输入的像素坐标。

我认为实现此目的的方法是将其分为两部分:将我的 LUT 转换为卤化物缓冲区的方法,以及将 Expr 作为参数和 returns Expr,实现内联计算,我们将生成的缓冲区传递给它。

这是我的函数的修订版本,可以满足我的要求:

#include <Halide.h>

using namespace Halide;
using namespace std;

static Expr LutInterp(const Buffer<float> &lutbuf, Expr val) {
    // Interpolate the two values nearest the specified input.
    int lutSize = lutbuf.dim(0).extent();
    auto y = val * ((float) lutSize - 1);
    auto index = clamp(cast<int>(y), 0, lutSize - 2);
    auto fract = y - cast<float>(index);
    return (lutbuf(index) * (1.0f - fract)) + (lutbuf(index + 1) * fract);
}

static Buffer<float> LutToBuff(const vector<float> &lut) {
    int lutSize = (int) lut.size();
    Buffer<float> lutbuf(lutSize);
    for(int i = 0; i < lut.size(); i++) {
        lutbuf(i) = lut[i];
    }
    return lutbuf;
}


int main(int argc, char *argv[]) {
    vector<float> lut = { 0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0 };
    auto lutbuf = LutToBuff(lut);

    Buffer<float> testData(4);
    testData(0) = 0.05;
    testData(1) = 0.15;
    testData(2) = 0.25;
    testData(3) = 0.35;

    Func testFn;
    Var x;

    testFn(x) = LutInterp(lutbuf, testData(x));

    Buffer<float> resultBuf(4);
    testFn.realize(resultBuf);

    for(int i = 0; i < 4; i++) {
        cout << i << " = " << resultBuf(i) << endl;
    }

    return 0;
}

我暂时先做这个,如果以后有更好的解决办法再换掉。

正如您已经发现的那样,Halide::Func 的参数是 总是 整数类型(默认为 int32);这是 Halide 固有的。

回复:一种更好的 lerping 方法,Halide 有一个内置的 lerp() 助手:参见 http://halide-lang.org/docs/namespace_halide.html#a55158f5f229510194c425dfae256d530