如何从 Apache Arrow 中的 ChunkedArray 中按值查找索引?
how to find index by value in ChunkedArray from Apache Arrow?
我能找到的最接近的似乎是来自 ComputeFunction 的 index
:
https://arrow.apache.org/docs/python/api/compute.html
但我没有从 apache arrow 代码库中找到它在 C++ 中的工作代码示例。
这是 cpp 文档中该函数的文档:
https://arrow.apache.org/docs/cpp/compute.html#aggregations
下面是如何在 C++ 中调用该函数的简短示例:
8.0.0: https://github.com/apache/arrow/blob/apache-arrow-8.0.0/cpp/src/arrow/compute/kernels/aggregate_test.cc#L2234
7.0.0: https://github.com/apache/arrow/blob/apache-arrow-7.0.0/cpp/src/arrow/compute/kernels/aggregate_test.cc#L2206
[2022-05-23 编辑]
下面是一个使用箭头 7.0.0 调用 Index
函数的示例:
https://github.com/drin/cookbooks/blob/mainline/arrow/compute-api/recipe.cpp#L18
recipe.hpp
文件应该显示所需的包含和使用的类型(我尽量减少到只需要什么)。
另外,这里是对应的使用代码,包括制作一些测试数据,使用IndexOf
函数,查看结果:
https://github.com/drin/cookbooks/blob/mainline/arrow/compute-api/index.cpp#L18
我写 IndexOf
是为了向您展示如何自己使用 Index
函数,这样您就可以直接使用它,或者写一个类似风格的包装函数。
注意:我认为我需要升级到 8.0.0 才能使用 Scalar
类型,但我认为 8.0.0 主要引入了 Scalar
的文档而不是引入代码,因为这适用于箭头 7.0.0.
我能找到的最接近的似乎是来自 ComputeFunction 的 index
:
https://arrow.apache.org/docs/python/api/compute.html
但我没有从 apache arrow 代码库中找到它在 C++ 中的工作代码示例。
这是 cpp 文档中该函数的文档:
https://arrow.apache.org/docs/cpp/compute.html#aggregations
下面是如何在 C++ 中调用该函数的简短示例:
8.0.0: https://github.com/apache/arrow/blob/apache-arrow-8.0.0/cpp/src/arrow/compute/kernels/aggregate_test.cc#L2234
7.0.0: https://github.com/apache/arrow/blob/apache-arrow-7.0.0/cpp/src/arrow/compute/kernels/aggregate_test.cc#L2206
[2022-05-23 编辑]
下面是一个使用箭头 7.0.0 调用 Index
函数的示例:
https://github.com/drin/cookbooks/blob/mainline/arrow/compute-api/recipe.cpp#L18
recipe.hpp
文件应该显示所需的包含和使用的类型(我尽量减少到只需要什么)。
另外,这里是对应的使用代码,包括制作一些测试数据,使用IndexOf
函数,查看结果:
https://github.com/drin/cookbooks/blob/mainline/arrow/compute-api/index.cpp#L18
我写 IndexOf
是为了向您展示如何自己使用 Index
函数,这样您就可以直接使用它,或者写一个类似风格的包装函数。
注意:我认为我需要升级到 8.0.0 才能使用 Scalar
类型,但我认为 8.0.0 主要引入了 Scalar
的文档而不是引入代码,因为这适用于箭头 7.0.0.