Scala:相当于 np.digitize 对数据进行分桶

Scala: equivalent of np.digitize to bucketize data

对于 scala,我有一些数据,例如

val values = Seq(0, 2, 10, 50)

我定义了桶,例如

val buckets = TreeMap[Int, Double]((0, -0.001),
                                   (1, 1.5),
                                   (2, 5),
                                   (3, 20)

然后我想从我的价值观中获得桶索引,例如。

val result = Seq(0, 1, 2, 3)

在 python 中,这可以用 np.digitize 完成,在 scala 中,我找不到与 Nd4j 或 Breeze 等效的东西。

有优化的解决方案吗?

可能您使用的是较旧的 Breeze 版本。如果您包括:

libraryDependencies += "org.scalanlp" %% "breeze" % "0.13.2"

在您的 .sbt 文件中,您可以使用该函数。例如:

import breeze.stats._

val arr1 = Array(-3, 0.5, 1, 1.5, 4)
val arr2 = Array(0, 1, 2)

digitize(arr1, arr2)

它给出了

Array(0, 1, 1, 2, 3)