如何在应用 agg 函数之前将十进制值限制为 2 位?
How to limit decimal values to 2 digits before applying agg function?
我正在关注来自堆栈溢出 post 之一的 解决方案,我唯一的要求是如何在应用之前将我想要求和的值限制为小数点后 2 位df.agg(sum())
函数?
例如:我有如下值,求和函数对其求和,
2.346
1.549
但是我希望将值四舍五入到小数点后 2 位数字,如
2.35
1.55
在求和之前。我该怎么做?我无法找到函数 sum
.
的任何子函数,例如 sum().round
注意:我使用的是Spark 1.5.1版本。
您可以使用 bround:
val df = Seq(2.346, 1.549).toDF("A")
df.select(bround(df("A"), 2)).show
+------------+
|bround(A, 2)|
+------------+
| 2.35|
| 1.55|
+------------+
df.agg(sum(bround(df("A"), 2)).as("appSum")).show
+------------------+
| appSum|
+------------------+
|3.9000000000000004|
+------------------+
^
df.agg(sum(df("A")).as("exactSum")).show
+--------+
|exactSum|
+--------+
| 3.895|
+--------+
上面的解决方案适用于 spark 2.0 版本,但是对于像我这样仍在使用 1.5.*+ 版本的人来说,下面的版本是可行的。(我按照@Psidom 的建议使用了 round 函数):
val df = Seq(2.346, 1.549).toDF("A")
df.select(bround(df("A"), 2)).show
+------------+
|bround(A, 2)|
+------------+
| 2.35|
| 1.55|
+------------+
val total=df.agg(sum(round(df.col(colName),2)).cast("double")).first.getDouble(0)
total: Double = 3.90
我正在关注来自堆栈溢出 post 之一的 df.agg(sum())
函数?
例如:我有如下值,求和函数对其求和,
2.346
1.549
但是我希望将值四舍五入到小数点后 2 位数字,如
2.35
1.55
在求和之前。我该怎么做?我无法找到函数 sum
.
sum().round
注意:我使用的是Spark 1.5.1版本。
您可以使用 bround:
val df = Seq(2.346, 1.549).toDF("A")
df.select(bround(df("A"), 2)).show
+------------+
|bround(A, 2)|
+------------+
| 2.35|
| 1.55|
+------------+
df.agg(sum(bround(df("A"), 2)).as("appSum")).show
+------------------+
| appSum|
+------------------+
|3.9000000000000004|
+------------------+
^
df.agg(sum(df("A")).as("exactSum")).show
+--------+
|exactSum|
+--------+
| 3.895|
+--------+
上面的解决方案适用于 spark 2.0 版本,但是对于像我这样仍在使用 1.5.*+ 版本的人来说,下面的版本是可行的。(我按照@Psidom 的建议使用了 round 函数):
val df = Seq(2.346, 1.549).toDF("A")
df.select(bround(df("A"), 2)).show
+------------+
|bround(A, 2)|
+------------+
| 2.35|
| 1.55|
+------------+
val total=df.agg(sum(round(df.col(colName),2)).cast("double")).first.getDouble(0)
total: Double = 3.90