无法在处理位置使用 bigquery udf (bqutil):us-west-2

Cannot use bigquery udf (bqutil) in processing location: us-west-2

我们正尝试在 us-west2 中使用这些 - https://github.com/GoogleCloudPlatform/bigquery-utils/tree/master/udfs/community

第一个查询处理得很好,在美国

第二个查询不会 运行

我们的数据集 models 在 us West 2。似乎所有来自 2nd query editor 的查询都在 us-west 2 处理,似乎 bqutil 不存在?在us-west2(我们的数据集都存在的地方)处理时如何找到函数bqutil.fn.levenshtein

要在您的 BigQuery table 中使用 levenshtein UDF,您需要在数据集所在的位置创建一个 UDF。

您可以参考下面的UDF和数据所在us-west2位置的截图。

UDF :

CREATE OR REPLACE FUNCTION
`stackdemo.fn_LevenshteinDistance`(in_a STRING, in_b STRING) RETURNS INT64 LANGUAGE js AS R"""

var a = in_a.toLowerCase();
var b = in_b.toLowerCase();
 if(a.length == 0) return b.length;
if(b.length == 0) return a.length;
var matrix = [];
// increment along the first column of each row
var i;
for(i = 0; i <= b.length; i++){
 matrix[i] = [i];
}
// increment each column in the first row
var j;
for(j = 0; j <= a.length; j++){
 matrix[0][j] = j;
}
// Fill in the rest of the matrix
for(i = 1; i <= b.length; i++){
 for(j = 1; j <= a.length; j++){
   if(b.charAt(i-1) == a.charAt(j-1)){
     matrix[i][j] = matrix[i-1][j-1];
   } else {
     matrix[i][j] =
       Math.min(matrix[i-1][j-1] + 1, // substitution
       Math.min(matrix[i][j-1] + 1, // insertion
       matrix[i-1][j] + 1)); // deletion
   }
 }
}
return matrix[b.length][a.length];
""";

查询:

SELECT
 source,
 target,
 `stackdemo.fn_LevenshteinDistance`(source, target) distance,
FROM UNNEST([
 STRUCT('analyze' AS source, 'analyse' AS target),
 STRUCT('opossum', 'possum'),
 STRUCT('potatoe', 'potatoe'),
 STRUCT('while', 'whilst'),
 STRUCT('aluminum', 'alumininium'),
 STRUCT('Connecticut', 'CT')
]);

输出: