无法在处理位置使用 bigquery udf (bqutil):us-west-2
Cannot use bigquery udf (bqutil) in processing location: us-west-2
我们正尝试在 us-west2 中使用这些 - https://github.com/GoogleCloudPlatform/bigquery-utils/tree/master/udfs/community。
第一个查询处理得很好,在美国
第二个查询不会 运行
我们的数据集 models
在 us West 2。似乎所有来自 2nd query editor 的查询都在 us-west 2 处理,似乎 bqutil
不存在?在us-west2(我们的数据集都存在的地方)处理时如何找到函数bqutil.fn.levenshtein
?
要在您的 BigQuery table 中使用 levenshtein UDF,您需要在数据集所在的位置创建一个 UDF。
您可以参考下面的UDF和数据所在us-west2位置的截图。
UDF :
CREATE OR REPLACE FUNCTION
`stackdemo.fn_LevenshteinDistance`(in_a STRING, in_b STRING) RETURNS INT64 LANGUAGE js AS R"""
var a = in_a.toLowerCase();
var b = in_b.toLowerCase();
if(a.length == 0) return b.length;
if(b.length == 0) return a.length;
var matrix = [];
// increment along the first column of each row
var i;
for(i = 0; i <= b.length; i++){
matrix[i] = [i];
}
// increment each column in the first row
var j;
for(j = 0; j <= a.length; j++){
matrix[0][j] = j;
}
// Fill in the rest of the matrix
for(i = 1; i <= b.length; i++){
for(j = 1; j <= a.length; j++){
if(b.charAt(i-1) == a.charAt(j-1)){
matrix[i][j] = matrix[i-1][j-1];
} else {
matrix[i][j] =
Math.min(matrix[i-1][j-1] + 1, // substitution
Math.min(matrix[i][j-1] + 1, // insertion
matrix[i-1][j] + 1)); // deletion
}
}
}
return matrix[b.length][a.length];
""";
查询:
SELECT
source,
target,
`stackdemo.fn_LevenshteinDistance`(source, target) distance,
FROM UNNEST([
STRUCT('analyze' AS source, 'analyse' AS target),
STRUCT('opossum', 'possum'),
STRUCT('potatoe', 'potatoe'),
STRUCT('while', 'whilst'),
STRUCT('aluminum', 'alumininium'),
STRUCT('Connecticut', 'CT')
]);
输出:
我们正尝试在 us-west2 中使用这些 - https://github.com/GoogleCloudPlatform/bigquery-utils/tree/master/udfs/community。
第一个查询处理得很好,在美国
第二个查询不会 运行
我们的数据集 models
在 us West 2。似乎所有来自 2nd query editor 的查询都在 us-west 2 处理,似乎 bqutil
不存在?在us-west2(我们的数据集都存在的地方)处理时如何找到函数bqutil.fn.levenshtein
?
要在您的 BigQuery table 中使用 levenshtein UDF,您需要在数据集所在的位置创建一个 UDF。
您可以参考下面的UDF和数据所在us-west2位置的截图。
UDF :
CREATE OR REPLACE FUNCTION
`stackdemo.fn_LevenshteinDistance`(in_a STRING, in_b STRING) RETURNS INT64 LANGUAGE js AS R"""
var a = in_a.toLowerCase();
var b = in_b.toLowerCase();
if(a.length == 0) return b.length;
if(b.length == 0) return a.length;
var matrix = [];
// increment along the first column of each row
var i;
for(i = 0; i <= b.length; i++){
matrix[i] = [i];
}
// increment each column in the first row
var j;
for(j = 0; j <= a.length; j++){
matrix[0][j] = j;
}
// Fill in the rest of the matrix
for(i = 1; i <= b.length; i++){
for(j = 1; j <= a.length; j++){
if(b.charAt(i-1) == a.charAt(j-1)){
matrix[i][j] = matrix[i-1][j-1];
} else {
matrix[i][j] =
Math.min(matrix[i-1][j-1] + 1, // substitution
Math.min(matrix[i][j-1] + 1, // insertion
matrix[i-1][j] + 1)); // deletion
}
}
}
return matrix[b.length][a.length];
""";
查询:
SELECT
source,
target,
`stackdemo.fn_LevenshteinDistance`(source, target) distance,
FROM UNNEST([
STRUCT('analyze' AS source, 'analyse' AS target),
STRUCT('opossum', 'possum'),
STRUCT('potatoe', 'potatoe'),
STRUCT('while', 'whilst'),
STRUCT('aluminum', 'alumininium'),
STRUCT('Connecticut', 'CT')
]);
输出: