AVRO 中的数据验证
Data validation in AVRO
我是 AVRO 的新手,如果这是一个简单的问题,请原谅。
我有一个用例,我使用 AVRO 模式进行记录调用。
假设我有 avro 架构
{
"name": "abc",
"namepsace": "xyz",
"type": "record",
"fields": [
{"name": "CustId", "type":"string"},
{"name": "SessionId", "type":"string"},
]
}
现在如果输入像
{
"CustId" : "abc1234"
"sessionID" : "000-0000-00000"
}
我想对这些字段使用一些正则表达式验证,并且我只想在它以如上所示的特定格式出现时才接受此输入。有什么方法可以在 avro 模式中指定包含正则表达式吗?
任何其他支持类似的数据序列化格式?
您应该可以为此使用自定义 logical type。然后,您可以将正则表达式直接包含在架构中。
例如,下面是如何在 Java脚本中实现一个:
var avro = require('avsc'),
util = require('util');
/**
* Sample logical type that validates strings using a regular expression.
*
*/
function ValidatedString(attrs, opts) {
avro.types.LogicalType.call(this, attrs, opts);
this._pattern = new RegExp(attrs.pattern);
}
util.inherits(ValidatedString, avro.types.LogicalType);
ValidatedString.prototype._fromValue = function (val) {
if (!this._pattern.test(val)) {
throw new Error('invalid string: ' + val);
}
return val;
};
ValidatedString.prototype._toValue = ValidatedString.prototype._fromValue;
以及您将如何使用它:
var type = avro.parse({
name: 'Example',
type: 'record',
fields: [
{
name: 'custId',
type: 'string' // Normal (free-form) string.
},
{
name: 'sessionId',
type: {
type: 'string',
logicalType: 'validated-string',
pattern: '^\d{3}-\d{4}-\d{5}$' // Validation pattern.
}
},
]
}, {logicalTypes: {'validated-string': ValidatedString}});
type.isValid({custId: 'abc', sessionId: '123-1234-12345'}); // true
type.isValid({custId: 'abc', sessionId: 'foobar'}); // false
您可以阅读有关实现和使用逻辑类型的更多信息here。
编辑:对于Java的实现,相信你会想看下面的类:
LogicalType
,您需要扩展的基础。
Conversion
,执行数据的转换(或验证)。
LogicalTypes
and Conversions
,一些现有实现的例子。
TestGenericLogicalTypes
,可以提供有用起点的相关测试。
我是 AVRO 的新手,如果这是一个简单的问题,请原谅。 我有一个用例,我使用 AVRO 模式进行记录调用。
假设我有 avro 架构
{
"name": "abc",
"namepsace": "xyz",
"type": "record",
"fields": [
{"name": "CustId", "type":"string"},
{"name": "SessionId", "type":"string"},
]
}
现在如果输入像
{
"CustId" : "abc1234"
"sessionID" : "000-0000-00000"
}
我想对这些字段使用一些正则表达式验证,并且我只想在它以如上所示的特定格式出现时才接受此输入。有什么方法可以在 avro 模式中指定包含正则表达式吗?
任何其他支持类似的数据序列化格式?
您应该可以为此使用自定义 logical type。然后,您可以将正则表达式直接包含在架构中。
例如,下面是如何在 Java脚本中实现一个:
var avro = require('avsc'),
util = require('util');
/**
* Sample logical type that validates strings using a regular expression.
*
*/
function ValidatedString(attrs, opts) {
avro.types.LogicalType.call(this, attrs, opts);
this._pattern = new RegExp(attrs.pattern);
}
util.inherits(ValidatedString, avro.types.LogicalType);
ValidatedString.prototype._fromValue = function (val) {
if (!this._pattern.test(val)) {
throw new Error('invalid string: ' + val);
}
return val;
};
ValidatedString.prototype._toValue = ValidatedString.prototype._fromValue;
以及您将如何使用它:
var type = avro.parse({
name: 'Example',
type: 'record',
fields: [
{
name: 'custId',
type: 'string' // Normal (free-form) string.
},
{
name: 'sessionId',
type: {
type: 'string',
logicalType: 'validated-string',
pattern: '^\d{3}-\d{4}-\d{5}$' // Validation pattern.
}
},
]
}, {logicalTypes: {'validated-string': ValidatedString}});
type.isValid({custId: 'abc', sessionId: '123-1234-12345'}); // true
type.isValid({custId: 'abc', sessionId: 'foobar'}); // false
您可以阅读有关实现和使用逻辑类型的更多信息here。
编辑:对于Java的实现,相信你会想看下面的类:
LogicalType
,您需要扩展的基础。Conversion
,执行数据的转换(或验证)。LogicalTypes
andConversions
,一些现有实现的例子。TestGenericLogicalTypes
,可以提供有用起点的相关测试。