外来字符的电子邮件验证

Email validation for exotic characters

Grails 中的电子邮件验证似乎只应用了 simple regex。虽然它可以验证大多数电子邮件,但一些奇特但已授权的字符会使验证失败。

例如使用了德语 ß 字符 in some email addresses,但不会通过 grail 验证:

package com.stuff.user.AppUser

import grails.test.mixin.Mock
import spock.lang.Specification

/**
 * Created by hschoonjans on 21/03/2016.
 */
@Mock(AppUser)
class AppUserSpec extends Specification {

    def "It doesn't validate an email with an eszett"() {
        given:
        AppUser user = new AppUser(email: "helainß@hotmail.com")

        expect:
        !user.validate(["email"])
    }
}

使用自定义正则表达式进行验证,授权 ß 将是微不足道的,但如果用户试图在他的邮件地址中使用另一个奇特但有效的字符怎么办?

为了避免这个问题,我想知道 Java/Groovy/Grails 存在哪些通用电子邮件地址验证器。 class/regex 可以验证任何有效的电子邮件地址,比当前的 Grails 电子邮件验证更智能。

我之前在自己的 Grails 项目中遇到过几次,并且使用这个 RegEx 取得了相当大的成功:

/^((([a-z]|\d|[!#$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+(\.([a-z]|\d|[!#$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+)*)|((\x22)((((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(([\x01-\x08\x0b\x0c\x0e-\x1f\x7f]|\x21|[\x23-\x5b]|[\x5d-\x7e]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(\([\x01-\x09\x0b\x0c\x0d-\x7f]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF]))))*(((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(\x22)))@((([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.)+(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.?$/i