使用深度学习或机器学习模型验证名字和姓氏

Validate first name and last name using a deep learning or machine learning model

我有大约 100 万个名字和姓氏数据点。 这些名称可以是有效名称,例如:'David Beckham' 或无效名称 - 'rockstar123' 或 'new mutant'。是否有任何深度学习/机器学习模型可以让我区分两者?

选项 1: 使用任何 pre-trained 命名实体识别 (NER) 模型。

选项 2: 训练您的自定义 NER 模型。在底层,不同的 NER 模型使用不同的嵌入(GloVe、Transformer-based 等)。一旦确定了任务的嵌入,任何二元分类模型都可以输出概率(例如,naive-bayes、逻辑回归、SVM、神经网络)。

选项 3:不使用 ML。对于这个简单的任务,我会倾向于 regex/rule-matching.