非标准化数据库的风险?

Risks of Non-Standardized Databases?

我的工作任务是检查人事数据库的 11 万条记录,并使用特定的部门排除项生成一个子集。

我被告知我工作的风险容忍度为 0。例如,我不能在结果子集中排除员工。

问题是我正在使用的数据库对于我应该针对其执行排除逻辑的字段具有非标准化字段!

例如,如果我试图排除一个特定的部门,比如 "Account Collections",我不能简单地查询数据库以获得 'department <> "Account Collections"',因为部门也可以在其他 6 个字段中设置, none 其中是标准化的,都是自由格式的字段。

更复杂的是,"Account Collections" 有时会拼写错误,或被用户缩写为 "Acc Col",或 "Acct Coll."...

我正试图向我的同事解释这是一项零风险容忍度的不可能完成的任务,因为我不知道我是否会抓住所有领域的所有 "Account Collections" 个部门。

我需要帮助将这个概念传达给非技术相关人员,我到底该怎么办?!

感谢您的体验!

为了回答您关于将观点传达给非技术相关人员的问题。这很难,您基本上需要尽可能简单地以书面形式说明进入数据库的数据的当前配​​置处于不一致状态。

最终结果是您可以尝试创建数据子集,但不能保证它不会包含错误。说明他们要么接受这种风险,要么创建一个辅助工作主体来手动检查您生成的输出数据的所有行。