如何解决不正确的出生日期数据

How to resolve improper date of birth data

我的数据集包含不正确的出生日期条目。我该如何解决这个问题?因为这些数据对我的分析很重要,因为它有助于细分。例如:客户输入的出生日期为 1843-12-21,这显然是不正确的。也存在类似的问题。 提前致谢。

有不同的处理方式:

  1. 尝试了解错误原因。也许在某些情况下人们在错误的字段中输入数据。

  2. 进行有根据的猜测 - 例如 1843 可能是 1943。

  3. 将这些错误视为缺失值。