如何解决不正确的出生日期数据
How to resolve improper date of birth data
我的数据集包含不正确的出生日期条目。我该如何解决这个问题?因为这些数据对我的分析很重要,因为它有助于细分。例如:客户输入的出生日期为 1843-12-21,这显然是不正确的。也存在类似的问题。
提前致谢。
有不同的处理方式:
尝试了解错误原因。也许在某些情况下人们在错误的字段中输入数据。
进行有根据的猜测 - 例如 1843 可能是 1943。
将这些错误视为缺失值。
我的数据集包含不正确的出生日期条目。我该如何解决这个问题?因为这些数据对我的分析很重要,因为它有助于细分。例如:客户输入的出生日期为 1843-12-21,这显然是不正确的。也存在类似的问题。 提前致谢。
有不同的处理方式:
尝试了解错误原因。也许在某些情况下人们在错误的字段中输入数据。
进行有根据的猜测 - 例如 1843 可能是 1943。
将这些错误视为缺失值。