数据包含特定格式的错误读数

The Data Contains Faulty Readings with certain format

我有一个 pandas df,其中我的一个列有错误的值。我想清理这些值

错误值为负数并以 < 结尾,例如“-2.44<”。 如何在不影响其他列的情况下解决此问题?我的索引是日期时间

我已尝试将列转换为数字数据。

df.values = pd.to_numeric(df.values, errors='coerce')

没有错误消息。但是,我想用删除 '<' 来替换它们。

使用 Series.str.rstrip 从右侧删除 <

df.values = pd.to_numeric(df.values.str.rstrip('<'), errors='coerce')

或使用更通用的 Series.str.strip - 可能添加更多值:

df.values = pd.to_numeric(df.values.str.strip('<>'), errors='coerce')