数据包含特定格式的错误读数
The Data Contains Faulty Readings with certain format
我有一个 pandas df,其中我的一个列有错误的值。我想清理这些值
错误值为负数并以 < 结尾,例如“-2.44<”。
如何在不影响其他列的情况下解决此问题?我的索引是日期时间
我已尝试将列转换为数字数据。
df.values = pd.to_numeric(df.values, errors='coerce')
没有错误消息。但是,我想用删除 '<' 来替换它们。
使用 Series.str.rstrip
从右侧删除 <
:
df.values = pd.to_numeric(df.values.str.rstrip('<'), errors='coerce')
或使用更通用的 Series.str.strip
- 可能添加更多值:
df.values = pd.to_numeric(df.values.str.strip('<>'), errors='coerce')
我有一个 pandas df,其中我的一个列有错误的值。我想清理这些值
错误值为负数并以 < 结尾,例如“-2.44<”。 如何在不影响其他列的情况下解决此问题?我的索引是日期时间
我已尝试将列转换为数字数据。
df.values = pd.to_numeric(df.values, errors='coerce')
没有错误消息。但是,我想用删除 '<' 来替换它们。
使用 Series.str.rstrip
从右侧删除 <
:
df.values = pd.to_numeric(df.values.str.rstrip('<'), errors='coerce')
或使用更通用的 Series.str.strip
- 可能添加更多值:
df.values = pd.to_numeric(df.values.str.strip('<>'), errors='coerce')