如何从数据框字符串中提取浮点数
How to extract float number from data frame string
在我的数据框中,每个条目都是一个至少包含一个数字的字符串。有时一个单元格中有多个相同的条目。
data = {'INTERVAL': ['0,60', '0,8 0,8', '0,5 0,5 0,5']}
df = pd.DataFrame(data)
print(df)
如何将值提取为浮点数并用新的简化表示替换原始列?我试过使用提取物
df['INTERVAL'].str.extract('((\d+))')
命令,但是我失败了。
提前致谢
这似乎对我有用 -
floats = df['INTERVAL'].str.extract("(^[0-9]*,[0-9]*) ?.*")
df['INTERVAL'] = floats[0].str.replace(",",".").astype(float)
在我的数据框中,每个条目都是一个至少包含一个数字的字符串。有时一个单元格中有多个相同的条目。
data = {'INTERVAL': ['0,60', '0,8 0,8', '0,5 0,5 0,5']}
df = pd.DataFrame(data)
print(df)
如何将值提取为浮点数并用新的简化表示替换原始列?我试过使用提取物
df['INTERVAL'].str.extract('((\d+))')
命令,但是我失败了。
提前致谢
这似乎对我有用 -
floats = df['INTERVAL'].str.extract("(^[0-9]*,[0-9]*) ?.*")
df['INTERVAL'] = floats[0].str.replace(",",".").astype(float)