如何顺利地估算 Pandas DataFrame 中的值?
How to smoothly impute values in a Pandas DataFrame?
我正在使用 Streamlit、Pandas 和 Quandl Nasdaq Nordic Dataset.[= 进行数据科学项目18=]
当我使用 Python Quandl 模块获取数据并将其绘制在 streamlit.area_chart
或 streamlit.line_chart
上时,它似乎有一些缺失值或下降到 0 的值.我想估算这些,但是无论我使用"mean"
还是median
,估算的数据都有宽的平坦部分。
这里是平坦区域的放大图
我显然不想要这个。是否有任何其他方法可以使用 pandas、sklearn SimpleImputer
或任何其他资源来估算值,以便它保留估算中的趋势?
我的一个建议可能是从周围的行中取平均值,比如移动平均线,但我不确定如何实现这个或者这是否是最好的方法。
感谢您的宝贵时间。
感谢 ifly6,我找到了解决方案。
只需将您的数据集设置为插值版本,如下所示:
data = df.interpolate()
简单!
我正在使用 Streamlit、Pandas 和 Quandl Nasdaq Nordic Dataset.[= 进行数据科学项目18=]
当我使用 Python Quandl 模块获取数据并将其绘制在 streamlit.area_chart
或 streamlit.line_chart
上时,它似乎有一些缺失值或下降到 0 的值.我想估算这些,但是无论我使用"mean"
还是median
,估算的数据都有宽的平坦部分。
这里是平坦区域的放大图
我显然不想要这个。是否有任何其他方法可以使用 pandas、sklearn SimpleImputer
或任何其他资源来估算值,以便它保留估算中的趋势?
我的一个建议可能是从周围的行中取平均值,比如移动平均线,但我不确定如何实现这个或者这是否是最好的方法。
感谢您的宝贵时间。
感谢 ifly6,我找到了解决方案。
只需将您的数据集设置为插值版本,如下所示:
data = df.interpolate()