Pandas 列由数组组成,使用 plt.imshow() 绘制此图
Pandas Column Consists of Arrays, Plot This Using plt.imshow()
所以我的数据结构有点不寻常。这是我正在使用的示例:
import numpy as np
import pandas as pd
dict = {'data': [[1,2,3], [2,3,4], [3,4,5]], 'parameter': [10, 11, 12]}
df = pd.DataFrame(dict)
换句话说,df['data']
中的每一行都包含一个数组。
我需要使用 matplotlib 的 imshow()
函数绘制它,但我在使用 df['data']
中的数组时遇到困难。我试过使用 df['data'].to_numpy()
,但是这个 returns a dtype=object
,imshow 无法处理。尝试绘制时出现此错误:
TypeError: Image data of dtype object cannot be converted to float
准确地说,这是我尝试过的 运行:
import pylab as plt
plt.imshow(df['data'].to_numpy())
我四处阅读,似乎找不到任何人有类似的例子。
明确一点:我需要从 从 DataFrame 到 imshow,我不能直接从我的代码中的字典中绘制。我也不想对新列表进行任何附加操作,因为我的数据集很大并且会大大减慢速度。
编辑 1:
在评论中回答一个问题,这就是我想要的情节类型。 x 轴包含 df['data']
中的数组,而 y 轴最终将是 df['parameter']
。
编辑 2:
我想我需要进一步澄清我的问题。我正在寻找完全重现这个情节。
为了制作这个情节,我做了以下工作:
rows = []
for i in df['data']:
rows.append(i)
plt.imshow(rows)
此解决方案适用于我的数据,但我正在寻找一种更有效的方法来完成同样的事情。即,一种不涉及循环和追加的方法。
您可以执行以下操作:
使用 df.explode
取消列出 data
列到不同的行,然后绘图。
x = df.explode('data').reset_index()
plt.imshow(x[['data','parameter']].to_numpy().astype('float').T)
这将产生:
基本上,x[['data','parameter']].to_numpy().astype('float').T
会为您提供所需的 numpy 数组,您可以在其中随意绘制。
根据用户评论编辑:
plt.imshow(np.array(df["data"].values.tolist()).astype('float'))
这将产生:
所以我的数据结构有点不寻常。这是我正在使用的示例:
import numpy as np
import pandas as pd
dict = {'data': [[1,2,3], [2,3,4], [3,4,5]], 'parameter': [10, 11, 12]}
df = pd.DataFrame(dict)
换句话说,df['data']
中的每一行都包含一个数组。
我需要使用 matplotlib 的 imshow()
函数绘制它,但我在使用 df['data']
中的数组时遇到困难。我试过使用 df['data'].to_numpy()
,但是这个 returns a dtype=object
,imshow 无法处理。尝试绘制时出现此错误:
TypeError: Image data of dtype object cannot be converted to float
准确地说,这是我尝试过的 运行:
import pylab as plt
plt.imshow(df['data'].to_numpy())
我四处阅读,似乎找不到任何人有类似的例子。
明确一点:我需要从 从 DataFrame 到 imshow,我不能直接从我的代码中的字典中绘制。我也不想对新列表进行任何附加操作,因为我的数据集很大并且会大大减慢速度。
编辑 1:
在评论中回答一个问题,这就是我想要的情节类型。 x 轴包含 df['data']
中的数组,而 y 轴最终将是 df['parameter']
。
编辑 2:
我想我需要进一步澄清我的问题。我正在寻找完全重现这个情节。
为了制作这个情节,我做了以下工作:
rows = []
for i in df['data']:
rows.append(i)
plt.imshow(rows)
此解决方案适用于我的数据,但我正在寻找一种更有效的方法来完成同样的事情。即,一种不涉及循环和追加的方法。
您可以执行以下操作:
使用 df.explode
取消列出 data
列到不同的行,然后绘图。
x = df.explode('data').reset_index()
plt.imshow(x[['data','parameter']].to_numpy().astype('float').T)
这将产生:
基本上,x[['data','parameter']].to_numpy().astype('float').T
会为您提供所需的 numpy 数组,您可以在其中随意绘制。
根据用户评论编辑:
plt.imshow(np.array(df["data"].values.tolist()).astype('float'))
这将产生: