我不明白为什么一个代码有效而另一个无效
I don't understand why one code works and the other doesn't
我尝试并排绘制一些家庭作业和测验分数,我有两组代码,它们对我来说非常相似,但一组并排生成两个直方图,而另一组则没有。
我 运行 我的代码在 Windows 上的 Anaconda python 3.6 环境中。下面的代码会设置问题
data = pd.DataFrame( np.random.uniform(low = 0.0, high = 100, size = (224,3)))
data.columns = ['Section', 'hw_score', 'quiz_score']
data['Section'] = data['Section'].apply(get_section)
data.head(10)
data['hw_score'].fillna(0,inplace=True)
data['quiz_score'].fillna(0,inplace=True)
data.isnull().sum()
data.hw_score[ data.hw_score > 0 ].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
data.quiz_score[data.quiz_score > 0].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
我不确定为什么以下代码不能生成并排的直方图:
plt.figure( figsize = (15,6) )
plt.subplot(1,2,1)
fig = data.hist(column='hw_score')
fig.set_title('Homework Score')
plt.subplot(1,2,2)
fig = data.hist(column='quiz_score')
fig.set_title('Quiz Score')
以下是:
plt.figure( figsize = (15,6) )
plt.subplot(1,2,1)
fig = data.hw_score[ data.hw_score > 0 ].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
fig.set_title('Homework Score')
plt.subplot(1,2,2)
fig = data.quiz_score[data.quiz_score > 0].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
fig.set_title('Quiz Score')
在你的错误代码中 fig
是一个 numpy 数组,其中第零个元素是一个 AxesSubplot
对象。 pandas
文档 warn 关于那个。
它还告诉您可以将 ax
直接传递给 pandas.DataFrame.hist
,我们可以像这样编辑您的错误代码:
fig = plt.figure( figsize = (15,6) )
ax = fig.add_subplot(1,2,1)
data.hist(column='hw_score', ax=ax)
ax.set_title('Homework Score')
ax = fig.add_subplot(1,2,2)
data.hist(column='quiz_score', ax=ax)
ax.set_title('Quiz Score')
plt.show()
注意变化:fig
现在是实际图形,ax
轴。 data.hist
的 return 类型是一个 numpy 轴数组,但我们不需要它并且可以决定不将它存储在任何地方。
编辑: 所以你接着问为什么其他代码块 DID 工作。简而言之,这是因为 pandas
开发者喜欢为 pandas.DataFrame
和 pandas.Series
实现方法。所以,当你打电话时:
fig = data.hw_score[ data.hw_score > 0 ].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
data.hw_score[ data.hw_score > 0 ]
是一个 pandas.Series
。查看 pandas.Series.hist
的 docs,没有关于有时 returning 一个 numpy
数组的警告,就像 pandas.DataFrame.hist
.
因为它不是 return 包装在数组中的对象,我们不需要采取任何特殊措施来访问 AxesSubplot
对象。
我尝试并排绘制一些家庭作业和测验分数,我有两组代码,它们对我来说非常相似,但一组并排生成两个直方图,而另一组则没有。
我 运行 我的代码在 Windows 上的 Anaconda python 3.6 环境中。下面的代码会设置问题
data = pd.DataFrame( np.random.uniform(low = 0.0, high = 100, size = (224,3)))
data.columns = ['Section', 'hw_score', 'quiz_score']
data['Section'] = data['Section'].apply(get_section)
data.head(10)
data['hw_score'].fillna(0,inplace=True)
data['quiz_score'].fillna(0,inplace=True)
data.isnull().sum()
data.hw_score[ data.hw_score > 0 ].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
data.quiz_score[data.quiz_score > 0].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
我不确定为什么以下代码不能生成并排的直方图:
plt.figure( figsize = (15,6) )
plt.subplot(1,2,1)
fig = data.hist(column='hw_score')
fig.set_title('Homework Score')
plt.subplot(1,2,2)
fig = data.hist(column='quiz_score')
fig.set_title('Quiz Score')
以下是:
plt.figure( figsize = (15,6) )
plt.subplot(1,2,1)
fig = data.hw_score[ data.hw_score > 0 ].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
fig.set_title('Homework Score')
plt.subplot(1,2,2)
fig = data.quiz_score[data.quiz_score > 0].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
fig.set_title('Quiz Score')
在你的错误代码中 fig
是一个 numpy 数组,其中第零个元素是一个 AxesSubplot
对象。 pandas
文档 warn 关于那个。
它还告诉您可以将 ax
直接传递给 pandas.DataFrame.hist
,我们可以像这样编辑您的错误代码:
fig = plt.figure( figsize = (15,6) )
ax = fig.add_subplot(1,2,1)
data.hist(column='hw_score', ax=ax)
ax.set_title('Homework Score')
ax = fig.add_subplot(1,2,2)
data.hist(column='quiz_score', ax=ax)
ax.set_title('Quiz Score')
plt.show()
注意变化:fig
现在是实际图形,ax
轴。 data.hist
的 return 类型是一个 numpy 轴数组,但我们不需要它并且可以决定不将它存储在任何地方。
编辑: 所以你接着问为什么其他代码块 DID 工作。简而言之,这是因为 pandas
开发者喜欢为 pandas.DataFrame
和 pandas.Series
实现方法。所以,当你打电话时:
fig = data.hw_score[ data.hw_score > 0 ].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
data.hw_score[ data.hw_score > 0 ]
是一个 pandas.Series
。查看 pandas.Series.hist
的 docs,没有关于有时 returning 一个 numpy
数组的警告,就像 pandas.DataFrame.hist
.
因为它不是 return 包装在数组中的对象,我们不需要采取任何特殊措施来访问 AxesSubplot
对象。