我不明白为什么一个代码有效而另一个无效

I don't understand why one code works and the other doesn't

我尝试并排绘制一些家庭作业和测验分数,我有两组代码,它们对我来说非常相似,但一组并排生成两个直方图,而另一组则没有。

我 运行 我的代码在 Windows 上的 Anaconda python 3.6 环境中。下面的代码会设置问题

    data = pd.DataFrame( np.random.uniform(low = 0.0, high = 100, size = (224,3)))
    data.columns = ['Section', 'hw_score', 'quiz_score']

    data['Section'] = data['Section'].apply(get_section)
    data.head(10)


    data['hw_score'].fillna(0,inplace=True)
    data['quiz_score'].fillna(0,inplace=True)
    data.isnull().sum()

    data.hw_score[ data.hw_score > 0 ].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )

    data.quiz_score[data.quiz_score > 0].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )

我不确定为什么以下代码不能生成并排的直方图:

plt.figure( figsize = (15,6) )
plt.subplot(1,2,1)
fig = data.hist(column='hw_score')
fig.set_title('Homework Score')

plt.subplot(1,2,2)
fig = data.hist(column='quiz_score')
fig.set_title('Quiz Score')

以下是:

plt.figure( figsize = (15,6) )
plt.subplot(1,2,1)
fig = data.hw_score[ data.hw_score > 0 ].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
fig.set_title('Homework Score')

plt.subplot(1,2,2)
fig = data.quiz_score[data.quiz_score > 0].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
fig.set_title('Quiz Score')

在你的错误代码中 fig 是一个 numpy 数组,其中第零个元素是一个 AxesSubplot 对象。 pandas 文档 warn 关于那个。

它还告诉您可以将 ax 直接传递给 pandas.DataFrame.hist,我们可以像这样编辑您的错误代码:

fig = plt.figure( figsize = (15,6) )
ax = fig.add_subplot(1,2,1)
data.hist(column='hw_score', ax=ax)
ax.set_title('Homework Score')

ax = fig.add_subplot(1,2,2)
data.hist(column='quiz_score', ax=ax)
ax.set_title('Quiz Score')

plt.show()

注意变化:fig 现在是实际图形,ax 轴。 data.hist 的 return 类型是一个 numpy 轴数组,但我们不需要它并且可以决定不将它存储在任何地方。

编辑: 所以你接着问为什么其他代码块 DID 工作。简而言之,这是因为 pandas 开发者喜欢为 pandas.DataFramepandas.Series 实现方法。所以,当你打电话时:

fig = data.hw_score[ data.hw_score > 0 ].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )

data.hw_score[ data.hw_score > 0 ] 是一个 pandas.Series。查看 pandas.Series.histdocs,没有关于有时 returning 一个 numpy 数组的警告,就像 pandas.DataFrame.hist.

因为它不是 return 包装在数组中的对象,我们不需要采取任何特殊措施来访问 AxesSubplot 对象。