挣扎于基本的数据帧操作(Python)

Struggling with basic dataframe manipulation (Python)

我是 Python 的新手,尽管用 Google 搜索了很长一段时间,但我仍在苦苦挣扎。我知道这不应该这么困难。我有一个名为 abc 的数据框,如下所示:

   PO_DATE      PO_ITEM_NUMBER     PO_PRICE       PO_QTY
----------------------------------------------------------------
0  01/15/2017   ABC123             1.55           1000
1  01/25/2017   DEF456             5.55           500

我知道最大值 PO_PRICE = 5.55,我可以使用以下方法找到它:

max_PO_Price = abc["PO_PRICE"].max()

我想要做的就是确定哪一行的最大值为 PO_PRICE,找到该行的 PO_QTY 字段,然后将其减 100。我一直想设想这个dataframe 是一个二维数组,但是,它不喜欢那样,而且我知道它不是一个数组,因为涉及不同的数据类型。我已经搞砸了太久了,所以,最后决定 post。我希望有人能原谅我的知识不足并指出正确的方向。

谢谢。

你应该可以这样做:

index_max=abc.loc[abc["PO_price"]==abc["PO_price"].max()].index
for i in index_max
  abc.at[i,"PO_QTY"]=abc[i,"PO_QTY"]-100

我想你想要:

abc.loc[abc.PO_PRICE == abc["PO_PRICE"].max(), ['PO_QTY']] = abc['PO_QTY']-100

下面的例子:

# Import pandas
import pandas as pd

# Create dataframe from example and priunt
abc = pd.DataFrame({'PO_Date':['01/15/2017', '01/25/2017'], 'PO_ITEM_NUMBER': ['ABC123', 'DEF456'], 'PO_PRICE':[1.55, 5.55], 'PO_QTY':[1000, 500]})
print(abc)

# Find which row has the max PO Price, and then subtract the quantity by 100
abc.loc[abc.PO_PRICE == abc['PO_PRICE'].max(), ['PO_QTY']] = abc['PO_QTY']-100

# Print it out
print(abc)

产量:

      PO_Date PO_ITEM_NUMBER  PO_PRICE  PO_QTY
0  01/15/2017         ABC123      1.55    1000
1  01/25/2017         DEF456      5.55     500

      PO_Date PO_ITEM_NUMBER  PO_PRICE  PO_QTY
0  01/15/2017         ABC123      1.55    1000
1  01/25/2017         DEF456      5.55     400

你应该考虑看看 at this post, which my answer was influenced from. Additionally, the documentation on .loc 可能会有帮助。