挣扎于基本的数据帧操作(Python)
Struggling with basic dataframe manipulation (Python)
我是 Python 的新手,尽管用 Google 搜索了很长一段时间,但我仍在苦苦挣扎。我知道这不应该这么困难。我有一个名为 abc 的数据框,如下所示:
PO_DATE PO_ITEM_NUMBER PO_PRICE PO_QTY
----------------------------------------------------------------
0 01/15/2017 ABC123 1.55 1000
1 01/25/2017 DEF456 5.55 500
我知道最大值 PO_PRICE = 5.55,我可以使用以下方法找到它:
max_PO_Price = abc["PO_PRICE"].max()
我想要做的就是确定哪一行的最大值为 PO_PRICE,找到该行的 PO_QTY 字段,然后将其减 100。我一直想设想这个dataframe 是一个二维数组,但是,它不喜欢那样,而且我知道它不是一个数组,因为涉及不同的数据类型。我已经搞砸了太久了,所以,最后决定 post。我希望有人能原谅我的知识不足并指出正确的方向。
谢谢。
你应该可以这样做:
index_max=abc.loc[abc["PO_price"]==abc["PO_price"].max()].index
for i in index_max
abc.at[i,"PO_QTY"]=abc[i,"PO_QTY"]-100
我想你想要:
abc.loc[abc.PO_PRICE == abc["PO_PRICE"].max(), ['PO_QTY']] = abc['PO_QTY']-100
下面的例子:
# Import pandas
import pandas as pd
# Create dataframe from example and priunt
abc = pd.DataFrame({'PO_Date':['01/15/2017', '01/25/2017'], 'PO_ITEM_NUMBER': ['ABC123', 'DEF456'], 'PO_PRICE':[1.55, 5.55], 'PO_QTY':[1000, 500]})
print(abc)
# Find which row has the max PO Price, and then subtract the quantity by 100
abc.loc[abc.PO_PRICE == abc['PO_PRICE'].max(), ['PO_QTY']] = abc['PO_QTY']-100
# Print it out
print(abc)
产量:
PO_Date PO_ITEM_NUMBER PO_PRICE PO_QTY
0 01/15/2017 ABC123 1.55 1000
1 01/25/2017 DEF456 5.55 500
PO_Date PO_ITEM_NUMBER PO_PRICE PO_QTY
0 01/15/2017 ABC123 1.55 1000
1 01/25/2017 DEF456 5.55 400
你应该考虑看看 at this post, which my answer was influenced from. Additionally, the documentation on .loc 可能会有帮助。
我是 Python 的新手,尽管用 Google 搜索了很长一段时间,但我仍在苦苦挣扎。我知道这不应该这么困难。我有一个名为 abc 的数据框,如下所示:
PO_DATE PO_ITEM_NUMBER PO_PRICE PO_QTY
----------------------------------------------------------------
0 01/15/2017 ABC123 1.55 1000
1 01/25/2017 DEF456 5.55 500
我知道最大值 PO_PRICE = 5.55,我可以使用以下方法找到它:
max_PO_Price = abc["PO_PRICE"].max()
我想要做的就是确定哪一行的最大值为 PO_PRICE,找到该行的 PO_QTY 字段,然后将其减 100。我一直想设想这个dataframe 是一个二维数组,但是,它不喜欢那样,而且我知道它不是一个数组,因为涉及不同的数据类型。我已经搞砸了太久了,所以,最后决定 post。我希望有人能原谅我的知识不足并指出正确的方向。
谢谢。
你应该可以这样做:
index_max=abc.loc[abc["PO_price"]==abc["PO_price"].max()].index
for i in index_max
abc.at[i,"PO_QTY"]=abc[i,"PO_QTY"]-100
我想你想要:
abc.loc[abc.PO_PRICE == abc["PO_PRICE"].max(), ['PO_QTY']] = abc['PO_QTY']-100
下面的例子:
# Import pandas
import pandas as pd
# Create dataframe from example and priunt
abc = pd.DataFrame({'PO_Date':['01/15/2017', '01/25/2017'], 'PO_ITEM_NUMBER': ['ABC123', 'DEF456'], 'PO_PRICE':[1.55, 5.55], 'PO_QTY':[1000, 500]})
print(abc)
# Find which row has the max PO Price, and then subtract the quantity by 100
abc.loc[abc.PO_PRICE == abc['PO_PRICE'].max(), ['PO_QTY']] = abc['PO_QTY']-100
# Print it out
print(abc)
产量:
PO_Date PO_ITEM_NUMBER PO_PRICE PO_QTY
0 01/15/2017 ABC123 1.55 1000
1 01/25/2017 DEF456 5.55 500
PO_Date PO_ITEM_NUMBER PO_PRICE PO_QTY
0 01/15/2017 ABC123 1.55 1000
1 01/25/2017 DEF456 5.55 400
你应该考虑看看 at this post, which my answer was influenced from. Additionally, the documentation on .loc 可能会有帮助。