Python 根据列名和值解析 xlsx

Python parsing xlsx based on a column name and a value

我正在尝试解析以下文件的 xlsx: 输入图片描述 here.

import pandas as pd
import numpy as np


data = pd.read_excel ("test.xlsx") 

ID = pd.DataFrame(data, columns= ['RUT23001E014'])
item_names = pd.DataFrame(data, columns= ['Riv'])
print("ID dataframe=",ID)
print("item names dataframe=",item_names)
print(ID.loc["1"])

我在这里尝试做的是仅 return 我的行,其中为名为“RUT23001E014”的列找到了数字“1”

我在这种情况下寻找的答案是这样的:

item 1 1
item 5 1

因为只有这两项被赋值为“1”。其他赋值为“0”的我不管。

我一直在查看 dataframe.loc 函数,但我无法完全弄清楚如何使用它来定位列中的特定值

更新********

MORE DETAILED TABLE

所以 RUTXXXXXXX 是序列号。每个序列号都分配有不同的项目组合。根据我正在进行的操作,我需要知道特定序列号附加到哪些项目和数量

将您的 item_names 行更改为此并尝试:

item_names = data[data['RUT23001E014'] == 1]
print(items_df)

您可以删除创建的行 ID - 它没有用