Python 根据列名和值解析 xlsx
Python parsing xlsx based on a column name and a value
我正在尝试解析以下文件的 xlsx:
输入图片描述 here.
import pandas as pd
import numpy as np
data = pd.read_excel ("test.xlsx")
ID = pd.DataFrame(data, columns= ['RUT23001E014'])
item_names = pd.DataFrame(data, columns= ['Riv'])
print("ID dataframe=",ID)
print("item names dataframe=",item_names)
print(ID.loc["1"])
我在这里尝试做的是仅 return 我的行,其中为名为“RUT23001E014”的列找到了数字“1”
我在这种情况下寻找的答案是这样的:
item 1 1
item 5 1
因为只有这两项被赋值为“1”。其他赋值为“0”的我不管。
我一直在查看 dataframe.loc 函数,但我无法完全弄清楚如何使用它来定位列中的特定值
更新********
MORE DETAILED TABLE
所以 RUTXXXXXXX 是序列号。每个序列号都分配有不同的项目组合。根据我正在进行的操作,我需要知道特定序列号附加到哪些项目和数量
将您的 item_names
行更改为此并尝试:
item_names = data[data['RUT23001E014'] == 1]
print(items_df)
您可以删除创建的行 ID
- 它没有用
我正在尝试解析以下文件的 xlsx: 输入图片描述 here.
import pandas as pd
import numpy as np
data = pd.read_excel ("test.xlsx")
ID = pd.DataFrame(data, columns= ['RUT23001E014'])
item_names = pd.DataFrame(data, columns= ['Riv'])
print("ID dataframe=",ID)
print("item names dataframe=",item_names)
print(ID.loc["1"])
我在这里尝试做的是仅 return 我的行,其中为名为“RUT23001E014”的列找到了数字“1”
我在这种情况下寻找的答案是这样的:
item 1 1
item 5 1
因为只有这两项被赋值为“1”。其他赋值为“0”的我不管。
我一直在查看 dataframe.loc 函数,但我无法完全弄清楚如何使用它来定位列中的特定值
更新********
MORE DETAILED TABLE
所以 RUTXXXXXXX 是序列号。每个序列号都分配有不同的项目组合。根据我正在进行的操作,我需要知道特定序列号附加到哪些项目和数量
将您的 item_names
行更改为此并尝试:
item_names = data[data['RUT23001E014'] == 1]
print(items_df)
您可以删除创建的行 ID
- 它没有用