从 Pandas 数据框中获取特定元素
Getting a specific element from a Pandas Dataframe
这可能是个菜鸟问题,但我一直没能找到答案。
我正在尝试使用 pandas 从 Yahoo Finance 收集一些数据。
from pandas_datareader import data
tickers = ['EQNR.OL','BP','CL=F']
start_date = '2001-01-02'
end_date = '2021-02-26'
panel_data = data.DataReader(tickers, 'yahoo', start_date, end_date)
我想看看 BP 股票(我需要所有 3 个,所以从 tickers
中排除 EQNR.OL 和 CL=F 不是正确的解决方案)。我知道如何获取单个股票的所有收盘价:
close_BP = panel_data['Close','BP']
但是有没有一种方法可以从 'panel_data' 中提取所有 BP 数据(开盘价、收盘价、最高价、最低价),而不仅仅是像 'close' 这样的特定列?
我在想 BP = panel_data[:,'BP']
或 BP = panel_data.loc[:,'BP']
之类的东西,但它不起作用。
提前致谢。
您可以交换多列,然后使用 loc 提取它们。
panel_data = panel_data.swaplevel(axis=1)
panel_data.loc[:, ('BP',)]
Attributes Adj Close Close High Low Open Volume
Date
2021-01-04 20.551737 20.830000 21.129999 20.549999 21.090000 14485100.0
2021-01-05 22.081030 22.379999 22.780001 21.370001 21.430000 25447500.0
2021-01-06 23.097271 23.410000 23.860001 22.940001 23.370001 25221400.0
2021-01-07 23.590591 23.910000 24.150000 23.500000 23.719999 16470700.0
2021-01-08 24.074045 24.400000 24.490000 23.990000 24.170000 20189600.0
...
我想你要找的是pandas.IndexSlice...
import pandas as pd
panel_data.loc[:, pd.IndexSlice[:, 'BP']]
这可能是个菜鸟问题,但我一直没能找到答案。
我正在尝试使用 pandas 从 Yahoo Finance 收集一些数据。
from pandas_datareader import data
tickers = ['EQNR.OL','BP','CL=F']
start_date = '2001-01-02'
end_date = '2021-02-26'
panel_data = data.DataReader(tickers, 'yahoo', start_date, end_date)
我想看看 BP 股票(我需要所有 3 个,所以从 tickers
中排除 EQNR.OL 和 CL=F 不是正确的解决方案)。我知道如何获取单个股票的所有收盘价:
close_BP = panel_data['Close','BP']
但是有没有一种方法可以从 'panel_data' 中提取所有 BP 数据(开盘价、收盘价、最高价、最低价),而不仅仅是像 'close' 这样的特定列?
我在想 BP = panel_data[:,'BP']
或 BP = panel_data.loc[:,'BP']
之类的东西,但它不起作用。
提前致谢。
您可以交换多列,然后使用 loc 提取它们。
panel_data = panel_data.swaplevel(axis=1)
panel_data.loc[:, ('BP',)]
Attributes Adj Close Close High Low Open Volume
Date
2021-01-04 20.551737 20.830000 21.129999 20.549999 21.090000 14485100.0
2021-01-05 22.081030 22.379999 22.780001 21.370001 21.430000 25447500.0
2021-01-06 23.097271 23.410000 23.860001 22.940001 23.370001 25221400.0
2021-01-07 23.590591 23.910000 24.150000 23.500000 23.719999 16470700.0
2021-01-08 24.074045 24.400000 24.490000 23.990000 24.170000 20189600.0
...
我想你要找的是pandas.IndexSlice...
import pandas as pd
panel_data.loc[:, pd.IndexSlice[:, 'BP']]