将几个 "Response" 表示为嵌套字典的对象转换为 python 中的多维列表

Turn several "Response" objects represented as nested dicts into multi dimensional list in python

EDIT :我似乎无法弄清楚如何正确地遍历这个对象。我认为我索引的内容不正确,因为错误指出空白文本与我的日期时间转换格式不匹配。

下面是 响应对象之一的开头 ,它很长,所以我选择不包括整个内容。然而,在任何时候都没有违规行为,并继续遵循已启动的模式。请帮助我了解如何访问并仅遍历日期和后续信息。

{u'Meta Data': {u'1. Information': u'Daily Prices (open, high, low, close) and Volumes',
                u'2. Symbol': u'MSFT',
                u'3. Last Refreshed': u'2018-07-06',
                u'4. Output Size': u'Compact',
                u'5. Time Zone': u'US/Eastern'},
 u'Time Series (Daily)': {u'2018-02-13': {u'1. open': u'88.9300',
                                          u'2. high': u'90.0000',
                                          u'3. low': u'87.8000',
                                          u'4. close': u'89.8300',
                                          u'5. volume': u'26200053'},
                          u'2018-02-14': {u'1. open': u'88.5100',
                                          u'2. high': u'90.9900',
                                          u'3. low': u'88.4100',
                                          u'4. close': u'90.8100',
                                          u'5. volume': u'34314101'},
                          u'2018-02-15': {u'1. open': u'91.2100',
                                          u'2. high': u'92.7200',
                                          u'3. low': u'90.6200',
                                          u'4. close': u'92.6600',
                                          u'5. volume': u'27407914'},

我收到此错误,表明我在 dict 中解析不正确,我尝试了很多方法,但似乎无法理解。我相信这是获得这个程序的最后一个驼峰运行。 (最后)

ValueError: time data '' does not match format '%Y-%b-%d'

现在我尝试 更新 代码

import requests
import json

# Global Variables
url = "https://www.alphavantage.co/query"
function_type = "TIME_SERIES_DAILY"
api_key = "***********"
current_zero_time = ""
main_list = []
symbols = ["AAPL", "HPQ", "IBM", "AMZN", "MSFT", "GOOGL", "INTC", "CSCO", "ORCL", "OCOM"]


def get_data(symbol):
    global api_key
    global function_type
    request_data = {"function": function_type,
                    "symbol": symbol,
                    "apikey": api_key}
    data_dict = requests.get(url, params=request_data)
    return data_dict


def date_dif(date0, date1):
    from datetime import datetime
    d0_obj = datetime.strptime(date0, '%Y-%b-%d')
    d1_obj = datetime.strptime(date1, '%Y-%b-&d')
    return (d1_obj - d0_obj).days


def iterate_data(symbol):
    data_set = get_data(symbol)
    data_set = json.loads(data_set.text)
    global current_zero_time
    list_size = 0
    this_list = [list_size + 1]
    for p_date in data_set['Time Series (Daily)']:
        if current_zero_time is None:
            current_zero_time = p_date
            this_list[list_size] = 0
        else:
            t = date_dif(current_zero_time, p_date)
            this_list[list_size] = t
        list_size += list_size
        for key in p_date:
            this_list[list_size] = p_date[key]
            list_size += list_size
    return this_list


def make_list(stocks):
    global main_list
    for i in range(len(stocks)):
        this_list = iterate_data(symbols[i])
        main_list = main_list + this_list


make_list(symbols)
print(main_list)

评论有点多了。请记住,为了未来的读者,我们应该注意从中制作一个有用的 question/answer 对。也许在合理的时候(现在?),我们关闭对代码和相应问题的迭代并开始一个新的迭代。

到目前为止,我们已经介绍了 requests.get() returns Response object. To obtain the content read by the request, we need to access its text attribute. This text if a JSON representation, can be parsed by using json.loads()

现在对于当前出现的问题,您已将变量 current_zero_time 定义为 "",但首先调用 iterate_data() 将根据您的条件评估 current_zero_time is None成为 False (事实并非如此)。也许您想说 if not current_zero_time: ...?因此,您和向上调用 date_dif(),第一个参数是 ""(空字符串),strptime 无法解析为时间(->ValueError)。

说到 strptime。该格式化字符串似乎与您的(ISO 格式)日期不匹配。它应该是 "%Y-%m-%d"(将 b:月份名称替换为 m:月份编号)。第二行也有一个拼写错误 &d,而它应该是 %d。你会 运行 将这些作为第 3 和第 4 个问题 resp.

旁注:global 变量是(为简单起见)"evil" 并且最好尽可能避免(事实证明几乎总是如此)或者除非你有使用它们的真正充分理由(坦率地说,您很少应该使用它们)。它们打破了对范围的普遍理解,最终可能成为人们在访问它们时没有预料到的东西。案例到点子上。如果您已经完成 iterate_data()symbol 并为下一个再次调用它。下一次传递的初始值将是上一次传递的最后一个值。

以上信息应该可以解决您当前遇到的问题,并让您 运行 进入下一个问题。这是哪一行:

     for key in p_date:
        this_list[list_size] = p_date[key]

key 将是来自 pdate 的字符(例如,在第一次迭代中 "2")。这不是 p_date (a str) 的有效索引。不幸的是,我不太确定结果列表(或一般输出)应该是什么样子,因此我只能为下一步提供有限的输入。我的意思是:

    for key in p_date:
        this_list[list_size] = key

即迭代 p_date 中的字符并将它们作为值分配给 this_list[list_size];以及更改 None / "" 不匹配并修复这对 strptime 问题。您可以让脚本在没有失败的情况下完成执行...但是如上所述,可能仍然没有按照预期的方式执行。

无论如何,我至少可以提供一些有用的提示。为了更好地了解您的脚本在引发异常(例如您问题中的 ValueError )时所处的状态,或者只是四处闲逛。您可以在调试器中 运行 它。不要调用脚本 python ./script.py(或只是 ./script.py),而是使用 python -m pdb ./script.py。您可以 运行 您的程序,逐步执行它,检查堆栈帧,给定时间的变量值...键入 help 以获得基本帮助,键入 help COMNAND 以获得有关命令的更多信息。

第二个提示(在 global 变量之上)关于样式。所有导入通常都在 script/module 的顶部处理。事实上,PEP-8 and there are helpful tools like pylint 中有样式建议来检查您的代码。我之所以提到这一点,是因为一些错误和混乱几乎可以通过稍微清理一下而神奇地消失。 :)

关于你的问题的旁注/澄清:它被标记为 python-3.x,但你的字典中的字符串文字会另有建议。 u'' 文字是 Python 2 的东西。