使用 BS4 解析页面中的文本

Question

在页面 https://bittrex.com/api/v2.0/pub/Markets/GetMarketSummaries 上，我正在尝试解析随请求提取的文本。我用来提取文本的代码在这里

import requests
from bs4 import BeautifulSoup

link = 'https://bittrex.com/api/v2.0/pub/Markets/GetMarketSummaries'
html = requests.get('https://bittrex.com/api/v2.0/pub/Markets/GetMarketSummaries').text
print(html)

我可以轻松地从页面中提取所有文本，但现在我想用 bs4 解析它，以便它只获取特定货币的数字，例如 ADX 或 ADT。（显示为"MarketCurrency":"ADX"）我希望它能够从页面中找到诸如 High、Low、Volume 和 Last 之类的信息，而无需提取所有其他垃圾。因此，例如，我输入了我想要的货币代码，例如：ADX，然后它解析该文本并仅打印当天的最高价、最低价、交易量和最后一天的数字。感谢您的帮助！

Answer 1

事实上，你已经很接近了。正如评论所说，输出不是 HTML，而是 JSON。幸运的是 python 有一些很好的内置功能。以下代码将从站点输出的 JSON 文本解析为本机 python 字典 (json_dict)。

import requests
import json

link = 'https://bittrex.com/api/v2.0/pub/Markets/GetMarketSummaries'
raw_json = requests.get('https://bittrex.com/api/v2.0/pub/Markets/GetMarketSummaries').text
json_dict = json.loads(raw_json)
print(json_dict)

使用 BS4 解析页面中的文本

Parsing Text From Page WIth BS4

python

beautifulsoup

python-requests

bs4