使用 python 从 wix 获取数据(文本)
Using python to get data (text) from wix
我正在制作一个 python 项目,我在其中创建了一个测试 Wix 网站。
我想使用 urllib 从 wix 网站获取数据(文本)
所以我做了
url.urlopen(地址).readlines()
问题是它没有从页面中的文本中给我任何信息,只提供有关 HTML 中页面结构的信息。
我如何从网站中提取请求的文本信息?
我想您最终需要解析 html 以获得您想要的信息。查看这个 python 库:
https://docs.python.org/3/library/html.parser.html
您可以这样做:
from html.parser import HTMLParser
rel_data = []
class MyHTMLParser(HTMLParser):
def handle_data(self, data):
rel_data.append(data)
parser = MyHTMLParser()
parser.feed('<html><head><title>Test</title></head>'
'<body><h1>Parse me!</h1></body></html>')
print(rel_data)
输出
["Test", "Parse me!"]
我正在制作一个 python 项目,我在其中创建了一个测试 Wix 网站。 我想使用 urllib 从 wix 网站获取数据(文本) 所以我做了 url.urlopen(地址).readlines() 问题是它没有从页面中的文本中给我任何信息,只提供有关 HTML 中页面结构的信息。 我如何从网站中提取请求的文本信息?
我想您最终需要解析 html 以获得您想要的信息。查看这个 python 库:
https://docs.python.org/3/library/html.parser.html
您可以这样做:
from html.parser import HTMLParser
rel_data = []
class MyHTMLParser(HTMLParser):
def handle_data(self, data):
rel_data.append(data)
parser = MyHTMLParser()
parser.feed('<html><head><title>Test</title></head>'
'<body><h1>Parse me!</h1></body></html>')
print(rel_data)
输出
["Test", "Parse me!"]