如何使用 python 从网站获取文本数据并存储为 excel 文件
how to fetch text data from website and storing as excel file using python
我想创建一个脚本来获取以下网站中的所有数据:https://www.bis.doc.gov/dpl/dpl.txt 并将其存储在 excel 文件中并计算其中的记录数,使用 python 语言。我试图通过将代码实现为:
import requests
import re
from bs4 import BeautifulSoup
URL = "https://www.bis.doc.gov/dpl/dpl.txt"
page = requests.get(URL)
soup = BeautifulSoup(page.text, "lxml")
print(soup)
我已经获取了数据,但不知道下一步将其存储为 excel 文件。任何人都请指导或分享您的宝贵想法。提前致谢!
您可以使用 pandas 轻松完成。由于数据是制表符分隔值。
注意:openpyxl
需要安装才能运行。
import requests
import io
import pandas as pd
URL = "https://www.bis.doc.gov/dpl/dpl.txt"
page = requests.get(URL)
df = pd.read_csv(io.StringIO(page.text), sep="\t")
df.to_excel(r'i_data.xlsx', index = False)
我想创建一个脚本来获取以下网站中的所有数据:https://www.bis.doc.gov/dpl/dpl.txt 并将其存储在 excel 文件中并计算其中的记录数,使用 python 语言。我试图通过将代码实现为:
import requests
import re
from bs4 import BeautifulSoup
URL = "https://www.bis.doc.gov/dpl/dpl.txt"
page = requests.get(URL)
soup = BeautifulSoup(page.text, "lxml")
print(soup)
我已经获取了数据,但不知道下一步将其存储为 excel 文件。任何人都请指导或分享您的宝贵想法。提前致谢!
您可以使用 pandas 轻松完成。由于数据是制表符分隔值。
注意:openpyxl
需要安装才能运行。
import requests
import io
import pandas as pd
URL = "https://www.bis.doc.gov/dpl/dpl.txt"
page = requests.get(URL)
df = pd.read_csv(io.StringIO(page.text), sep="\t")
df.to_excel(r'i_data.xlsx', index = False)