如何将 python 的结果提取到 xls 文件中

How to Extract the result from python into a xls file

我是 python 的新手,我需要从科学文献中提取参考资料。以下是我使用的代码

from refextract import extract_references_from_url
references = extract_references_from_url('https://arxiv.org/pdf/1503.07589.pdf')
print(references)

所以,请指导我如何将打印的信息提取到 Xls 文件中。非常感谢。

您可以使用 pandas 库将引用写入 excel。

from refextract import extract_references_from_url
import pandas as pd

references = extract_references_from_url('https://arxiv.org/pdf/1503.07589.pdf')
print(references)

# convert to pandas dataframe
dfref = pd.DataFrame(references)

# write dataframe into excel
dfref.to_excel('./refs.xlsx')

您应该看看 xlsxwriter,一个用于创建 excel 文件的模块。 您的代码可能如下所示:

import xlsxwriter
from refextract import extract_references_from_url
workbook = xlsxwriter.Workbook('References.xlsx')
worksheet = workbook.add_worksheet()

references = extract_references_from_url('https://arxiv.org/pdf/1503.07589.pdf')

row = 0
col = 0

worksheet.write(references)

workbook.close

(根据https://xlsxwriter.readthedocs.io/tutorial01.html修改)

在查阅了 refextract here 的文档后,我发现您的变量 references 是一个字典。要将这样的字典转换为 python,您可以使用 Pandas,如下所示-

import pandas as pd
# create a pandas dataframe using a dictionary
df = pd.DataFrame(data=references, index=[0])
# Take transpose of the dataframe 
df = (df.T)
# write the dictionary to an excel file
df.to_excel('extracted_references.xlsx')