从 for Google Colab 的结果创建 CSV

Create CSV from result of a for Google Colab

我正在使用维基数据查询服务来获取值,这是代码:

pip install sparqlwrapper

import sys
from SPARQLWrapper import SPARQLWrapper, JSON

endpoint_url = "https://query.wikidata.org/sparql"

query = """#List of organizations 

SELECT ?org ?orgLabel
WHERE
{
  ?org wdt:P31 wd:Q4830453. #instance of organizations
  ?org wdt:P17 wd:Q96. #Mexico country

  SERVICE wikibase:label { bd:serviceParam wikibase:language "en"}
}"""


def get_results(endpoint_url, query):
    user_agent = "WDQS-example Python/%s.%s" % (sys.version_info[0], sys.version_info[1])
    # TODO adjust user agent; see https://w.wiki/CX6
    sparql = SPARQLWrapper(endpoint_url, agent=user_agent)
    sparql.setQuery(query)
    sparql.setReturnFormat(JSON)
    return sparql.query().convert()

results = get_results(endpoint_url, query)

for result in results["results"]["bindings"]:
    print(result)

此代码为我提供了我需要的数据,但我在尝试使用此行获取此信息时遇到问题:

results.to_csv('results.csv', index=False)

出现此错误:

'dict' object has no attribute 'to_csv'

我导入 pandas 和 numpy 来执行此操作,但我仍然遇到问题,所以我想知道如何将此结果转换为一种格式,以便使用获得的数据创建我的 csv 文件。

这里有一些截图。

results 是一个 dictionary,这是一个 python 数据结构,您不能在其上调用方法 to_csv

为了安全地存储来自 python 字典的 csv,您可以使用外部库(另请参阅 python.org 上的 documentation)。

具体的解决方案取决于您确切想要导出的(元)数据。在下文中,我假设您要为 orgorgLabel.

存储 value
import csv
bindings = results['results']['bindings']
sparqlVars = ['org', 'orgLabel']
metaAttribute = 'value'
with open('results.csv', 'w', newline='') as csvfile :
    writer = csv.DictWriter(csvfile, fieldnames=sparqlVars)
    writer.writeheader()
    for b in bindings :
        writer.writerow({var:b[var][metaAttribute] for var in sparqlVars})

输出为:

org,orgLabel
http://www.wikidata.org/entity/Q47099,"Grupo Televisa, owner of TelevisaUnivision"
http://www.wikidata.org/entity/Q429380,Aeropuertos y Servicios Auxiliares
http://www.wikidata.org/entity/Q482267,América Móvil
...

作为 https://github.com/WolfgangFahl/pyLoDStorage

我要指出的是,pyLodStorage 的 SPARQL class 明确用于简化到其他格式的转换。

pip install pyLodStorage
sparqlquery --query 'SELECT ?org ?orgLabel
WHERE
{
  ?org wdt:P31 wd:Q4830453. #instance of organizations
  ?org wdt:P17 wd:Q96. #Mexico country

  SERVICE wikibase:label { bd:serviceParam wikibase:language "en"}
}' --format csv

结果:

"org","orgLabel"
"http://www.wikidata.org/entity/Q47099","Grupo Televisa, owner of TelevisaUnivision"
"http://www.wikidata.org/entity/Q482267","América Móvil"
"http://www.wikidata.org/entity/Q515411","Q515411"
"http://www.wikidata.org/entity/Q521673","Grupo Modelo"

当然,您可以直接通过 python API 获得相同的结果:

from lodstorage.sparql import SPARQL
from lodstorage.csv import CSV

sparqlQuery="""SELECT ?org ?orgLabel
WHERE
{
  ?org wdt:P31 wd:Q4830453. #instance of organizations
  ?org wdt:P17 wd:Q96. #Mexico country

  SERVICE wikibase:label { bd:serviceParam wikibase:language "en"}
}"""
        sparql=SPARQL("https://query.wikidata.org/sparql")
        qlod=sparql.queryAsListOfDicts(sparqlQuery)
        csv=CSV.toCSV(qlod)
        print(csv)