Python 从 xlrd 创建的列表中删除 'text'

Python remove 'text' from lists made by xlrd

我使用 xlrd 读取了三列的每个单元格以制作三个列表。然后,我将所有三个列表的第 i 个元素附加到一个新列表中,创建一个新的列表列表。

search_terms=[]
for row in range(0, book.nrows):
    search_terms.append([med_name[row], med_school[row], mentor[row]])
print(*search_terms[0:15], sep='\n')
[text:'Andrew Burkeland', 'Weill Cornell Medical College', 'Dave Cutler ']
[text:'Andrew Pence', 'University of Alabama at Birmingham School of Medicine', 'Jack Warran ']

有没有办法取出'text:'?我将 search_terms 中的每个列表输入 Entrez.egquery 以搜索 pubmed 上的结果,并且在查询行中使用 'text:',我一直得到 0 个结果。

让我们假设一个简单的 table 称为 'students.xlsx'

Student     School     Mentor
John Doe    Harvard    Kornberg
Jane Done   Stanford   Pauling

现在用xlrd

打开它
import xlrd
xl_workbook = xlrd.open_workbook('students.xlsx')
xl_sheet = xl_workbook.sheet_by_index(0)
row = xl_sheet.row(1)

现在让我们看看各个部分

print(row)

[text:'John Doe', text:'Harvard', text:'Kornberg']

print(row[0])

text:'John Doe'

print(row[0].value)

'John Doe'

问题是 row[0]xlrd cell 而不是字符串,这就是为什么需要通过 value.

获取内容的原因

现在让我们对所有行(header 除外)执行此操作:

raw_data = list()
for row in range(1, xl_sheet.nrows):
    raw_data.append(xl_sheet.row(row))

author_list = list()
for raw in raw_data:
    author_list.append(list())
    for r in raw:
        author_list[-1].append(r.value)
print(author_list)
> [['John Doe', 'Harvard', 'Kornberg'], ['Jane Done', 'Stanford',
> 'Pauling']]

或简称:

author_list = [[c.value for c in xl_sheet.row(n)] for n in range(1, xl_sheet.nrows)]