Python:字符串列表,如果找到则更改字符颜色(使用 xlsxwriter)

Python: list of strings, change color of character if found (using xlsxwriter)

我有几个列表正在使用 python 2.7 中的 xlsxwriter 写入 excel 电子表格的不同 columns/rows。对于一个字符串列表(DNA序列),我想在字符串中找到某些字符('a'、't'、'c'、'g'),改变它们各自的颜色,然后将完整的字符串列表(彩色字符串,每个字符)写入电子表格中的一列。

到目前为止我写的代码是:

row = 1
col = 1
for i in (seqs):
    worksheet.write(row,1,i,green)
    for char in i:
        if i.__contains__("A") or i.__contains__("T") :
            worksheet.write(row,1,i[char],red)
row += 1

其中 seqs 是我的序列列表。我希望 A/T 为红色,G/C 为绿色,并将完整序列写入电子表格。我没有收到任何错误,但我要么用绿色在 excel 中每行写下整个序列,要么在红色中每行写一个字符。有什么方法可以使 this/get 这段代码正常工作吗?

您可以使用 XlsxWriter 的 write_rich_string() 方法来完成此操作。

这是一个小的工作示例:

from xlsxwriter.workbook import Workbook

workbook = Workbook('sequences.xlsx')
worksheet = workbook.add_worksheet()

red = workbook.add_format({'color': 'red'})
green = workbook.add_format({'color': 'green'})

sequences = [
    'ACAAGATG',
    'CCATTGTC',
    'CCCCGGCC',
    'CCTGCTGC',
    'GCTGCTCT',
    'CGGGGCCA',
    'GGCCACCG',
]

worksheet.set_column('A:A', 40)

for row_num, sequence in enumerate(sequences):

    format_pairs = []

    # Get each DNA base character from the sequence.
    for base in sequence.upper():

        # Prefix each base with a format.
        if base == 'A' or base == 'T':
            format_pairs.extend((red, base))

        elif base == 'G' or base == 'C':
            format_pairs.extend((green, base))

        else:
            # Non base characters are unformatted.
            format_pairs.append(base)

    worksheet.write_rich_string(row_num, 0, *format_pairs)

workbook.close()

输出: