Python:字符串列表,如果找到则更改字符颜色(使用 xlsxwriter)
Python: list of strings, change color of character if found (using xlsxwriter)
我有几个列表正在使用 python 2.7 中的 xlsxwriter 写入 excel 电子表格的不同 columns/rows。对于一个字符串列表(DNA序列),我想在字符串中找到某些字符('a'、't'、'c'、'g'),改变它们各自的颜色,然后将完整的字符串列表(彩色字符串,每个字符)写入电子表格中的一列。
到目前为止我写的代码是:
row = 1
col = 1
for i in (seqs):
worksheet.write(row,1,i,green)
for char in i:
if i.__contains__("A") or i.__contains__("T") :
worksheet.write(row,1,i[char],red)
row += 1
其中 seqs 是我的序列列表。我希望 A/T 为红色,G/C 为绿色,并将完整序列写入电子表格。我没有收到任何错误,但我要么用绿色在 excel 中每行写下整个序列,要么在红色中每行写一个字符。有什么方法可以使 this/get 这段代码正常工作吗?
您可以使用 XlsxWriter 的 write_rich_string()
方法来完成此操作。
这是一个小的工作示例:
from xlsxwriter.workbook import Workbook
workbook = Workbook('sequences.xlsx')
worksheet = workbook.add_worksheet()
red = workbook.add_format({'color': 'red'})
green = workbook.add_format({'color': 'green'})
sequences = [
'ACAAGATG',
'CCATTGTC',
'CCCCGGCC',
'CCTGCTGC',
'GCTGCTCT',
'CGGGGCCA',
'GGCCACCG',
]
worksheet.set_column('A:A', 40)
for row_num, sequence in enumerate(sequences):
format_pairs = []
# Get each DNA base character from the sequence.
for base in sequence.upper():
# Prefix each base with a format.
if base == 'A' or base == 'T':
format_pairs.extend((red, base))
elif base == 'G' or base == 'C':
format_pairs.extend((green, base))
else:
# Non base characters are unformatted.
format_pairs.append(base)
worksheet.write_rich_string(row_num, 0, *format_pairs)
workbook.close()
输出:
我有几个列表正在使用 python 2.7 中的 xlsxwriter 写入 excel 电子表格的不同 columns/rows。对于一个字符串列表(DNA序列),我想在字符串中找到某些字符('a'、't'、'c'、'g'),改变它们各自的颜色,然后将完整的字符串列表(彩色字符串,每个字符)写入电子表格中的一列。
到目前为止我写的代码是:
row = 1
col = 1
for i in (seqs):
worksheet.write(row,1,i,green)
for char in i:
if i.__contains__("A") or i.__contains__("T") :
worksheet.write(row,1,i[char],red)
row += 1
其中 seqs 是我的序列列表。我希望 A/T 为红色,G/C 为绿色,并将完整序列写入电子表格。我没有收到任何错误,但我要么用绿色在 excel 中每行写下整个序列,要么在红色中每行写一个字符。有什么方法可以使 this/get 这段代码正常工作吗?
您可以使用 XlsxWriter 的 write_rich_string()
方法来完成此操作。
这是一个小的工作示例:
from xlsxwriter.workbook import Workbook
workbook = Workbook('sequences.xlsx')
worksheet = workbook.add_worksheet()
red = workbook.add_format({'color': 'red'})
green = workbook.add_format({'color': 'green'})
sequences = [
'ACAAGATG',
'CCATTGTC',
'CCCCGGCC',
'CCTGCTGC',
'GCTGCTCT',
'CGGGGCCA',
'GGCCACCG',
]
worksheet.set_column('A:A', 40)
for row_num, sequence in enumerate(sequences):
format_pairs = []
# Get each DNA base character from the sequence.
for base in sequence.upper():
# Prefix each base with a format.
if base == 'A' or base == 'T':
format_pairs.extend((red, base))
elif base == 'G' or base == 'C':
format_pairs.extend((green, base))
else:
# Non base characters are unformatted.
format_pairs.append(base)
worksheet.write_rich_string(row_num, 0, *format_pairs)
workbook.close()
输出: