如何从核苷酸生成 IUPAC 代码?
How to generate IUPAC code from nucleotides?
我想找到相当于 2 个不同核苷酸的 IUPAC。
示例:我有 A 和 C,我想要 M。
或者:我有R和T,我想要D。
在 Biopython 中有这样做的方法吗? (这听起来很简单,但我只找到了使用对齐来做到这一点的方法,这对我来说不合适。)
谢谢!
我认为您正在寻找 Bio.Data.IUPACData
中的词典,例如:
>>> from Bio.Data import IUPACData
>>> d = {v:k for k,v in IUPACData.ambiguous_dna_values.items()}
>>> d['AC']
'M'
注意,在这里反转字典映射意味着我们丢失了一个键,因为 'X'
和 'N'
都映射到 'GATC'
。
我想找到相当于 2 个不同核苷酸的 IUPAC。
示例:我有 A 和 C,我想要 M。 或者:我有R和T,我想要D。
在 Biopython 中有这样做的方法吗? (这听起来很简单,但我只找到了使用对齐来做到这一点的方法,这对我来说不合适。)
谢谢!
我认为您正在寻找 Bio.Data.IUPACData
中的词典,例如:
>>> from Bio.Data import IUPACData
>>> d = {v:k for k,v in IUPACData.ambiguous_dna_values.items()}
>>> d['AC']
'M'
注意,在这里反转字典映射意味着我们丢失了一个键,因为 'X'
和 'N'
都映射到 'GATC'
。