DNA 到蛋白质 |翻译错误

Question

我没有出错。始终刷新缓存和本地内存。

验证翻译的资源：

[NCBI 蛋白质翻译工具][1]（验证）

[文本比较][2]（验证）

[解决方案灵感][3]

300 个 DNA 字符 -> 100 个蛋白质字符。

# dna_sequence = above sequence

dna_codons = {
    'ATA':'I', 'ATC':'I', 'ATT':'I', 'ATG':'M',
    'ACA':'T', 'ACC':'T', 'ACG':'T', 'ACT':'T',
    'AAC':'N', 'AAT':'N', 'AAA':'K', 'AAG':'K',
    'AGC':'S', 'AGT':'S', 'AGA':'R', 'AGG':'R',                
    'CTA':'L', 'CTC':'L', 'CTG':'L', 'CTT':'L',
    'CCA':'P', 'CCC':'P', 'CCG':'P', 'CCT':'P',
    'CAC':'H', 'CAT':'H', 'CAA':'Q', 'CAG':'Q',
    'CGA':'R', 'CGC':'R', 'CGG':'R', 'CGT':'R',
    'GTA':'V', 'GTC':'V', 'GTG':'V', 'GTT':'V',
    'GCA':'A', 'GCC':'A', 'GCG':'A', 'GCT':'A',
    'GAC':'D', 'GAT':'D', 'GAA':'E', 'GAG':'E',
    'GGA':'G', 'GGC':'G', 'GGG':'G', 'GGT':'G',
    'TCA':'S', 'TCC':'S', 'TCG':'S', 'TCT':'S',
    'TTC':'F', 'TTT':'F', 'TTA':'L', 'TTG':'L',
    'TAC':'Y', 'TAT':'Y', 'TAA':'*', 'TAG':'*',
    'TGC':'C', 'TGT':'C', 'TGA':'*', 'TGG':'W',
} # replaced '_' for '*'

output_protein = ''
for i in range(0, len(dna_sequence), 3):
  codon = dna_sequence[i:i+3]
  output_protein += dna_codons.get(codon,'')
    
print(output_protein)

示例问题和解决方案： ps://www.geeksforgeeks.org/dna-protein-python-3/

Answer 1

我认为问题在于您混淆了变量名称 - 您的翻译代码附加到 protein 但您打印 output_protein 我认为它实际上是在您的代码中的其他地方创建的（？）。此外，您首先编辑变量 dna_sequence 但遍历 dna 我认为它也在其他地方定义并且可能与 dna_sequence.

不匹配

编辑变量名称后，我可以使用您的代码获得与 NCBI 工具相同的翻译。

dna_sequence = 'TTGTAGATCTGTTCTCTAAACGAACTTTAAAATCTGTGTGGCTGTCACTCGGCTGCATGCTTAGTGCACTCACGCAGTATAATTAATAACTAATTACTGTCGTTGACAGGACACGAGTAACTCGTCTATCTTCTGCAGGCGCTTACGGTTTCGTCCGTGTTGCAGCCGATCATCAGCACATCTAGGTTTTGTCCGGGTGTGACCGAAAGGTAAGATGGAGAGCCTTGTCCCTGGTTTCAACGAGAAAACACACGTCCAACTCAGTTTGCCTGTTTTACAGGTTCGCGACGTGCTCGTACG'
# dna_sequence = above sequence
if len(dna_sequence ) % 3 == 2: dna_sequence = dna_sequence [:-2]
if len(dna_sequence ) % 3 == 1: dna_sequence = dna_sequence [:-1]

#%% 
dna_codons = {
    'ATA':'I', 'ATC':'I', 'ATT':'I', 'ATG':'M',
    'ACA':'T', 'ACC':'T', 'ACG':'T', 'ACT':'T',
    'AAC':'N', 'AAT':'N', 'AAA':'K', 'AAG':'K',
    'AGC':'S', 'AGT':'S', 'AGA':'R', 'AGG':'R',                 
    'CTA':'L', 'CTC':'L', 'CTG':'L', 'CTT':'L',
    'CCA':'P', 'CCC':'P', 'CCG':'P', 'CCT':'P',
    'CAC':'H', 'CAT':'H', 'CAA':'Q', 'CAG':'Q',
    'CGA':'R', 'CGC':'R', 'CGG':'R', 'CGT':'R',
    'GTA':'V', 'GTC':'V', 'GTG':'V', 'GTT':'V',
    'GCA':'A', 'GCC':'A', 'GCG':'A', 'GCT':'A',
    'GAC':'D', 'GAT':'D', 'GAA':'E', 'GAG':'E',
    'GGA':'G', 'GGC':'G', 'GGG':'G', 'GGT':'G',
    'TCA':'S', 'TCC':'S', 'TCG':'S', 'TCT':'S',
    'TTC':'F', 'TTT':'F', 'TTA':'L', 'TTG':'L',
    'TAC':'Y', 'TAT':'Y', 'TAA':'*', 'TAG':'*',
    'TGC':'C', 'TGT':'C', 'TGA':'*', 'TGG':'W',
}

output_protein = ""
for i in range(0, len(dna_sequence), 3):
    codon = dna_sequence[i:i+3]
    output_protein += dna_codons.get(codon,'')

print(output_protein)

ncbi = 'L*ICSLNEL*NLCGCHSAACLVHSRSIINN*LLSLTGHE*LVYLLQALTVSSVLQPIISTSRFCPGVTER*DGEPCPWFQRENTRPTQFACFTGSRRART'
if ncbi == output_protein:
    print("Matches")

DNA 到蛋白质 |翻译错误

DNA to Protein | translation incorrection

python

text

dictionary

bioinformatics

dna-sequence