为 DNA 比对序列创建序列标识

Creating sequence logo for DNA aligned sequences

如何为对齐的 DNA 序列创建序列徽标?对于 Kevin Murphy 书中的给定序列(第 2 章,figure 2.5), I am deriving logo using this wiki_link 我没有得到预期的结果。

DNA 序列:

  1. a t a g c c g g t a c g g c a
  2. t t a g c t g c a a c c g c a
  3. t c a g c c a c t a g a g c a
  4. a t a a c c g c g a c c g c a
  5. t t a g c c g c t a g g t a
  6. t a g c c t c g t a c g t a
  7. t t a g c c g t t a c g g c c
  8. a t a t c c g g t a c a g t a
  9. a t a g c a g g t a c c g a a
  10. a c a t c c g t g a c g g a a

如果您不需要开发自己的版本:

有一个 python 库可以解决这个问题。

https://pypi.python.org/pypi/weblogo

或网页版

http://weblogo.berkeley.edu/logo.cgi

您可以使用上面添加的 weblogo 来完成,这里有一些代码可以在 python

中完成
from Bio.Seq import Seq
from Bio import motifs
instances = df['binding'] #just input the list of DNA sequences 
m = motifs.create(instances)
m.weblogo('logo.png')

在这里您必须提供实例作为 DNA 序列列表,结果将保存为 logo.png 或者您可以根据需要将 png 更改为 jpeg 或 tiff。