如何绘制蛋白质结构的自由能景观?

How to plot the free energy landscape of protein structure?

我知道这个问题不适合这个平台,但如果我能得到一些提示,我可以试试,

我一直在尝试绘制蛋白质结构(“Chignolin”)的自由能图谱。我完全 运行 不知道该怎么做!!我有 MD 模拟轨迹文件 Trajectory file 并使用 pyemma 绘制能量景观。但我收到了错误 “” TypeError: plot_free_energy() 接受 2 到 20 个位置参数,但给出了 28 个 ""

有人能找出问题所在吗? 这是我的代码


import numpy as np
import matplotlib.pyplot as plt
import mdtraj as md
from itertools import combinations
from simtk.openmm.app.topology import Topology
from simtk.openmm.app.simulation import Simulation
from simtk.openmm.app.dcdreporter import DCDReporter
from simtk.openmm.app.statedatareporter import StateDataReporter
import simtk.unit as u
import simtk.openmm as mm
import simtk.openmm.openmm as openmm
import pyemma.coordinates as coor
import pyemma

pdb = md.load('1uao_Calpha.pdb')
feat = pyemma.coordinates.data.MDFeaturizer(pdb)
feat.add_distances_ca(periodic=False)
files = pyemma.coordinates.load('traj/DESRES/CLN025-0-c-alpha/CLN025-0-c-alpha-005.dcd', features = feat)

pyemma.plots.plot_free_energy(*files.T)
plt.show()

这是另一个pdb file

我建议您开始阅读文档,尤其是包含 Jupyter notebook 的“学习 PyEMMA”部分,教您提取适当加权的“伪”自由能表面的工作流程。通常这些表面被绘制到前两个最慢的动力学过程的维度中,但您也可以想到任何其他组合。这些维度由 TICA 或 VAMP 投影定义,它们基本上是从数据中提取慢模式的方法,以防蛋白质包含折叠和罕见事件。

作为入门书,我建议先阅读此 tutorial,因为它简要概述了如何加载和处理数据以提取慢速模式。请注意,这还不包含马尔可夫状态模型,因此请进一步阅读其他示例以了解相关信息。