如何高效迭代MDAnalysis轨迹并保存残差属性时间序列?
How to iterate efficiently through MDAnalysis trajectory and save residue attribute time series?
我有一些使用 MDAnalysis 的工作代码将残基时间序列的质心保存在一个数组中,但我想知道是否有更多 Pythonic 或整体 efficient/fast 方式(理解,数组操作...... ) 去做。
import MDAnalysis as mda
mdau = mda.Universe(pdb, xtc)
arr = np.empty(( len(mdau.select_atoms("protein").residues), len(mdau.trajectory), 3 ))
# 288 protein residues, 1250 frames and 3 xyz-coordinates per center of mass; this array shape is important
for ts in mdau.trajectory:
for num, res in enumerate(mdau.select_atoms("protein").residues):
arr[num, ts.frame] = res.atoms.center_of_mass()
我正在使用的 .pdb 和 .xtc 文件可以在这些链接中下载:
https://submission.gpcrmd.org/dynadb/files/Dynamics/11579_dyn_169.pdb
https://submission.gpcrmd.org/dynadb/files/Dynamics/11576_trj_169.xtc
您可以对代码进行一些更改:
- select 你的蛋白质原子在 for 循环之外,而不是在每次迭代中
- 通过将
compound='residues'
参数传递给 center_of_mass
方法 ,对残基的质心计算进行向量化
- 使用
ag.n_residues
和 u.trajectory.n_frames
属性
这是使用这些建议对您的代码进行的更新:
import numpy as np
import MDAnalysis as mda
u = mda.Universe('11579_dyn_169.pdb', '11576_trj_169.xtc')
protein = u.select_atoms("protein")
arr = np.empty((protein.n_residues, u.trajectory.n_frames, 3))
for ts in u.trajectory:
arr[:, ts.frame] = protein.center_of_mass(compound='residues')
我有一些使用 MDAnalysis 的工作代码将残基时间序列的质心保存在一个数组中,但我想知道是否有更多 Pythonic 或整体 efficient/fast 方式(理解,数组操作...... ) 去做。
import MDAnalysis as mda
mdau = mda.Universe(pdb, xtc)
arr = np.empty(( len(mdau.select_atoms("protein").residues), len(mdau.trajectory), 3 ))
# 288 protein residues, 1250 frames and 3 xyz-coordinates per center of mass; this array shape is important
for ts in mdau.trajectory:
for num, res in enumerate(mdau.select_atoms("protein").residues):
arr[num, ts.frame] = res.atoms.center_of_mass()
我正在使用的 .pdb 和 .xtc 文件可以在这些链接中下载: https://submission.gpcrmd.org/dynadb/files/Dynamics/11579_dyn_169.pdb https://submission.gpcrmd.org/dynadb/files/Dynamics/11576_trj_169.xtc
您可以对代码进行一些更改:
- select 你的蛋白质原子在 for 循环之外,而不是在每次迭代中
- 通过将
compound='residues'
参数传递给center_of_mass
方法 ,对残基的质心计算进行向量化
- 使用
ag.n_residues
和u.trajectory.n_frames
属性
这是使用这些建议对您的代码进行的更新:
import numpy as np
import MDAnalysis as mda
u = mda.Universe('11579_dyn_169.pdb', '11576_trj_169.xtc')
protein = u.select_atoms("protein")
arr = np.empty((protein.n_residues, u.trajectory.n_frames, 3))
for ts in u.trajectory:
arr[:, ts.frame] = protein.center_of_mass(compound='residues')