如何从 SMILES 分子表示生成图表?
How to generate a graph from a SMILES molecule representation?
我有一个用 SMILES 字符串表示的分子数据集。我试图将其表示为图表。有办法吗?例如,假设我有字符串 CC(C)(C)c1ccc2occ(CC(=O)Nc3ccccc3F)c2c1
,是否有一种通用方法可以将其转换为图形表示,即邻接矩阵和原子向量?我看到有关 SMILES from graphs 的问题,我知道 rdkit
有 MolFromSmiles
,但我找不到从 SMILES 字符串中获取图表的内容。
你可以试试 pysmiles。
从 SMILES 描述开始,您应该能够创建一个 NetworkX 图并使用
行的代码生成所需的对象
from pysmiles import read_smiles
import networkx as nx
smiles = 'C12=C3C4=C5C6=C1C7=C8C9=C1C%10=C%11C(=C29)C3=C2C3=C4C4=C5C5=C9C6=C7C6=C7C8=C1C1=C8C%10=C%10C%11=C2C2=C3C3=C4C4=C5C5=C%11C%12=C(C6=C95)C7=C1C1=C%12C5=C%11C4=C3C3=C5C(=C81)C%10=C23'
mol = read_smiles(smiles)
# atom vector (C only)
print(mol.nodes(data='element'))
# adjacency matrix
print(nx.to_numpy_matrix(mol))
如果你能接受so-so可视化,你也可以尝试用
绘制分子图
import matplotlib.pyplot as plt
elements = nx.get_node_attributes(mol, name = "element")
nx.draw(mol, with_labels=True, labels = elements, pos=nx.spring_layout(mol))
plt.gca().set_aspect('equal')
富勒烯很有趣:)
要完成 Davide 的回答,您可以使用以下方法将债券顺序包含在邻接矩阵中:
nx.to_numpy_matrix(mol, weight='order')
nx.adjacency_matrix(mol, weight='order').todense()
networkx
是一个很好的解决方案。如果您正在寻找更自定义的东西,您可以自己创建图表。请参阅此 post 中另一个方向的示例(来自图表的微笑):SMILES from graph
我有一个用 SMILES 字符串表示的分子数据集。我试图将其表示为图表。有办法吗?例如,假设我有字符串 CC(C)(C)c1ccc2occ(CC(=O)Nc3ccccc3F)c2c1
,是否有一种通用方法可以将其转换为图形表示,即邻接矩阵和原子向量?我看到有关 SMILES from graphs 的问题,我知道 rdkit
有 MolFromSmiles
,但我找不到从 SMILES 字符串中获取图表的内容。
你可以试试 pysmiles。 从 SMILES 描述开始,您应该能够创建一个 NetworkX 图并使用
行的代码生成所需的对象from pysmiles import read_smiles
import networkx as nx
smiles = 'C12=C3C4=C5C6=C1C7=C8C9=C1C%10=C%11C(=C29)C3=C2C3=C4C4=C5C5=C9C6=C7C6=C7C8=C1C1=C8C%10=C%10C%11=C2C2=C3C3=C4C4=C5C5=C%11C%12=C(C6=C95)C7=C1C1=C%12C5=C%11C4=C3C3=C5C(=C81)C%10=C23'
mol = read_smiles(smiles)
# atom vector (C only)
print(mol.nodes(data='element'))
# adjacency matrix
print(nx.to_numpy_matrix(mol))
如果你能接受so-so可视化,你也可以尝试用
绘制分子图import matplotlib.pyplot as plt
elements = nx.get_node_attributes(mol, name = "element")
nx.draw(mol, with_labels=True, labels = elements, pos=nx.spring_layout(mol))
plt.gca().set_aspect('equal')
富勒烯很有趣:)
要完成 Davide 的回答,您可以使用以下方法将债券顺序包含在邻接矩阵中:
nx.to_numpy_matrix(mol, weight='order')
nx.adjacency_matrix(mol, weight='order').todense()
networkx
是一个很好的解决方案。如果您正在寻找更自定义的东西,您可以自己创建图表。请参阅此 post 中另一个方向的示例(来自图表的微笑):SMILES from graph