为什么 H 进来 对 H 不存在的结构微笑

Why H comes in Smiles for the structure on which H is not present

当我读取“.mol”文件并使用 Rdkit 转换为微笑时,微笑带有 H,但是 'H' 不存在于原始 .xyz 文件中。这是我的做法:

m3 = Chem.MolFromMolFile('Al_neutral.mol', strictParsing=False)
ms = Chem.MolToSmiles(m3)
mol = Chem.MolFromSmiles(ms)

当我打印 'ms' 时,它是

'[Al]12[AlH2]34[Al]5[AlH2]16[Al]1[AlH2]57[Al]5[AlH2]89[Al]3[AlH2]23[Al]8[AlH2]15[Al]46379'

为什么会有 'H',我们如何解释这些数字?请给我提意见。提前致谢。

您在 SMILES 中看到的氢是隐式建模的。查看此 blog post 以获取有关隐式和显式氢的信息。您会注意到,如果您转换回“.mol”表示形式,氢将不存在:

smiles = '[Al]12[AlH2]34[Al]5[AlH2]16[Al]1[AlH2]57[Al]5[AlH2]89[Al]3[AlH2]23[Al]8[AlH2]15[Al]46379'
mol = Chem.MolFromSmiles(smiles)
print(Chem.MolToMolBlock(mol))


 RDKit          2D

 13 24  0  0  0  0  0  0  0  0999 V2000
    1.0607    0.0000    0.0000 Al  0  0  0  0  0  3  0  0  0  0  0  0
   -0.0000   -1.0607    0.0000 Al  0  0  0  0  0  6  0  0  0  0  0  0
   -1.0607    0.0000    0.0000 Al  0  0  0  0  0  3  0  0  0  0  0  0
    0.0000    1.0607    0.0000 Al  0  0  0  0  0  6  0  0  0  0  0  0
   -1.4230    1.5350    0.0000 Al  0  0  0  0  0  3  0  0  0  0  0  0
   -2.1213   -1.0607    0.0000 Al  0  0  0  0  0  6  0  0  0  0  0  0
   -2.9642    0.1801    0.0000 Al  0  0  0  0  0  3  0  0  0  0  0  0
    2.1213   -3.1820    0.0000 Al  0  0  0  0  0  6  0  0  0  0  0  0
    1.0607   -2.1213    0.0000 Al  0  0  0  0  0  3  0  0  0  0  0  0
    2.1213   -1.0607    0.0000 Al  0  0  0  0  0  6  0  0  0  0  0  0
    3.1820   -2.1213    0.0000 Al  0  0  0  0  0  3  0  0  0  0  0  0
   -1.8974    0.1120    0.0000 Al  0  0  0  0  0  6  0  0  0  0  0  0
   -1.0607   -2.1213    0.0000 Al  0  0  0  0  0  6  0  0  0  0  0  0
  1  2  1  0
  2  3  1  0
  3  4  1  0
  4  5  1  0
  5  6  1  0
  6  7  1  0
  7  8  1  0
  8  9  1  0
  9 10  1  0
 10 11  1  0
 11 12  1  0
 12 13  1  0
  4  1  1  0
 12  5  1  0
 10  1  1  0
  9  2  1  0
 13 10  1  0
 13  2  1  0
  6  3  1  0
 12  7  1  0
 13  4  1  0
 13  6  1  0
 11  8  1  0
 13  8  1  0
M  END