使用 RDkit 进行化合物分类

Compound classification using RDkit

如何使用 RDkit 或其他库对化合物进行计算分类?例如,如何判断一种化合物是卤化物、胺还是酒精? RDkit 是否内置了此类任务的函数?

没有直接的方法可以做到这一点,但您可以采取一些技巧来对化合物进行分类。 rdkit 中有一个模块可以为您提供片段的数量,尤其是当它是一个函数组时。检查一下 here。例如,假设您要查找分子中脂肪族 -OH 基团的数量。您可以简单地调用以下函数来执行此操作

from rdkit.Chem.Fragments import fr_Al_OH
fr_Al_OH(mol)

或以下将 return 芳香族 -OH 组的数量:

from rdkit.Chem.Fragments import fr_Ar_OH
fr_Ar_OH(mol)

同样,还有83个功能可用。其中一些对您的任务很有用。所以你可以遍历所有 83 个函数,只要值大于或等于 1,就可以说该分子具有该官能团。例如,如果 fr_Al_OH(mol) return 的值 >= 1,则表示该化合物是一种酒精。