具有相关特性的化学品数据库?

Database of chemicals with associated properties?

我认为 pubchem 在这里有我需要的东西,我想要一个数据库,它是 - 或者可以转换成 - table 的化学标识符:学校项目的一系列属性。 问题是,pubchem 太大了,他们提供的唯一我知道如何解码的文件是 XML(他们还提供 SDF 和 ASN,这里是 link:ftp://ftp.ncbi.nlm.nih.gov/pubchem/Substance/CURRENT-Full/),并且我没有足够的 RAM 在文本编辑器中打开 XMLs。

我可以使用替代数据库吗?

有没有办法在加载 XML 文件之前将它们分割成更易于管理的部分?

一旦我有了任何可打开形式的数据,我就可以用代码解析它,所以数据太多而无法阅读不是问题。

我想我开始弄清楚如何做到这一点。 XML stream 是一个很好的搜索关键字。抱歉,我在问题中的措辞有点奇怪,从技术角度来看,我不太确定我在问什么。