可读格式的英语词典(文本或 xml)

English dictionary in readable format (text or xml)

我希望找到 可下载(免费或付费)的英语词典 最好是来自牛津、剑桥、韦伯斯特的文本或 XML 格式来做一些 NLP。

希望每个词条都有

例如下一页http://www.merriam-webster.com/dictionary/side.

定义的实际文本并不重要。我最需要的是词性、发音、词法、定义顺序条目。

还想知道:Stanford NLP 工具包在进行词性标注时使用什么作为词汇资源?

谢谢。

Here and here 是类似的问题。总结:

  1. Part-of speech dictionary - 不幸的是,标签集很窄。
  2. Pronouncing Dictionary
  3. 多重感官 - WordNet

词法词典可以在 FreeLing 分布中找到 - 请参阅 data/en/dicc.src。顺便说一句,还有感官和语音词典。

关于斯坦福词性标注器:他们使用 Penn treebank, proof