可读格式的英语词典(文本或 xml)
English dictionary in readable format (text or xml)
我希望找到 可下载(免费或付费)的英语词典 最好是来自牛津、剑桥、韦伯斯特的文本或 XML 格式来做一些 NLP。
希望每个词条都有
- 完整的词性,
- 发音,
- 动词和名词的形态
- 多个 sense/definition 条目
例如下一页http://www.merriam-webster.com/dictionary/side.
定义的实际文本并不重要。我最需要的是词性、发音、词法、定义顺序条目。
还想知道:Stanford NLP 工具包在进行词性标注时使用什么作为词汇资源?
谢谢。
Here and here 是类似的问题。总结:
- Part-of speech dictionary - 不幸的是,标签集很窄。
- Pronouncing Dictionary
- 多重感官 - WordNet
词法词典可以在 FreeLing 分布中找到 - 请参阅 data/en/dicc.src。顺便说一句,还有感官和语音词典。
关于斯坦福词性标注器:他们使用 Penn treebank, proof
我希望找到 可下载(免费或付费)的英语词典 最好是来自牛津、剑桥、韦伯斯特的文本或 XML 格式来做一些 NLP。
希望每个词条都有
- 完整的词性,
- 发音,
- 动词和名词的形态
- 多个 sense/definition 条目
例如下一页http://www.merriam-webster.com/dictionary/side.
定义的实际文本并不重要。我最需要的是词性、发音、词法、定义顺序条目。
还想知道:Stanford NLP 工具包在进行词性标注时使用什么作为词汇资源?
谢谢。
Here and here 是类似的问题。总结:
- Part-of speech dictionary - 不幸的是,标签集很窄。
- Pronouncing Dictionary
- 多重感官 - WordNet
词法词典可以在 FreeLing 分布中找到 - 请参阅 data/en/dicc.src。顺便说一句,还有感官和语音词典。
关于斯坦福词性标注器:他们使用 Penn treebank, proof