创建单词字典并映射到其他语言

Creating Words Dictionary and Mapping to other languages

我正在创建一个应用程序,用户可以在其中使用多种语言进行搜索。假设我有一个网站,上面有一本很大的小说。可能由数千个段落组成。有些在 20,000 到 30,000 个段落之间。

用户可以阅读多种语言的小说。他可以用多种语言搜索。比如他用英文搜索"LOVE",我就给他看里面所有包含"LOVE"的段落。

现在,如果用户切换到法语,并搜索 "Amour"(French for Love),我将向他显示所有包含 "Amour" 的段落。

我可以通过创建两个版本的小说来做到这一点,一个是法语,另一个是英语。的确,我会有翻译。但是,当用户阅读小说时,我会给他一个选项,让他可以点击任何单词并查看它的其他语言翻译。在这种情况下,如果他正在用英语阅读,我会向他展示该特定单词的法语翻译,反之亦然。

这意味着我想在不同语言之间保留单词到单词的映射。

一种方法是自己创建一张地图,这需要很多工作。另一种方式可能是一些 API 调用,例如 Google 翻译器。 你能建议最好的方法吗?任何现有的 API? 进入此任务正确方向的一些 Google 术语也会有所帮助。

Elasticsearch 可以很好地解决您的问题。

  1. 简单地用他们的母语为您的内容编制索引(索引很好)
  2. 然后就可以使用Elasticsearch Phonetic Plugin进行多语言搜索了(https://www.elastic.co/guide/en/elasticsearch/plugins/current/analysis-phonetic.html)

对于其他部分,如果您想逐字翻译,我认为 google 翻译或其他翻译 api 可以集成,或者也可以使用 elasticsearch。

希望对您有所帮助。