如何在 java 中将泰米尔语字符串转换为英语字符串
How to convert tamil string to english string in java
我正在做一个涉及NLP的项目。我需要将泰米尔语字符串音译为英文字符串(唐式),例如“இல்லை”到"illai"..
我如何使用 java 做到这一点??
帮我看看代码示例
因为 Tamil block 中只有 72 个字符,构建一个翻译 table 然后通过测试每个字符是否可以翻译来构建一个新字符串,然后再将其添加到列表中。
例如 U+0B87
(இ) 变成 i
如果您更熟悉 Java and/or 有大量 material 需要翻译,可能会有一些处理优化来加快这个过程,但我怀疑以上将是一个好的解决方案的基础。
如果您只有少量 material 需要翻译,或者这是一次性工作,简单地使用 Google Translate 并在输入下方获取输入翻译可能更有意义盒子.
我正在做一个涉及NLP的项目。我需要将泰米尔语字符串音译为英文字符串(唐式),例如“இல்லை”到"illai"..
我如何使用 java 做到这一点?? 帮我看看代码示例
因为 Tamil block 中只有 72 个字符,构建一个翻译 table 然后通过测试每个字符是否可以翻译来构建一个新字符串,然后再将其添加到列表中。
例如 U+0B87
(இ) 变成 i
如果您更熟悉 Java and/or 有大量 material 需要翻译,可能会有一些处理优化来加快这个过程,但我怀疑以上将是一个好的解决方案的基础。
如果您只有少量 material 需要翻译,或者这是一次性工作,简单地使用 Google Translate 并在输入下方获取输入翻译可能更有意义盒子.