如何将 EUC-JP 转码为 Unicode 并以一种可以显示给用户的方式?
How to transcode EUC-JP to Unicode in a way that can be displayed to the user?
您好,我正在为 android 构建一个简单的应用程序,它允许用户查找 kanji 并查看它的 "parts"。
为此,我正在阅读 data file which I found on this 网站并包含我需要显示的汉字部分。
问题是它不是用 unicode 编码的,我还没有找到可以正确显示文件内容的程序。我不完全确定编码是什么,但我怀疑它是 CP932
.
如何将文件转码为可以显示给用户(并由 java 操作)的内容?
以下是内容的示例:
±ú : Ñá
±û : ¥Î °ì Âç ÑÌ
±ü : Âç ÊÆ ÑÄ
±ý : ²¦ Ц ×Æ
±þ : ¿´ Öø
²¡ : ¡Ã Æü Ù© ÅÄ
²¢ : ²¦ Æü
²£ : ¡Ã ²« ÅÄ Æó Æü ¥Ï ÌÚ ×°
²¤ : ·ç Ò¹ ¥Î Ц
²¥ : ¥Î Ц Ò¹ ÝÕ ÑÜ Ëô
²¦ : ²¦
²§ : ±© ¥Ï ÑÒ ÒÓ
²¨ : ½é Âç ÊÆ ÑÄ ÈÐ
²© : ¾° Ä» ÑÌ Û¿
²ª : Ä» Ò¹ Û¿ ¥Î Ц
²« : ²« ÅÄ ¥Ï
²¬ : Öõ ÑÄ °ì »³ ²¬
² : ¡Ã ½Á ¸ý
²® : ²Ð ÈÈ çè
²¯ : ²» ²½ ¿´ Æü Ω
²° : »ê ÅÚ ÒÓ Õù
²± : ²» ¿´ Æü Ë» Ω
²² : ²» ·î ¿´ Æü Ω
²³ : ÌÚ ÍÑ ¥Þ
²´ : µí ÅÚ
²µ : ²µ
²¶ : ²µ ²½ Âç ±â
文件编码为EUC-JP (not Shift-JIS or CP932). You can either convert the file to a UTF offline with a tool like iconv, or convert it online by specifying the charset when you create an InputStreamReader
读取文件
您好,我正在为 android 构建一个简单的应用程序,它允许用户查找 kanji 并查看它的 "parts"。 为此,我正在阅读 data file which I found on this 网站并包含我需要显示的汉字部分。
问题是它不是用 unicode 编码的,我还没有找到可以正确显示文件内容的程序。我不完全确定编码是什么,但我怀疑它是 CP932
.
如何将文件转码为可以显示给用户(并由 java 操作)的内容?
以下是内容的示例:
±ú : Ñá
±û : ¥Î °ì Âç ÑÌ
±ü : Âç ÊÆ ÑÄ
±ý : ²¦ Ц ×Æ
±þ : ¿´ Öø
²¡ : ¡Ã Æü Ù© ÅÄ
²¢ : ²¦ Æü
²£ : ¡Ã ²« ÅÄ Æó Æü ¥Ï ÌÚ ×°
²¤ : ·ç Ò¹ ¥Î Ц
²¥ : ¥Î Ц Ò¹ ÝÕ ÑÜ Ëô
²¦ : ²¦
²§ : ±© ¥Ï ÑÒ ÒÓ
²¨ : ½é Âç ÊÆ ÑÄ ÈÐ
²© : ¾° Ä» ÑÌ Û¿
²ª : Ä» Ò¹ Û¿ ¥Î Ц
²« : ²« ÅÄ ¥Ï
²¬ : Öõ ÑÄ °ì »³ ²¬
² : ¡Ã ½Á ¸ý
²® : ²Ð ÈÈ çè
²¯ : ²» ²½ ¿´ Æü Ω
²° : »ê ÅÚ ÒÓ Õù
²± : ²» ¿´ Æü Ë» Ω
²² : ²» ·î ¿´ Æü Ω
²³ : ÌÚ ÍÑ ¥Þ
²´ : µí ÅÚ
²µ : ²µ
²¶ : ²µ ²½ Âç ±â
文件编码为EUC-JP (not Shift-JIS or CP932). You can either convert the file to a UTF offline with a tool like iconv, or convert it online by specifying the charset when you create an InputStreamReader
读取文件