我想识别这些视频的编码

I want to identify encoding of these videos

我有一堆 20 年前下载的视频。我相信该网站有日文版。我当时的电脑不理解 unicode 字符,我相信我是用 Download Accelerator Plus 下载它们的!所以所有的视频标题看起来像是损坏的 ASCII 和 URLEncoded 字符的混合

有什么办法可以恢复这些标题吗?以下是一些示例:

  1. %ec†%a1%ecŠ%b9%ec„%a0.avi
  2. %ea%b0•%ec%a2…%ea%b5%ac, %ec†%ec%a3%bc%ed™~.avi
  3. %ea%b5%ac%ec%a2…%eb%a7Œ.avi
  4. %ec-%a4%ec%b0%bd%ec%bc.avi
  5. %ea%b6Œ%eb%af%bc%ec%a3%bc (%e2∼…%e2∼…).avi

我不记得 url,所以我无法查看网络档案

欢迎任何输入。

谢谢

你是怎么翻译的?

首先,假设UTF-8因为0xec0xed0xea是three-byte UTF-8序列的第一个字节;然后

  • 将每个 URL-encoded 字符转换为其字节值(例如 %a10xa1),并且
  • 取每个文字字符的 ANSI 1252 字节值,例如†Š•…™˜Œœ,().

然后你就有了整个字符串的 UTF-8 字节序列,你可以简单地解码它。

异常:

  • 字符串 #17 中缺少字符(two-char 字符串 %ec† 应转换为 three-byte 序列,添加 0x81);
  • 与字符串 #19 相同(two-char 字符串 %ec%bc 应转换为 three-byte 序列)。

示例(手动转换,以下字节序列中↑↑↑↑表示的异常,添加0x81):

16 0xec,134,0xa1,0xec,138,0xb9,0xec,132,0xa0
송승선
17 0xea,0xb0,149,0xec,0xa2,133,0xea,0xb5,0xac,0x2c,0x20,0xec,134,0x81,0xec,0xa3,0xbc,0xed,153,152
강종구, 솁주환                                                    ↑↑↑↑
18 0xea,0xb5,0xac,0xec,0xa2,133,0xeb,0xa7,140
구종만
19 0xec,156,0xa4,0xec,0xb0,0xbd,0xec,0xbc,0x81
윤창켁                                     ↑↑↑↑   
20 0xea,0xb6,140,0xeb,0xaf,0xbc,0xec,0xa3,0xbc,0x20,0x28,0xe2,152,133,0xe2,152,133,0x29
권민주 (★★)

Google 翻译: