我想识别这些视频的编码
I want to identify encoding of these videos
我有一堆 20 年前下载的视频。我相信该网站有日文版。我当时的电脑不理解 unicode 字符,我相信我是用 Download Accelerator Plus 下载它们的!所以所有的视频标题看起来像是损坏的 ASCII 和 URLEncoded 字符的混合
有什么办法可以恢复这些标题吗?以下是一些示例:
- %ec†%a1%ecŠ%b9%ec„%a0.avi
- %ea%b0•%ec%a2…%ea%b5%ac, %ec†%ec%a3%bc%ed™~.avi
- %ea%b5%ac%ec%a2…%eb%a7Œ.avi
- %ec-%a4%ec%b0%bd%ec%bc.avi
- %ea%b6Œ%eb%af%bc%ec%a3%bc (%e2∼…%e2∼…).avi
我不记得 url,所以我无法查看网络档案
欢迎任何输入。
谢谢
你是怎么翻译的?
首先,假设UTF-8因为0xec
、0xed
或0xea
是three-byte UTF-8序列的第一个字节;然后
- 将每个 URL-encoded 字符转换为其字节值(例如
%a1
到0xa1
),并且 - 取每个文字字符的 ANSI 1252 字节值,例如
†Š•…™˜Œœ,()
.
然后你就有了整个字符串的 UTF-8 字节序列,你可以简单地解码它。
异常:
- 字符串 #17 中缺少字符(two-char 字符串
%ec†
应转换为 three-byte 序列,添加0x81
); - 与字符串 #19 相同(two-char 字符串
%ec%bc
应转换为 three-byte 序列)。
示例(手动转换,以下字节序列中↑↑↑↑
表示的异常,添加0x81
):
16 0xec,134,0xa1,0xec,138,0xb9,0xec,132,0xa0
송승선
17 0xea,0xb0,149,0xec,0xa2,133,0xea,0xb5,0xac,0x2c,0x20,0xec,134,0x81,0xec,0xa3,0xbc,0xed,153,152
강종구, 솁주환 ↑↑↑↑
18 0xea,0xb5,0xac,0xec,0xa2,133,0xeb,0xa7,140
구종만
19 0xec,156,0xa4,0xec,0xb0,0xbd,0xec,0xbc,0x81
윤창켁 ↑↑↑↑
20 0xea,0xb6,140,0xeb,0xaf,0xbc,0xec,0xa3,0xbc,0x20,0x28,0xe2,152,133,0xe2,152,133,0x29
권민주 (★★)
Google 翻译: