为 pdftohtml 选择编码

Choose encoding for pdftohtml

如何强制 pdftohtml 输出为 UTF 8?

$ pdftohtml -enc utf8 my.pdf 
Error: Couldn't find unicodeMap file for the 'utf-8' encoding

而且 -listenc 似乎不是一个有效的选项。

我认为它默认使用 ISO-8859-1(尽管由于某些原因 VIM 可以正常读取文件和特殊字符,即使 :set enc? 报告 utf-8

请运行使用pdftohtml -enc UTF-8 file.pdf命令 喜欢:

$ pdftohtml -enc UTF-8 my.pdf