CGPDFStringGetBytePtr 在扫描 pdf 时返回不正确的字符串

CGPDFStringGetBytePtr returning incorrect string while scanning pdf

我有一个 PDF,我正在尝试使用 CGPDFScanner 扫描 PDF。 扫描 pdf 时,遇到单词 "file" 时,CGPDFStringGetBytePtr API returns "\x02le"。 PDF 有 Type1 字体,没有 ToUnicodeMapping(CMap)。 PDF 中不存在编码字典,因此使用 NSUTF8String 编码。但是我尝试了所有 NSMacOSRomanStringEncoding、NSASCIIStringEncoding,但没有成功。 可能是什么问题?

谢谢。

代码\x02对应'fi'字符串。 'fi' 序列是使用连字绘制的,这就是为什么只有一个字符代码。
代码和字符串的对应是在字体编码中完成的。字体编码包含一个 /Differences 数组,指定代码 \x02 和序列 'fi'

之间的映射