pdf.js 获取有关嵌入字体的信息

pdf.js get info about embedded fonts

我正在使用 pdf.js。获取文本我得到带有字体信息的块

Object { 
     str: "blabla", 
     dir: "ltr", 
     width: 191.433141, 
     height: 12.546, 
     transform: Array[6], 
     fontName: "g_d0_f2" 
}

是否有可能以某种方式获得有关 g_d0_f2.

的更多信息

请注意,PDF.js getTextContent 不会也不会匹配 PDF 中的字形。 PDF32000 规范有两种不同的文本显示和提取算法。即使您可以在 page.commonObjs 中查找字体数据,由于字形编码不匹配,它可能对提取的文本内容显示没有真正帮助。

页面的 getTextContent 正在执行文本提取,getOperatorList 获取(字形)显示运算符。查看 src/display/svg.js 渲染器如何显示字形。