pdftron 复制错误文本
pdftron copy wrong text
我想使用 pdftron 并且一切正常,但是当我从 pdf 复制文本时,一些字符会转换为空白方块和问号,知道吗?
here 是我的 pdf。
如下图所示:
我写了这段代码:
WebViewer({
path: '/assets/plugins/pdftron',
initialDoc: '/practical.pdf',
fullAPI: true,
disableLogs: true
}, document.getElementById('pdf')).then((instance) => {
// PDFNet is only available with full API enabled
const { PDFNet, docViewer } = instance;
let Feature = instance.Feature;
instance.disableFeatures([Feature.NotesPanel]);
docViewer.on('documentLoaded', () => {
// call methods relating to the loaded document
});
instance.textPopup.add({
type: 'actionButton',
img: '/language.svg',
onClick: () => {
const quads = docViewer.getSelectedTextQuads(docViewer.getCurrentPage());
const text = docViewer.getSelectedText();
$("#out-pdf").html(text);
console.log(quads);
},
});
});
您能否通过我们的支持创建工单 https://www.pdftron.com/form/request/ 并将发生这种情况的文档附在工单上,以便我仔细查看并更快地解决问题。
文档似乎确实导致不正确的提取。 PDF 规范未定义提取,因此每个查看者处理案例的方式略有不同。在您的情况下,文档中可能包含格式错误或不完整的字体或 unicode 映射。我们已经为我们的核心组件添加了多个修复程序,并且通过这些修复程序可以正确地进行提取。不幸的是,当前版本的 WebViewer 还不包括这些修复。我们无法给出修复程序何时登陆 WebViewer 的确切时间表,但至少应该是我们下一个主要版本的一部分。现在我会尝试看看您是否可以重新创建文档,看看是否有帮助。我们看到和测试的大部分文档提取都没有问题。
我想使用 pdftron 并且一切正常,但是当我从 pdf 复制文本时,一些字符会转换为空白方块和问号,知道吗?
here 是我的 pdf。
如下图所示:
我写了这段代码:
WebViewer({
path: '/assets/plugins/pdftron',
initialDoc: '/practical.pdf',
fullAPI: true,
disableLogs: true
}, document.getElementById('pdf')).then((instance) => {
// PDFNet is only available with full API enabled
const { PDFNet, docViewer } = instance;
let Feature = instance.Feature;
instance.disableFeatures([Feature.NotesPanel]);
docViewer.on('documentLoaded', () => {
// call methods relating to the loaded document
});
instance.textPopup.add({
type: 'actionButton',
img: '/language.svg',
onClick: () => {
const quads = docViewer.getSelectedTextQuads(docViewer.getCurrentPage());
const text = docViewer.getSelectedText();
$("#out-pdf").html(text);
console.log(quads);
},
});
});
您能否通过我们的支持创建工单 https://www.pdftron.com/form/request/ 并将发生这种情况的文档附在工单上,以便我仔细查看并更快地解决问题。
文档似乎确实导致不正确的提取。 PDF 规范未定义提取,因此每个查看者处理案例的方式略有不同。在您的情况下,文档中可能包含格式错误或不完整的字体或 unicode 映射。我们已经为我们的核心组件添加了多个修复程序,并且通过这些修复程序可以正确地进行提取。不幸的是,当前版本的 WebViewer 还不包括这些修复。我们无法给出修复程序何时登陆 WebViewer 的确切时间表,但至少应该是我们下一个主要版本的一部分。现在我会尝试看看您是否可以重新创建文档,看看是否有帮助。我们看到和测试的大部分文档提取都没有问题。