pdftron中的句子提取
sentence extraction in pdftron
我想在鼠标悬停在 pdf 文档中那个句子的每个单词上突出显示句子,我尝试了一些方法但我无法实现这个目标。
有什么方法可以用 pdftron 做到这一点吗?
我想完成这个事件处理程序:
WebViewer({
path: '/assets/plugins/pdftron',
initialDoc: '/practical.pdf',
fullAPI: true,
disableLogs: true
}, document.getElementById('pdf'))
.then((instance) => {
const { PDFNet, docViewer } = instance;
const Tools = instance.Tools;
docViewer.on('mouseMove', (e) => {
console.log(e);
});
});
您也许可以使用文本提取器从页面中获取文本,然后遍历它以找到哪个部分对应于鼠标的位置https://www.pdftron.com/documentation/web/guides/extraction/text-extract/#advanced-text-extraction-from-a-page-region
您可能需要将鼠标坐标转换为 window 坐标 https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-mouse-locations-and-window-coordinates, window coordinates to page coordinates https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-window-and-viewer-page-coordinates and finally page coordinates to PDF page coordinates https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-pdf-and-viewer-coordinates 以便与文本提取器
中的值进行比较
我想在鼠标悬停在 pdf 文档中那个句子的每个单词上突出显示句子,我尝试了一些方法但我无法实现这个目标。
有什么方法可以用 pdftron 做到这一点吗?
我想完成这个事件处理程序:
WebViewer({
path: '/assets/plugins/pdftron',
initialDoc: '/practical.pdf',
fullAPI: true,
disableLogs: true
}, document.getElementById('pdf'))
.then((instance) => {
const { PDFNet, docViewer } = instance;
const Tools = instance.Tools;
docViewer.on('mouseMove', (e) => {
console.log(e);
});
});
您也许可以使用文本提取器从页面中获取文本,然后遍历它以找到哪个部分对应于鼠标的位置https://www.pdftron.com/documentation/web/guides/extraction/text-extract/#advanced-text-extraction-from-a-page-region
您可能需要将鼠标坐标转换为 window 坐标 https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-mouse-locations-and-window-coordinates, window coordinates to page coordinates https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-window-and-viewer-page-coordinates and finally page coordinates to PDF page coordinates https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-pdf-and-viewer-coordinates 以便与文本提取器
中的值进行比较