pdftron中的句子提取

sentence extraction in pdftron

我想在鼠标悬停在 pdf 文档中那个句子的每个单词上突出显示句子,我尝试了一些方法但我无法实现这个目标。

有什么方法可以用 pdftron 做到这一点吗?

我想完成这个事件处理程序:

            WebViewer({
                path: '/assets/plugins/pdftron',
                initialDoc: '/practical.pdf',
                fullAPI: true,
                disableLogs: true
            }, document.getElementById('pdf'))
                .then((instance) => {
                    const { PDFNet, docViewer } = instance;

                    const Tools = instance.Tools;

                    docViewer.on('mouseMove', (e) => {
                        console.log(e);
                    });
                    
                });

您也许可以使用文本提取器从页面中获取文本,然后遍历它以找到哪个部分对应于鼠标的位置https://www.pdftron.com/documentation/web/guides/extraction/text-extract/#advanced-text-extraction-from-a-page-region

您可能需要将鼠标坐标转换为 window 坐标 https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-mouse-locations-and-window-coordinates, window coordinates to page coordinates https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-window-and-viewer-page-coordinates and finally page coordinates to PDF page coordinates https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-pdf-and-viewer-coordinates 以便与文本提取器

中的值进行比较