在哪里更改源代码渲染带点的希伯来语文本? PDF文件

Where to change in source code rendering Hebrew text with dots? PDF JS

我必须显示希伯来语的 pdf 书籍,但希伯来语字母表有 2 种文本样式(带点和不带点)。

当书有带点的文本样式时 - 出现问题:当我 select 文本时 - 它随机地在一个单词中包含空格并且搜索也有问题。

所以想改文字渲染功能,实现一下

HTML:

Enter input text here:<br/>
<textarea id="input" rows="10" cols="60"></textarea><br/><br/>

Enter output text here:<br/>
<textarea id="output" rows="10" cols="60"></textarea><br/><br/>

<button id="convert" onClick="doStrip()">
Strip Vowels
</button>

JS/JQuery

function stripVowels(rawString)
{
    var newString = '';
    for(j=0; j<rawString.length; j++) {
        if(rawString.charCodeAt(j)<1425
             || rawString.charCodeAt(j)>1479)
        { newString = newString + rawString.charAt(j); }
    }
    return(newString);
}

/* @shimondoodkin suggested even a much shorter way to do this */
function stripVowels2(rawString) {
  return rawString.replace(/[\u0591-\u05C7]/g,"")
}

function doStrip() {
   var input = $('#input').val();
   var output = stripVowels(input);
   $('#output').val(output);
}

link to Fiddle editor

示例文本(从书本复制,似乎是pdf js错误的渲染空间):לּעַ,עִ,עִגגֵּּן,רִבָּרָרָלְבׁ:מְמְ:מְמְע,צֶצֶ,צֶ ית יְ שָ ג ִ י םׂמֻ ש

希望什么时候把带点的字改成不带点的字 在渲染函数中 - 它会解决这个问题

我也尝试更改SPACE_FACTOR,但仍然有问题

在文件中 evaluator.js 在函数 buildTextContentItem 中 用变量 "glyphUnicode"

做你需要的