在哪里更改源代码渲染带点的希伯来语文本? PDF文件
Where to change in source code rendering Hebrew text with dots? PDF JS
我必须显示希伯来语的 pdf 书籍,但希伯来语字母表有 2 种文本样式(带点和不带点)。
当书有带点的文本样式时 - 出现问题:当我 select 文本时 - 它随机地在一个单词中包含空格并且搜索也有问题。
所以想改文字渲染功能,实现一下
HTML:
Enter input text here:<br/>
<textarea id="input" rows="10" cols="60"></textarea><br/><br/>
Enter output text here:<br/>
<textarea id="output" rows="10" cols="60"></textarea><br/><br/>
<button id="convert" onClick="doStrip()">
Strip Vowels
</button>
JS/JQuery
function stripVowels(rawString)
{
var newString = '';
for(j=0; j<rawString.length; j++) {
if(rawString.charCodeAt(j)<1425
|| rawString.charCodeAt(j)>1479)
{ newString = newString + rawString.charAt(j); }
}
return(newString);
}
/* @shimondoodkin suggested even a much shorter way to do this */
function stripVowels2(rawString) {
return rawString.replace(/[\u0591-\u05C7]/g,"")
}
function doStrip() {
var input = $('#input').val();
var output = stripVowels(input);
$('#output').val(output);
}
示例文本(从书本复制,似乎是pdf js错误的渲染空间):לּעַ,עִ,עִגגֵּּן,רִבָּרָרָלְבׁ:מְמְ:מְמְע,צֶצֶ,צֶ ית יְ שָ ג ִ י םׂמֻ ש
希望什么时候把带点的字改成不带点的字
在渲染函数中 - 它会解决这个问题
我也尝试更改SPACE_FACTOR,但仍然有问题
在文件中 evaluator.js
在函数 buildTextContentItem 中
用变量 "glyphUnicode"
做你需要的
我必须显示希伯来语的 pdf 书籍,但希伯来语字母表有 2 种文本样式(带点和不带点)。
当书有带点的文本样式时 - 出现问题:当我 select 文本时 - 它随机地在一个单词中包含空格并且搜索也有问题。
所以想改文字渲染功能,实现一下
HTML:
Enter input text here:<br/>
<textarea id="input" rows="10" cols="60"></textarea><br/><br/>
Enter output text here:<br/>
<textarea id="output" rows="10" cols="60"></textarea><br/><br/>
<button id="convert" onClick="doStrip()">
Strip Vowels
</button>
JS/JQuery
function stripVowels(rawString)
{
var newString = '';
for(j=0; j<rawString.length; j++) {
if(rawString.charCodeAt(j)<1425
|| rawString.charCodeAt(j)>1479)
{ newString = newString + rawString.charAt(j); }
}
return(newString);
}
/* @shimondoodkin suggested even a much shorter way to do this */
function stripVowels2(rawString) {
return rawString.replace(/[\u0591-\u05C7]/g,"")
}
function doStrip() {
var input = $('#input').val();
var output = stripVowels(input);
$('#output').val(output);
}
示例文本(从书本复制,似乎是pdf js错误的渲染空间):לּעַ,עִ,עִגגֵּּן,רִבָּרָרָלְבׁ:מְמְ:מְמְע,צֶצֶ,צֶ ית יְ שָ ג ִ י םׂמֻ ש
希望什么时候把带点的字改成不带点的字 在渲染函数中 - 它会解决这个问题
我也尝试更改SPACE_FACTOR,但仍然有问题
在文件中 evaluator.js 在函数 buildTextContentItem 中 用变量 "glyphUnicode"
做你需要的