Javascript 的希腊语音节库
Greek syllabification library for Javascript
有谁知道用 Javascript 编写的希腊语的良好音节化库或脚本?我尝试使用 Hyphenator.js 但结果很差...
<script src="Hyphenator.js" type="text/javascript"></script>
<script src="patterns/grc.js" type="text/javascript"></script>
<script type="text/javascript">
var hyphenchar = '|';
Hyphenator.config({hyphenchar:hyphenchar});
var t = 'αποκαλυψις ιησου χριστου ην εδωκεν αυτω ο θεος δειξαι τοις δουλοις αυτου α δει γενεσθαι εν ταχει και εσημανεν αποστειλας δια του αγγελου αυτου τω δουλω αυτου ιωαννη'.split(" ").map(function(word){return Hyphenator.hyphenate(word, 'grc')});
console.log(t);
</script>
将输出:
["απο|κα|λυ|ψις", "ιησου", "χρι|στου", "ην", "εδω|κεν", "αυτω", "ο", "θεος", "δει|ξαι", "τοις", "δου|λοις", "αυτου", "α", "δει", "γε|νε|σθαι", "εν", "ταχει", "και", "εση|μα|νεν", "απο|στει|λας", "δια", "του", "αγ|γε|λου", "αυτου", "τω", "δουλω", "αυτου", "ιω|αν|νη"]
这显然表明连字符不能完美地用于音节化目的。也许连字符没问题...
评论后补充:
我希望库可以连字符 "iesou" 和 "theos",但事实证明连字符有一个 minwordlength 的设置。将其设置为 2 可获得更好的结果。多个消息来源称,由于多种原因,自动断字/音节化并非 100% 准确。但这对我来说已经足够了。
如评论中所述,默认情况下短词不带连字符(因为它没有印刷意义)。但是,可以强制:
Hyphenator.config({hyphenchar:hyphenchar, minwordlength:1});
有谁知道用 Javascript 编写的希腊语的良好音节化库或脚本?我尝试使用 Hyphenator.js 但结果很差...
<script src="Hyphenator.js" type="text/javascript"></script>
<script src="patterns/grc.js" type="text/javascript"></script>
<script type="text/javascript">
var hyphenchar = '|';
Hyphenator.config({hyphenchar:hyphenchar});
var t = 'αποκαλυψις ιησου χριστου ην εδωκεν αυτω ο θεος δειξαι τοις δουλοις αυτου α δει γενεσθαι εν ταχει και εσημανεν αποστειλας δια του αγγελου αυτου τω δουλω αυτου ιωαννη'.split(" ").map(function(word){return Hyphenator.hyphenate(word, 'grc')});
console.log(t);
</script>
将输出:
["απο|κα|λυ|ψις", "ιησου", "χρι|στου", "ην", "εδω|κεν", "αυτω", "ο", "θεος", "δει|ξαι", "τοις", "δου|λοις", "αυτου", "α", "δει", "γε|νε|σθαι", "εν", "ταχει", "και", "εση|μα|νεν", "απο|στει|λας", "δια", "του", "αγ|γε|λου", "αυτου", "τω", "δουλω", "αυτου", "ιω|αν|νη"]
这显然表明连字符不能完美地用于音节化目的。也许连字符没问题...
评论后补充:
我希望库可以连字符 "iesou" 和 "theos",但事实证明连字符有一个 minwordlength 的设置。将其设置为 2 可获得更好的结果。多个消息来源称,由于多种原因,自动断字/音节化并非 100% 准确。但这对我来说已经足够了。
如评论中所述,默认情况下短词不带连字符(因为它没有印刷意义)。但是,可以强制:
Hyphenator.config({hyphenchar:hyphenchar, minwordlength:1});