Javascript arabic/persian 个字符串中的字符串拆分问题

Javascript string split issue in arabic/persian strings

我正在尝试使用 javascript 字符串拆分拆分两个波斯字符,但拆分不正确。

var test = '"حسن روحانی"،"حسن+روحانی"';
var tmpkeywords =  test.split(',');
console.log(tmpkeywords);

分割结果应该是这样的:

[""حسن روحانی""،""حسن+روحانی""] 

但它像 [""حسن روحانی"،"حسن+روحانی"↵"] 一样来了。它适用于英文字符或数字。

我的fiddle:https://jsfiddle.net/tueo3sfa/1/

您的字符串 "حسن روحانی"،"حسن+روحانی" 不包含字符“,”(U+002C 逗号),但包含“،”(U+060C 阿拉伯语逗号):这就是它的原因不会拆分并且 return 只是整个原始字符串。

要得到你想要的,你需要按“،

拆分
var test = '"حسن روحانی"،"حسن+روحانی"';
var tmpkeywords =  test.split(',');
console.log(tmpkeywords);

另请注意,其他语言中有许多不同的逗号,如果您需要以通用方式处理它们,您可能需要全部指定它们(例如原始未过滤列表 http://www.fileformat.info/info/unicode/char/search.htm?q=comma&han=Y&preview=entity) or, if applicable, to use Unicode classes (for example splitting by punctuation characters, see also http://inimino.org/~inimino/blog/javascript_cset)。