Javascript arabic/persian 个字符串中的字符串拆分问题
Javascript string split issue in arabic/persian strings
我正在尝试使用 javascript 字符串拆分拆分两个波斯字符,但拆分不正确。
var test = '"حسن روحانی"،"حسن+روحانی"';
var tmpkeywords = test.split(',');
console.log(tmpkeywords);
分割结果应该是这样的:
[""حسن روحانی""،""حسن+روحانی""]
但它像 [""حسن روحانی"،"حسن+روحانی"↵"]
一样来了。它适用于英文字符或数字。
我的fiddle:https://jsfiddle.net/tueo3sfa/1/
您的字符串 "حسن روحانی"،"حسن+روحانی"
不包含字符“,
”(U+002C 逗号),但包含“،
”(U+060C 阿拉伯语逗号):这就是它的原因不会拆分并且 return 只是整个原始字符串。
要得到你想要的,你需要按“،
”
拆分
var test = '"حسن روحانی"،"حسن+روحانی"';
var tmpkeywords = test.split(',');
console.log(tmpkeywords);
另请注意,其他语言中有许多不同的逗号,如果您需要以通用方式处理它们,您可能需要全部指定它们(例如原始未过滤列表 http://www.fileformat.info/info/unicode/char/search.htm?q=comma&han=Y&preview=entity) or, if applicable, to use Unicode classes (for example splitting by punctuation characters, see also http://inimino.org/~inimino/blog/javascript_cset)。
我正在尝试使用 javascript 字符串拆分拆分两个波斯字符,但拆分不正确。
var test = '"حسن روحانی"،"حسن+روحانی"';
var tmpkeywords = test.split(',');
console.log(tmpkeywords);
分割结果应该是这样的:
[""حسن روحانی""،""حسن+روحانی""]
但它像 [""حسن روحانی"،"حسن+روحانی"↵"]
一样来了。它适用于英文字符或数字。
我的fiddle:https://jsfiddle.net/tueo3sfa/1/
您的字符串 "حسن روحانی"،"حسن+روحانی"
不包含字符“,
”(U+002C 逗号),但包含“،
”(U+060C 阿拉伯语逗号):这就是它的原因不会拆分并且 return 只是整个原始字符串。
要得到你想要的,你需要按“،
”
var test = '"حسن روحانی"،"حسن+روحانی"';
var tmpkeywords = test.split(',');
console.log(tmpkeywords);
另请注意,其他语言中有许多不同的逗号,如果您需要以通用方式处理它们,您可能需要全部指定它们(例如原始未过滤列表 http://www.fileformat.info/info/unicode/char/search.htm?q=comma&han=Y&preview=entity) or, if applicable, to use Unicode classes (for example splitting by punctuation characters, see also http://inimino.org/~inimino/blog/javascript_cset)。