如何在 JavaScript 的正则表达式中防止 space?
How to prevent space in regex in JavaScript?
我在下面有这个 JavaScript 代码来删除给定单词中的 spaces (ستاک ئوڤوولو),我在 Console.log 中尝试过,但它有问题。
var text = "ئایا ستاک ئەڤەفلۆو مانای چییە؟ دووبارە ستاک ئەڤەفلۆو مانای چییە؟";
text = text.replace(
new RegExp("(^|\s|_|«|»|\[|\(|\<|\>|\')(ستاک ئەڤەفلۆو)(?= |«|»|\.|،|_|\]|\s|\:|\)|\<|\>|؟|\'|\!|$)", 'g'),
function (x) { return x.replace(/ /gi, ''); } // 'i' is just to trick bidi algorithm on code view
);
下面是错误的输出:
ئایاستاکئەڤەفلۆو مانای چییە؟ دووبارەستاکئەڤەفلۆو مانای چییە؟
删除给定字符串之前的 space,因此它将给定字符串与前一个单词合并。
输出应该是:
ئایا ستاکئەڤەفلۆو مانای چییە؟ دووبارە ستاکئەڤەفلۆو مانای چییە؟
谢谢!
我建议通过将单个替代字符合并到字符 类 中来删除转义符,并通过仅删除第 2 组而非第 1 组中的空格来解决此问题。
var text = "ئایا ستاک ئەڤەفلۆو مانای چییە؟ دووبارە ستاک ئەڤەفلۆو مانای چییە؟";
text = text.replace(
new RegExp("(^|[\s_«»[(<>'])(ستاک ئەڤەفلۆو)(?=[«».،_\]\s:)<>؟'!]|$)", 'g'),
function (x, punct, word) { return (punct || "") + word.replace(/\s+/gi, ''); }
);
console.log(text)
所以,正则表达式的意思是
(^|[\s_«»[(<>'])
- 捕获第 1 组(替换回调函数中的 punct
):字符串开头或空格,_
、«
、»
、[
、(
、<
、>
或 '
(ستاک ئەڤەفلۆو)
- 捕获组 2 (word
):一些短语
(?=[«».،_\]\s:)<>؟'!]|$)
- 匹配字符串中紧跟 «
、»
、.
、،
、_
, ]
, 空格, :
, )
, <
, >
, ؟
, '
, !
或字符串结尾。
匹配后,punct
(如果匹配)附加到从所有空格中剥离的 word
(使用 word.replace(/\s+/gi, '')
)。
我在下面有这个 JavaScript 代码来删除给定单词中的 spaces (ستاک ئوڤوولو),我在 Console.log 中尝试过,但它有问题。
var text = "ئایا ستاک ئەڤەفلۆو مانای چییە؟ دووبارە ستاک ئەڤەفلۆو مانای چییە؟";
text = text.replace(
new RegExp("(^|\s|_|«|»|\[|\(|\<|\>|\')(ستاک ئەڤەفلۆو)(?= |«|»|\.|،|_|\]|\s|\:|\)|\<|\>|؟|\'|\!|$)", 'g'),
function (x) { return x.replace(/ /gi, ''); } // 'i' is just to trick bidi algorithm on code view
);
下面是错误的输出:
ئایاستاکئەڤەفلۆو مانای چییە؟ دووبارەستاکئەڤەفلۆو مانای چییە؟
删除给定字符串之前的 space,因此它将给定字符串与前一个单词合并。
输出应该是:
ئایا ستاکئەڤەفلۆو مانای چییە؟ دووبارە ستاکئەڤەفلۆو مانای چییە؟
谢谢!
我建议通过将单个替代字符合并到字符 类 中来删除转义符,并通过仅删除第 2 组而非第 1 组中的空格来解决此问题。
var text = "ئایا ستاک ئەڤەفلۆو مانای چییە؟ دووبارە ستاک ئەڤەفلۆو مانای چییە؟";
text = text.replace(
new RegExp("(^|[\s_«»[(<>'])(ستاک ئەڤەفلۆو)(?=[«».،_\]\s:)<>؟'!]|$)", 'g'),
function (x, punct, word) { return (punct || "") + word.replace(/\s+/gi, ''); }
);
console.log(text)
所以,正则表达式的意思是
(^|[\s_«»[(<>'])
- 捕获第 1 组(替换回调函数中的punct
):字符串开头或空格,_
、«
、»
、[
、(
、<
、>
或'
(ستاک ئەڤەفلۆو)
- 捕获组 2 (word
):一些短语(?=[«».،_\]\s:)<>؟'!]|$)
- 匹配字符串中紧跟«
、»
、.
、،
、_
,]
, 空格,:
,)
,<
,>
,؟
,'
,!
或字符串结尾。
匹配后,punct
(如果匹配)附加到从所有空格中剥离的 word
(使用 word.replace(/\s+/gi, '')
)。