如何在 JavaScript 的正则表达式中防止 space?

How to prevent space in regex in JavaScript?

我在下面有这个 JavaScript 代码来删除给定单词中的 spaces (ستاک ئوڤوولو),我在 Console.log 中尝试过,但它有问题。

var text = "ئایا ستاک ئەڤەفلۆو مانای چییە؟ دووبارە ستاک ئەڤەفلۆو مانای چییە؟";

text = text.replace(
            new RegExp("(^|\s|_|«|»|\[|\(|\<|\>|\')(ستاک ئەڤەفلۆو)(?= |«|»|\.|،|_|\]|\s|\:|\)|\<|\>|؟|\'|\!|$)", 'g'),
            function (x) { return x.replace(/ /gi, ''); } // 'i' is just to trick bidi algorithm on code view
        );

下面是错误的输出:

ئایاستاکئەڤەفلۆو مانای چییە؟ دووبارەستاکئەڤەفلۆو مانای چییە؟

删除给定字符串之前的 space,因此它将给定字符串与前一个单词合并。

输出应该是:

ئایا ستاکئەڤەفلۆو مانای چییە؟ دووبارە ستاکئەڤەفلۆو مانای چییە؟

谢谢!

我建议通过将单个替代字符合并到字符 类 中来删除转义符,并通过仅删除第 2 组而非第 1 组中的空格来解决此问题。

var text = "ئایا ستاک ئەڤەفلۆو مانای چییە؟ دووبارە ستاک ئەڤەفلۆو مانای چییە؟";

text = text.replace(
  new RegExp("(^|[\s_«»[(<>'])(ستاک ئەڤەفلۆو)(?=[«».،_\]\s:)<>؟'!]|$)", 'g'),
  function (x, punct, word) { return (punct || "") + word.replace(/\s+/gi, ''); }
);
console.log(text)

所以,正则表达式的意思是

  • (^|[\s_«»[(<>']) - 捕获第 1 组(替换回调函数中的 punct):字符串开头或空格,_«»[(<>'
  • (ستاک ئەڤەفلۆو) - 捕获组 2 (word):一些短语
  • (?=[«».،_\]\s:)<>؟'!]|$) - 匹配字符串中紧跟 «».،_, ], 空格, :, ), <, >, ؟, ', ! 或字符串结尾。

匹配后,punct(如果匹配)附加到从所有空格中剥离的 word(使用 word.replace(/\s+/gi, ''))。