正则表达式使用逗号 (,) 分隔符拆分字符串,但如果逗号在大括号 {,} 中则忽略
regexp to split a string using comma(,) delimiter but ignore if the comma is in curly braces{,}
我需要一个正则表达式来使用逗号 (,) 分隔符拆分字符串,但在下面的示例中如果逗号在花括号 {,} 中则忽略;
"asd", domain={"id"="test"}, names={"index"="user.all", "show"="user.view"}, test="test"
INTO(应该是)
"asd"
domain={"id"="test"}
names={"index"="user.all", "show"="user.view"}
test="test"
问题:(不是这个)
"asd"
domain={"id"="test"}
names={"index"="user.all"
"show"="user.view"}
test="test"
我试过这个但是它也在大括号内分割逗号{,}
\{[^}]*}|[^,]+
但我完全不知道这应该如何结束。
如有任何帮助,我们将不胜感激!
您可以使用以下正则表达式进行拆分
(,)(?=(?:[^}]|{[^{]*})*$)
所以使用 preg_split
你可以像
echo preg_split('/(,)(?=(?:[^}]|{[^{]*})*$)/',$your_string);
我看到了可能性 (不会因长字符串而崩溃):
第一个 preg_match_all
:
$pattern = '~
(?:
\G(?!\A), # contigous to the previous match, not at the start of the string
| # OR
\A ,?? # at the start of the string or after the first match when
# it is empty
)\K # discard characters on the left from match result
[^{,]*+ # all that is not a { or a ,
(?:
{[^}]*}? [^{,]* # a string enclosed between curly brackets until a , or a {
# or an unclosed opening curly bracket until the end
)*+
~sx';
if (preg_match_all($pattern, $str, $m))
print_r($m[0]);
第二个带有 preg_split
和回溯控制动词,以避免包含在大括号中的部分 (较短,但对于长字符串效率较低):
$pattern = '~{[^}]*}?(*SKIP)(*F)|,~';
print_r(preg_split($pattern, $str));
(*F)
强制模式失败,(*SKIP)
强制正则表达式引擎在模式失败时跳过已经匹配的部分。
最后一种方法的缺点是模式以交替开始。这意味着对于每个不是 {
或 ,
的字符,将测试交替的两个分支 (无意义)。但是,您可以使用 S
(study) 修饰符改进模式:
$pattern = '~{[^}]*}?(*SKIP)(*F)|,~S';
或者你可以不加交替地写,像这样:
$pattern = '~[{,](?:(?<={)[^}]*}?(*SKIP)(*F))?~';
这样,具有 {
或 ,
的位置之前使用比正则表达式引擎的正常行走更快的算法进行搜索。
我需要一个正则表达式来使用逗号 (,) 分隔符拆分字符串,但在下面的示例中如果逗号在花括号 {,} 中则忽略;
"asd", domain={"id"="test"}, names={"index"="user.all", "show"="user.view"}, test="test"
INTO(应该是)
"asd"
domain={"id"="test"}
names={"index"="user.all", "show"="user.view"}
test="test"
问题:(不是这个)
"asd"
domain={"id"="test"}
names={"index"="user.all"
"show"="user.view"}
test="test"
我试过这个但是它也在大括号内分割逗号{,}
\{[^}]*}|[^,]+
但我完全不知道这应该如何结束。 如有任何帮助,我们将不胜感激!
您可以使用以下正则表达式进行拆分
(,)(?=(?:[^}]|{[^{]*})*$)
所以使用 preg_split
你可以像
echo preg_split('/(,)(?=(?:[^}]|{[^{]*})*$)/',$your_string);
我看到了可能性 (不会因长字符串而崩溃):
第一个 preg_match_all
:
$pattern = '~
(?:
\G(?!\A), # contigous to the previous match, not at the start of the string
| # OR
\A ,?? # at the start of the string or after the first match when
# it is empty
)\K # discard characters on the left from match result
[^{,]*+ # all that is not a { or a ,
(?:
{[^}]*}? [^{,]* # a string enclosed between curly brackets until a , or a {
# or an unclosed opening curly bracket until the end
)*+
~sx';
if (preg_match_all($pattern, $str, $m))
print_r($m[0]);
第二个带有 preg_split
和回溯控制动词,以避免包含在大括号中的部分 (较短,但对于长字符串效率较低):
$pattern = '~{[^}]*}?(*SKIP)(*F)|,~';
print_r(preg_split($pattern, $str));
(*F)
强制模式失败,(*SKIP)
强制正则表达式引擎在模式失败时跳过已经匹配的部分。
最后一种方法的缺点是模式以交替开始。这意味着对于每个不是 {
或 ,
的字符,将测试交替的两个分支 (无意义)。但是,您可以使用 S
(study) 修饰符改进模式:
$pattern = '~{[^}]*}?(*SKIP)(*F)|,~S';
或者你可以不加交替地写,像这样:
$pattern = '~[{,](?:(?<={)[^}]*}?(*SKIP)(*F))?~';
这样,具有 {
或 ,
的位置之前使用比正则表达式引擎的正常行走更快的算法进行搜索。