用于重叠匹配的 C++ 正则表达式
C++ regex for overlapping matches
我有一个字符串 'CCCC',我想匹配其中的 'CCC',重叠。
我的代码:
...
std::string input_seq = "CCCC";
std::regex re("CCC");
std::sregex_iterator next(input_seq.begin(), input_seq.end(), re);
std::sregex_iterator end;
while (next != end) {
std::smatch match = *next;
std::cout << match.str() << "\t" << "\t" << match.position() << "\t" << "\n";
next++;
}
...
然而这只是returns
CCC 0
并跳过我需要的 CCC 1
解决方案。
我读到关于非贪婪的 '?'匹配,但我无法让它工作
您的正则表达式可以放入捕获括号中,这些括号可以用积极的前瞻性包装起来。
要使其也适用于 Mac,请确保正则表达式匹配(因此 消耗)单个通过在前瞻之后放置 .
(或 - 也匹配换行符字符 - [\s\S]
)来在每个匹配项中设置字符。
然后,您需要修改代码以获取第一个捕获组值,如下所示:
#include <iostream>
#include <regex>
#include <string>
using namespace std;
int main() {
std::string input_seq = "CCCC";
std::regex re("(?=(CCC))."); // <-- PATTERN MODIFICATION
std::sregex_iterator next(input_seq.begin(), input_seq.end(), re);
std::sregex_iterator end;
while (next != end) {
std::smatch match = *next;
std::cout << match.str(1) << "\t" << "\t" << match.position() << "\t" << "\n"; // <-- SEE HERE
next++;
}
return 0;
}
输出:
CCC 0
CCC 1
我有一个字符串 'CCCC',我想匹配其中的 'CCC',重叠。
我的代码:
...
std::string input_seq = "CCCC";
std::regex re("CCC");
std::sregex_iterator next(input_seq.begin(), input_seq.end(), re);
std::sregex_iterator end;
while (next != end) {
std::smatch match = *next;
std::cout << match.str() << "\t" << "\t" << match.position() << "\t" << "\n";
next++;
}
...
然而这只是returns
CCC 0
并跳过我需要的 CCC 1
解决方案。
我读到关于非贪婪的 '?'匹配,但我无法让它工作
您的正则表达式可以放入捕获括号中,这些括号可以用积极的前瞻性包装起来。
要使其也适用于 Mac,请确保正则表达式匹配(因此 消耗)单个通过在前瞻之后放置 .
(或 - 也匹配换行符字符 - [\s\S]
)来在每个匹配项中设置字符。
然后,您需要修改代码以获取第一个捕获组值,如下所示:
#include <iostream>
#include <regex>
#include <string>
using namespace std;
int main() {
std::string input_seq = "CCCC";
std::regex re("(?=(CCC))."); // <-- PATTERN MODIFICATION
std::sregex_iterator next(input_seq.begin(), input_seq.end(), re);
std::sregex_iterator end;
while (next != end) {
std::smatch match = *next;
std::cout << match.str(1) << "\t" << "\t" << match.position() << "\t" << "\n"; // <-- SEE HERE
next++;
}
return 0;
}
输出:
CCC 0
CCC 1