正则表达式匹配基于特定模式的字符串

Question

如何使用基于要查找的特定数量字符的模式使用 Regex 匹配字符串？

示例：

|V.2|58|
10001|W20101|W20101|G00001||||學徒劍盾|8|9|768||-1|1||||||||40002||||||1|14||2||40027|40028|40029|40030||2|22|113|||||||||||2|50|100|7|||||
10002|W30101|W30101|G00001||||學徒大斧|9|9|768||-1|1||||||||40003||||||1|17||3||40031|40032|40033|40034||2|26|142|||||||||||2|50|100|9|||||

如果我知道每行有 58 个垂直条，那么我将如何设置一个正则表达式来根据我拥有的信息匹配这些字符串？你也可以看出顶部的 58 是每个字符串中应该有的垂直条的数量。

10479|I00208||G00005||||青鐵礦|29||0||-1|30||||3|||||||||100|5|1||54|$原始的礦石，整體泛著鐵青的色澤。

#IMG$NoticeIcon#30~45級的副本掉落或跟公會商人購買。
$能與其他材料結合，製作40級的合金材料。
|||||||||||||||||||||||||||

还有一个例子。这个有多条线，但仍在 58 个垂直条的范围内。

有没有办法根据垂直条的数量精确匹配模式？

提前致谢！

Answer 1

要回答您的直接问题，是的，您可以将其与正则表达式匹配：

^[^|]*(?:\|[^|]*){58}*$

当使用 RegexOptions.Multiline 编译时，将从一行的第一个字符开始匹配，直到正好匹配 58 个小节（以及之后的任何 non-bar 个字符）。

测试一下live on regex101.com。

不过，它完全是 context-unaware，所以它绝对依赖于那个数字。在您的示例文件中，您需要从匹配中排除第一行 - 否则这两个条将包含在第一个匹配项中。

但是，您似乎没有使用正确的工具来完成这项工作。也许 CSV 解析器更适合？看来您的多行数据示例在包含换行符的条目中使用了引号字符，这是 CSV 解析器可以处理的内容 - 它还将处理条形出现在引号字段中的情况，这是此正则表达式无法做到的。

正则表达式匹配基于特定模式的字符串

Regex match strings based on a certain pattern

c#

regex

multiline

matching