解析波斯语单个句子的正则表达式是什么?
What is a regular expression for parsing out persian individual sentences?
我正在寻找一个很好的 .NET 正则表达式,我可以用它来从波斯语文本中解析出单个句子。
所以我想使用一种模式来进行拆分,就像 .
؟
!
؛
跟随 space 而不是拆分。
在波斯语中没有大写字母,问号是 ؟
并且它是从右到左的语言。
看看这个例子,它有 4 个句子:
راهی که برایت هموار نیست و تو از میان تمام دغدغههای ریز و درشت این شهر انتخاب میکنی که یک روزت را با مردگان همراه شوی. بروی به دقیقه 91؛ بهجایی که با تمام شنیدههایت فرق دارد. بروی به مرز بین دنیا و آخرت، بهجایی که عروجیان راتطهیر میکنند، آرایش میکنند برای وصال یار؛
我发现这个问题很有用 What is a regular expression for parsing out individual sentences? 这里是英语的正则表达式
Regex rx = new Regex(@"(\S.+?[.!?])(?=\s+|$)");
foreach (Match match in rx.Matches(str)) {
int i = match.Index;
Console.WriteLine(match.Value);
}
这个怎么样:DEMO
([^!؟.؛]+[؟.؛!])
匹配不包含这些字符的所有内容,然后是标点符号?
我正在寻找一个很好的 .NET 正则表达式,我可以用它来从波斯语文本中解析出单个句子。
所以我想使用一种模式来进行拆分,就像 .
؟
!
؛
跟随 space 而不是拆分。
在波斯语中没有大写字母,问号是 ؟
并且它是从右到左的语言。
看看这个例子,它有 4 个句子:
راهی که برایت هموار نیست و تو از میان تمام دغدغههای ریز و درشت این شهر انتخاب میکنی که یک روزت را با مردگان همراه شوی. بروی به دقیقه 91؛ بهجایی که با تمام شنیدههایت فرق دارد. بروی به مرز بین دنیا و آخرت، بهجایی که عروجیان راتطهیر میکنند، آرایش میکنند برای وصال یار؛
我发现这个问题很有用 What is a regular expression for parsing out individual sentences? 这里是英语的正则表达式
Regex rx = new Regex(@"(\S.+?[.!?])(?=\s+|$)");
foreach (Match match in rx.Matches(str)) {
int i = match.Index;
Console.WriteLine(match.Value);
}
这个怎么样:DEMO
([^!؟.؛]+[؟.؛!])
匹配不包含这些字符的所有内容,然后是标点符号?