LanguagueTool 规则中的标点符号
Punctuation in LanguagueTool rules
我不知道如何编写规则,其中标记涉及单词和标点符号的组合。
我应该如何处理 LanguageTool
规则中的标点符号?
我在网上查看并尝试了一些方法都无济于事。
例如,两者 1)
<rule id="THAT_AND_THAN_DOT" name="that and than dot">
<pattern>
<token>that</token>
<token regexp="yes">
another.|
himself.|
herself.|
itself.</token>
</pattern>
<message>Did you mean <suggestion>than .</suggestion>?</message>
<example correction='than another.'>Yes, better <marker>than another. </marker></example>
</rule>
2)
<rule id="THAT_AND_THAN_DOT" name="that and than dot">
<pattern>
<token>that</token>
<token regexp="yes">
another|
himself|
herself|
itself</token>
<token regexp="yes">
[.]</token>
</pattern>
<message>Did you mean <suggestion>than .</suggestion>?</message>
<example correction='than another.'>Yes, better <marker>than another. </marker></example>
</rule>
和 3)
<rule id="THAT_AND_THAN_DOT" name="that and than dot">
<pattern>
<token>that</token>
<token regexp="yes">
another|
himself|
herself|
itself</token>
<token regexp="yes">
[:punct:]</token>
</pattern>
<message>Did you mean <suggestion>than .</suggestion>?</message>
<example correction='than another.'>Yes, better <marker>than another. </marker></example>
</rule>
失败。另一方面
<rule id="THAT_AND_THAN_DOT" name="that and than dot">
<pattern>
<token>that</token>
<token regexp="yes">
another|
himself|
herself|
itself</token>
</pattern>
<message>Did you mean <suggestion>than .</suggestion>?</message>
<example correction='than another.'>Yes, better <marker>than another. </marker></example>
</rule>
有效,尽管没有考虑我想做的点。
注意: 我在 Texstudio
.
中使用 LanguageTool
你在 2) 中的代码几乎可以工作,只是你在模式中有一个标记 that
但在你的例句中有 than
,所以它永远不会匹配,独立于标点符号。通常,标点符号有自己的标记,因此它也需要在模式中有自己的标记。您可以使用 http://community.languagetool.org/ruleEditor/expert 测试您的规则,如果出现问题,它还会显示一条消息,其中包含已应用的标记化。
我不知道如何编写规则,其中标记涉及单词和标点符号的组合。
我应该如何处理 LanguageTool
规则中的标点符号?
我在网上查看并尝试了一些方法都无济于事。
例如,两者 1)
<rule id="THAT_AND_THAN_DOT" name="that and than dot">
<pattern>
<token>that</token>
<token regexp="yes">
another.|
himself.|
herself.|
itself.</token>
</pattern>
<message>Did you mean <suggestion>than .</suggestion>?</message>
<example correction='than another.'>Yes, better <marker>than another. </marker></example>
</rule>
2)
<rule id="THAT_AND_THAN_DOT" name="that and than dot">
<pattern>
<token>that</token>
<token regexp="yes">
another|
himself|
herself|
itself</token>
<token regexp="yes">
[.]</token>
</pattern>
<message>Did you mean <suggestion>than .</suggestion>?</message>
<example correction='than another.'>Yes, better <marker>than another. </marker></example>
</rule>
和 3)
<rule id="THAT_AND_THAN_DOT" name="that and than dot">
<pattern>
<token>that</token>
<token regexp="yes">
another|
himself|
herself|
itself</token>
<token regexp="yes">
[:punct:]</token>
</pattern>
<message>Did you mean <suggestion>than .</suggestion>?</message>
<example correction='than another.'>Yes, better <marker>than another. </marker></example>
</rule>
失败。另一方面
<rule id="THAT_AND_THAN_DOT" name="that and than dot">
<pattern>
<token>that</token>
<token regexp="yes">
another|
himself|
herself|
itself</token>
</pattern>
<message>Did you mean <suggestion>than .</suggestion>?</message>
<example correction='than another.'>Yes, better <marker>than another. </marker></example>
</rule>
有效,尽管没有考虑我想做的点。
注意: 我在 Texstudio
.
LanguageTool
你在 2) 中的代码几乎可以工作,只是你在模式中有一个标记 that
但在你的例句中有 than
,所以它永远不会匹配,独立于标点符号。通常,标点符号有自己的标记,因此它也需要在模式中有自己的标记。您可以使用 http://community.languagetool.org/ruleEditor/expert 测试您的规则,如果出现问题,它还会显示一条消息,其中包含已应用的标记化。