如何在 Java 中的字符串中查找具有特定模式的子字符串
How to find substrings with a certain pattern within a string in Java
我正在使用 PDFBox 提取 PDF 文件的内容。之后我将得到一个巨大的字符串。
现在,我需要提取此字符串中与模式 XX-XXXX(其中 X 可以是数字或字母)或 XX YYYY(其中 X 是字母表,Y 是数字)。
我尝试了 ("([A-Z0-9]{2})-([A-Z0-9]{4})") 来匹配 XX - XXXX 模式,但它没有 return 我的期望值。
请对 Java 中的正则表达式做一个简短的研究。完成后查看 java.util.regex.Matcher。这有助于根据您的正则表达式查找文本。
下面是一个 link 会对你有很大帮助的。
http://tutorials.jenkov.com/java-regex/matcher.html
我正在使用 PDFBox 提取 PDF 文件的内容。之后我将得到一个巨大的字符串。
现在,我需要提取此字符串中与模式 XX-XXXX(其中 X 可以是数字或字母)或 XX YYYY(其中 X 是字母表,Y 是数字)。
我尝试了 ("([A-Z0-9]{2})-([A-Z0-9]{4})") 来匹配 XX - XXXX 模式,但它没有 return 我的期望值。
请对 Java 中的正则表达式做一个简短的研究。完成后查看 java.util.regex.Matcher。这有助于根据您的正则表达式查找文本。 下面是一个 link 会对你有很大帮助的。 http://tutorials.jenkov.com/java-regex/matcher.html