StringTokenizer 中的多个字符串定界符
Multiple String Delimiters in StringTokenizer
我正在标记一个 HTML 块,它必须被这些整个标记字符串分割:
<dd>
</dd>
<dt>
</dt>
我无法指定
StringTokenizer st = new StringTokenizer(block,"<dt></dt><dd></dd>");
st.nextToken();
这些不是字符的集合,而是整个字符串的集合。有没有一种优雅的方式来标记它?
来自JavaDoc:
StringTokenizer is a legacy class that is retained for compatibility
reasons although its use is discouraged in new code. It is recommended
that anyone seeking this functionality use the split method of String
or the java.util.regex package instead.
因此,如果您有一个包含要标记化的数据的 String block
。做一些像
String[] tokens = block.split("(<dd>)|(</dd>)|(<dt>)|(</dt>)");
然后你的标记将是数组中的元素tokens
我正在标记一个 HTML 块,它必须被这些整个标记字符串分割:
<dd>
</dd>
<dt>
</dt>
我无法指定
StringTokenizer st = new StringTokenizer(block,"<dt></dt><dd></dd>");
st.nextToken();
这些不是字符的集合,而是整个字符串的集合。有没有一种优雅的方式来标记它?
来自JavaDoc:
StringTokenizer is a legacy class that is retained for compatibility reasons although its use is discouraged in new code. It is recommended that anyone seeking this functionality use the split method of String or the java.util.regex package instead.
因此,如果您有一个包含要标记化的数据的 String block
。做一些像
String[] tokens = block.split("(<dd>)|(</dd>)|(<dt>)|(</dt>)");
然后你的标记将是数组中的元素tokens