使用正则表达式从字符串中拆分数字

Split Numbers From Strings Using Regular Expressions

我想从 masterArray 中的字母中拆分数字并将它们存储在单独的 ArrayList 中(splitIntegersplitString)。目前,我有 splitInteger ArrayList 中的数字,但是 splitString ArrayList 中的字母没有正确分隔。

splitString ArrayList 有多余的空格、逗号,ArrayList 中的元素顺序不正确。

输出应如下所示:

[55CC, 1C, 255D, 0F]
[55, 1, 255, 0]
[CC, C, D, F]

目前输出如下:

[55CC, 1C, 255D, 0F]
[55, 1, 255, 0]
[, CC, , C, , D, , F]

我尝试弄乱我的 removeNumbers 变量的正则表达式,但对正则表达式知之甚少。

import java.util.ArrayList;

public class SplitArrayExample {

public static void main(String[] args) 
{
    int convertValue = 0;

    // Using Regular Expressions to remove Characters 
    String removeLetters = "([A-z]+)";
    String removeNumbers = "([0-9]+)";

    // This is the master list.
    ArrayList<String> masterArray = new ArrayList<String>();
        masterArray.add("55CC");
        masterArray.add("1C");
        masterArray.add("255D");
        masterArray.add("0F");

    // These are used to split the integer and string characters
    ArrayList<Integer> splitInteger = new ArrayList<Integer>();
    ArrayList<String> splitString = new ArrayList<String>();

    for (String element : masterArray)
    {
        // Used to split the strings
        String[] removingLetterCharacters = element.split(removeLetters);
        String[] removingNumberCharacters = element.split(removeNumbers);

        // This for-each loop removes letter values and converts numbers to integer values
        for(String addObject : removingLetterCharacters)
        {
            convertValue = Integer.parseInt(addObject);
            splitInteger.add(convertValue); 
        }

        // This for-each loop removes the integer values
        for(String addObject : removingNumberCharacters)
        {
            splitString.add(addObject);
        }
    }

    System.out.println(masterArray);
    System.out.println(splitInteger);


    System.out.println(splitString);
    }
}

split用于获取字母列表时,对于原始列表中的每个元素,该列表将包含两个元素:一个空字符串,以及实际字符串。

例如,对于元素 55CC,字母列表将包含 [, CC].

要解决这个问题,一种方法是在将字符串添加到输出列表之前检查它是否为空:

for (String addObject : removingLetterCharacters) {
    if(!addObject.isEmpty()) {
        convertValue = Integer.parseInt(addObject);
        splitInteger.add(convertValue);
    }
}

for (String addObject : removingNumberCharacters) {
    if(!addObject.isEmpty()) {
        splitString.add(addObject);
    }
}

但是,如果原始列表包含更复杂的字母和数字组合,则使用 split 将不起作用。例如,如果列表是 [55CC7, 1C, 255D, 0F],那么数字列表将包含 5 个数字而不是 4,因为 split 方法会拆分元素 55CC7 分成两个数字 557。更好的替代方法是使用 String#replaceAll 将模式替换为空字符串。在这种情况下,正则表达式可以更简单:

// Using Regular Expressions to remove Characters
String removeLetters = "[A-z]";
String removeNumbers = "\d";

// This is the master list.
ArrayList<String> masterArray = new ArrayList<String>();
masterArray.add("7CC55");
masterArray.add("1C");
masterArray.add("255D");
masterArray.add("0F");


// These are used to split the integer and string characters
ArrayList<Integer> splitInteger = new ArrayList<Integer>();
ArrayList<String> splitString = new ArrayList<String>();

for (String element : masterArray) {
   String removingLetterCharacters = element.replaceAll(removeLetters, "");
   String removingNumberCharacters = element.replaceAll(removeNumbers, "");
   splitInteger.add(Integer.parseInt(removingLetterCharacters));
   splitString.add(removingNumberCharacters);
}

尝试使用 String 的 replaceAll 方法,以便它从您的 String 中删除所有字符或数字,例如:

String removeLetters = "([A-Z]+)";//you have typo here note capital Z
for (String element : masterArray) {
    String removingLetterCharacters = element.replaceAll(removeLetters, "");
    String removingNumberCharacters = element.replaceAll(removeNumbers, "");
    convertValue = Integer.parseInt(removingLetterCharacters);
    splitInteger.add(convertValue);
    splitString.add(removingNumberCharacters);
}

Output:
[55CC, 1C, 255D, 0F]
[55, 1, 255, 0]
[CC, C, D, F]