Java 运行 长度编码

Java Run Length Encoding

运行 Length Encoding 将一个包含重复字符的字符串,例如 qqqqqWWWWr,转换为 5q4Wr。重复出现的字符前面应该加上它连续出现的次数。如果它只连续出现一次,则不应在其前面加上数字。

这是我目前所拥有的,但我似乎无法让它正常工作:

public class Compress {

    public static void main(String[] args) {
        System.out.print("Enter a string: ");
        String s = IO.readString();

        int currentRunLength = 1;
        String compressedString = "";

        for (int i = 0; i < s.length(); i++) {
            if (i == s.length() - 1){
                if (currentRunLength == 1) {
                compressedString += s.charAt(i);
                break;
                } else {
                compressedString += currentRunLength + s.charAt(i);
                break;
                }
            }
            if (s.charAt(i) == s.charAt(i + 1)) {
                currentRunLength++;
            }
            if (s.charAt(i) != s.charAt(i + 1) && currentRunLength > 1) {
                compressedString += currentRunLength + s.charAt(i);
                currentRunLength = 1;
            }
            if (s.charAt(i) != s.charAt(i + 1) && currentRunLength == 1) {
                compressedString += s.charAt(i);
            }
        }
        IO.outputStringAnswer(compressedString);
    }
}

示例运行

输入字符串:qqqqWWWr

结果:“117q90Wr”

当它是一个众所周知的算法时,也许你不应该重新发明轮子。我在以下 URL 找到了 Rosetta Code 的实现:http://rosettacode.org/wiki/Run-length_encoding#Java

如果原来的URL被删除,重新粘贴:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RunLengthEncoding {
    public static String encode(String source) {
        StringBuffer dest = new StringBuffer();
        for (int i = 0; i < source.length(); i++) {
            int runLength = 1;
            while (i+1 < source.length() && source.charAt(i) == source.charAt(i+1)) {
                runLength++;
                i++;
            }
            dest.append(runLength);
            dest.append(source.charAt(i));
        }
        return dest.toString();
    }

    public static String decode(String source) {
        StringBuffer dest = new StringBuffer();
        Pattern pattern = Pattern.compile("[0-9]+|[a-zA-Z]");
        Matcher matcher = pattern.matcher(source);
        while (matcher.find()) {
            int number = Integer.parseInt(matcher.group());
            matcher.find();
            while (number-- != 0) {
                dest.append(matcher.group());
            }
        }
        return dest.toString();
    }

    public static void main(String[] args) {
        String example = "WWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWWWWWWWWWWWWWWWWWWWWWWBWWWWWWWWWWWWWW";
        System.out.println(encode(example));
        System.out.println(decode("1W1B1W1B1W1B1W1B1W1B1W1B1W1B"));
    }
}

我看到的第一个问题是在这一行:

compressedString += currentRunLength + s.charAt(i);

您正在将 int 添加到 charchar 在加法之前转换为 int,然后加法的结果附加到您的 StringqASCII value 是 113。113 + 4 会解释你的 String -> 117.

的开头

问题与这一行有关:

compressedString += currentRunLength + s.charAt(i)

这样做是将 int 添加到 char(这将导致 int),然后将其添加到压缩字符串。

您可以通过这个小改动解决这个问题,这会将 currentRunLength 转换为字符串,然后附加 char:

compressedString += String.valueOf(currentRunLength) + s.charAt(i)