C#如何压缩大字符串?

C# how to compress large string?

我收到了来自 Html Agility Pack 的字符串 - 它已清理并且没有标签:

string cleanText = htmlDoc.DocumentNode.InnerText;

现在我的问题是如何清除所有字符,如空格、换行符等? 示例字符串:

                                                                                    @Vanni
                                            breitbart.com

                                            #swiat
                                            #usa
                                            #youtube
                                            #technologia
                                            +2 inne






                                    Akcja "They can't silence us" ma związek z pozwem wytoczonym przeciwko YouTube przez kanał PragerU za bezpodstawne zablokowanie konta.

我需要这样的字符串:

@Vannibreitbart.com#swiat#usa#youtube#technologia+2inneAkcja"Theycan'tsilenceus"mazwiązekzpozwemwytoczonymprzeciwkoYouTubeprzezkanałPragerUzabezpodstawnezablokowaniekonta.

正则表达式可能和任何正则表达式一样简单:

string compressed = Regex.Replace(bigstring, @"\s+", "");

您也可以将其作为字符数组进行迭代,并且仅将 Char.IsWhitespace() returns 为假的那些字符加载到字符串构建器

使用它来删除字符,将字符放在要删除的数组上。将字符串传递给方法。这是一个静态方法

  public static string RemoveCharSpecials(string document)
    {
        var charsToRemove = new string[] { "@", ",", ".", ";", "'", "(", ")", "-", " ", "/" };

        try
        {
            if (!string.IsNullOrEmpty(document))
            {
                foreach (var c in charsToRemove)
                    document = document.Replace(c, string.Empty);
            }

            return document;
        }
        catch
        {
            return "";
        }
    }