C#如何压缩大字符串?
C# how to compress large string?
我收到了来自 Html Agility Pack 的字符串 - 它已清理并且没有标签:
string cleanText = htmlDoc.DocumentNode.InnerText;
现在我的问题是如何清除所有字符,如空格、换行符等?
示例字符串:
@Vanni
breitbart.com
#swiat
#usa
#youtube
#technologia
+2 inne
Akcja "They can't silence us" ma związek z pozwem wytoczonym przeciwko YouTube przez kanał PragerU za bezpodstawne zablokowanie konta.
我需要这样的字符串:
@Vannibreitbart.com#swiat#usa#youtube#technologia+2inneAkcja"Theycan'tsilenceus"mazwiązekzpozwemwytoczonymprzeciwkoYouTubeprzezkanałPragerUzabezpodstawnezablokowaniekonta.
正则表达式可能和任何正则表达式一样简单:
string compressed = Regex.Replace(bigstring, @"\s+", "");
您也可以将其作为字符数组进行迭代,并且仅将 Char.IsWhitespace() returns 为假的那些字符加载到字符串构建器
中
使用它来删除字符,将字符放在要删除的数组上。将字符串传递给方法。这是一个静态方法
public static string RemoveCharSpecials(string document)
{
var charsToRemove = new string[] { "@", ",", ".", ";", "'", "(", ")", "-", " ", "/" };
try
{
if (!string.IsNullOrEmpty(document))
{
foreach (var c in charsToRemove)
document = document.Replace(c, string.Empty);
}
return document;
}
catch
{
return "";
}
}
我收到了来自 Html Agility Pack 的字符串 - 它已清理并且没有标签:
string cleanText = htmlDoc.DocumentNode.InnerText;
现在我的问题是如何清除所有字符,如空格、换行符等? 示例字符串:
@Vanni
breitbart.com
#swiat
#usa
#youtube
#technologia
+2 inne
Akcja "They can't silence us" ma związek z pozwem wytoczonym przeciwko YouTube przez kanał PragerU za bezpodstawne zablokowanie konta.
我需要这样的字符串:
@Vannibreitbart.com#swiat#usa#youtube#technologia+2inneAkcja"Theycan'tsilenceus"mazwiązekzpozwemwytoczonymprzeciwkoYouTubeprzezkanałPragerUzabezpodstawnezablokowaniekonta.
正则表达式可能和任何正则表达式一样简单:
string compressed = Regex.Replace(bigstring, @"\s+", "");
您也可以将其作为字符数组进行迭代,并且仅将 Char.IsWhitespace() returns 为假的那些字符加载到字符串构建器
中使用它来删除字符,将字符放在要删除的数组上。将字符串传递给方法。这是一个静态方法
public static string RemoveCharSpecials(string document)
{
var charsToRemove = new string[] { "@", ",", ".", ";", "'", "(", ")", "-", " ", "/" };
try
{
if (!string.IsNullOrEmpty(document))
{
foreach (var c in charsToRemove)
document = document.Replace(c, string.Empty);
}
return document;
}
catch
{
return "";
}
}