VB.Net 正则表达式 xml 白盒 ssrs pdf

VB.Net Regex xml whitebox ssrs pdf

我有一个输出为 PDF 的 SSRS (2008 r2) 报告。该报告采用字符串(最初采用 HTML 格式)并使用自定义 VB 函数使用正则表达式删除 HTML、空格和 XML 字符。问题是我仍然在结果字符串中留下一个白框字符。它看起来像下面的符号:

我的VB函数如下:

Public Shared Function GetNotes(ByVal strNotes As String) As SqlString
    ' Gets notes within HTML tags
    Dim s As String

    Try
        s = System.Text.RegularExpressions.Regex.Replace(strNotes, "<.*?\n?.*?>", " ")
        s = System.Text.RegularExpressions.Regex.Replace(s, " +", " ")
        s = System.Text.RegularExpressions.Regex.Replace(s, "<[^<>]*?>", " ")
        s = System.Text.RegularExpressions.Regex.Replace(s, "[\t\r\n] ", "")
        s = s.Replace("&amp;", "&")
        s = s.Replace("&nbsp;", "")
        s = s.Trim()
    Catch ex As Exception
        Return New SqlString("Description:  ")
    End Try
    Return New SqlString(s)
End Function

我应该添加什么来删除这个白框?

根据您的评论,该字符仅出现在字符串的末尾。

您可以轻松地使用 TrimEnd 来达到这个目的:

Dim s As String = "Some text with □"
s = s.TrimEnd("□")

或者,这也可能有效(因为方框是 \u25A1 字符):

s = Regex.Replace(s, "[\u25A1]", String.Empty)

输出: