无法使用 vb.net 从网页源获取非英文字符
Unable to get non english characters from webpage source using vb.net
我多次使用下面提供的代码块来获取在我的案例中始终有效的网页源代码。
ServicePointManager.SecurityProtocol = SecurityProtocolType.Tls12
Dim wc As New WebClient
wc.Encoding = Encoding.UTF8
Dim Source As String = wc.DownloadString("https://www.rp.pl/")
此代码未使用 Encoding
获取波兰语字符。我也尝试过其他可用的 Encoding
,但没有成功。就像在页面中,有一个标题"Rafał Trzaskowski kontra TVP. Chce sprostowania",但是通过上面的代码片段获取源后,它显示"Rafa� Trzaskowski kontra TVP. Chce sprostowania"。
任何人都可以帮我更正我的代码,以便我准确获取页面源代码吗?
您是否尝试过输出波兰语字符,以确保问题不在于控制台的限制?或者将 "Source" 变量保存在 txt 文件中,以便在记事本中查看。可能字符串包含正确的值但无法显示。至少这是我过去遇到的问题
只需查看网页使用的编码并进行匹配即可。
wc.Encoding = Encoding.GetEncoding(1250)
它会起作用。
我多次使用下面提供的代码块来获取在我的案例中始终有效的网页源代码。
ServicePointManager.SecurityProtocol = SecurityProtocolType.Tls12
Dim wc As New WebClient
wc.Encoding = Encoding.UTF8
Dim Source As String = wc.DownloadString("https://www.rp.pl/")
此代码未使用 Encoding
获取波兰语字符。我也尝试过其他可用的 Encoding
,但没有成功。就像在页面中,有一个标题"Rafał Trzaskowski kontra TVP. Chce sprostowania",但是通过上面的代码片段获取源后,它显示"Rafa� Trzaskowski kontra TVP. Chce sprostowania"。
任何人都可以帮我更正我的代码,以便我准确获取页面源代码吗?
您是否尝试过输出波兰语字符,以确保问题不在于控制台的限制?或者将 "Source" 变量保存在 txt 文件中,以便在记事本中查看。可能字符串包含正确的值但无法显示。至少这是我过去遇到的问题
只需查看网页使用的编码并进行匹配即可。
wc.Encoding = Encoding.GetEncoding(1250)
它会起作用。