Invoke-WebRequest 和希伯来字符

Invoke-WebRequest and Hebrew characters

我已经尝试 PS 的 reghack 来支持希伯来语字符。我可以毫无问题地输入希伯来语,但由于某些原因,从 Invoke-WebRequest 返回的包含希伯来语的字符是乱码(请参见以下屏幕截图)。

这是我要查询的网站 URL: https://www.hometheater.co.il/vt278553.html

更新: 看起来返回的内容类型总是字符集 Windows-1255,这可能是问题所在。

这似乎不仅是必须指定编码的问题,而且shell 无法正确显示编码。如果您为文件指定编码并使用像样的文本编辑器(不是记事本,而是例如 Notepad++)编辑它,那么您将看到它已正确解析它。

Invoke-WebRequest -Uri "https://www.hometheater.co.il/vt278553.html" -ContentType "text/plain; charset=Windows-1255" -OutFile content.txt

我们还可以通过读取并将其写入另一个文件来测试内存中的表示是否正确:

Get-Content .\content.txt | Set-Content test.txt