剪切和粘贴期间网址更改

Web address changes during cut & paste

刚刚遇到了一些不太明白的事情。我收到一份包含网址的文件(我雇主的行政备忘录)。地址不是可点击的超链接,它只是文本。

有趣的是,当将地址复制并粘贴到 Web 浏览器地址栏时,它会导致 Web 浏览器尝试联系与剪切和粘贴文本包含的网址不同的网址。地址文本最初似乎已正确粘贴到地址栏中,直到我按下回车键——然后文本立即更改为其他内容。

请注意,这不是简单的网站重定向问题。我知道这一点,因为如果我手动输入相同的地址(而不是从原始文档复制粘贴),则会加载 "correct" 地址。只有在 copy/paste/load 过程之后,文本才会出现神奇的变化。

我还注意到,如果我先将地址复制并粘贴到记事本文本文件中,保存文本文件,关闭,重新打开,然后 copy/paste 到网络浏览器,"correct" 站点然后加载。值得注意的是,当我保存时,记事本警告说有 Unicode 格式的字符将会丢失。所以我假设当我保存为纯文本时,有一些隐藏的 unicode 文本被删除了。

但是,如果我在记事本中启用 "Show Unicode Control Characters" 选项,我什么也看不到。那么这里会发生什么?

具体来说,域转换如下:http://www.aaaaaaaaaa-usa.com/bbbbb/ddddddtools.html ==> www.xn--aaaaaaaaaausa-km6g.com。 (浏览器当然报找不到服务器的IP地址)

为了兼容性,域名应该是 ASCII 文本,所以有一个标准 (IDN) 可以将其他字符转换为 ASCII,使用两个字母前缀后跟两个破折号 --

此外,还有一些网络钓鱼攻击,使用其他字母的字母,看起来像拉丁字母,以欺骗用户。所以一些浏览器选择显示 ascii 名称而不是预期的名称。 (它会因浏览器而异,通常只针对选定的相似字符)。