测试从网页复制的非 ASCII 字符

Testing for non-ascii characters copied from webpages

所以,我发现了很多关于删除非 ascii 字符的信息,但并没有真正添加它们。

基本上,我有一个用户可以输入的文本字段,然后该字符串会在特定上下文中得到处理、存储和呈现。我希望用户有时只是从其他网页复制和粘贴文本,我想确保用户在该字段中输入的任何内容都不会破​​坏任何内容。 (我知道这是一个潜在的问题,因为用户复制和粘贴一个“实际上不是 ascii 的”已经破坏了一次)

这与删除非 ascii 字符无关!我想要一个好的 list/file 可能的问题字符,我可以复制和粘贴以验证它们是否得到正确处理。或者至少,找到这些潜在的复制粘贴 'impostor' 个字符的好方法。

谢谢汤姆·布洛杰特。移动并最小化文本后,以下是可以复制和粘贴的所有 UTF-8 字符的列表。 (这里是UTF-16 and UFT-32 lists. I don't have time to copy these lists to a text file. If those links are broken, use Google for UFT-16 table and Google for UTF-32 table

!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[]^_`abcdefghijklmnopqrstuvwxyz{|}~¡¢£¤¥¦§¨©ª« ¬®¯°±²³´µ¶·¸¹º»¼½¾¿ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿĂ㥹ĆćČčĎďĐđĘęĚěĹ弾ŁłŃńŇňŐőŒœŔŕŘřŚśŞşŠšŢţŤťŮůŰűŸŹźŻżŽžƒˆˇ˘˙˛˜˝–—''‚“”„†‡•…‰‹›€™