这真是太疯狂了。我收到了一封垃圾邮件,其中有一个由明显的 Unicode 字符制作的 URL,这些字符令人惊讶地存在于斜体/粗体字母中,当我使用 Thunderbird 的“报告垃圾邮件电子邮件”功能向 Google 的垃圾邮件收集器报告它时,它已经被转换为 ASCII 字母,因此该 URL 未正确报告。
这是 Unicode 版本:<base href="http://𝙪𝙯𝙣𝙙𝙧𝙚𝙨𝙨.COM">
注意!这些字符是粗体/斜体不是因为我选择这样做,而是因为 Unicode 奇怪地包含粗体/斜体字母。
在此处查看十六进制值:
0011660   e   >   <   /   t   i   t   l   e   >   <   b   a   s   e  sp
       3e65    2f3c    6974    6c74    3e65    623c    7361    2065
      e   >   <   /   t   i   t   l   e   >   <   b   a   s   e    
0011700   h   r   e   f   =   "   h   t   t   p   :   /   /   p  gs  em
       7268    6665    223d    7468    7074    2f3a    f02f    999d
      h   r   e   f   =   "   h   t   t   p   :   /   / 360 235 231
0011720   *   p  gs  em   /   p  gs  em   #   p  gs  em  em   p  gs  em
       f0aa    999d    f0af    999d    f0a3    999d    f099    999d
    252 360 235 231 257 360 235 231 243 360 235 231 231 360 235 231
0011740   '   p  gs  em sub   p  gs  em   (   p  gs  em   (   .   C   O
       f0a7    999d    f09a    999d    f0a8    999d    2ea8    4f43
    247 360 235 231 232 360 235 231 250 360 235 231 250   .   C   O
URL 是否可以实际包含这些 Unicode 字符,或者所有浏览器都会将它们转换为 ASCII?
无论是 ASCII 还是 Unicode,ping 都会将此解析为 185.86.76.164。
为什么这些 Unicode 字符首先存在?谁要求粗体/斜体字母?