将高代码点 (> U+FFFF) 编码为 HTML 个实体
Encode a high code point (> U+FFFF) to HTML entities
我有一个输入字符串(URL-编码):
%F0%9F%98%8E
解码的是表情符号“”。
如何将其转换为 HTML-Code😎
?
http://unicode.online-toolz.com/tools/unicode-html-entities-convertor.php
这个网站正是我需要的。
<?php
function mb_ord($char, $encoding = 'UTF-8') {
if ($encoding === 'UCS-4BE') {
list(, $ord) = (strlen($char) === 4) ? @unpack('N', $char) : @unpack('n', $char);
return $ord;
} else {
return mb_ord(mb_convert_encoding($char, 'UCS-4BE', $encoding), 'UCS-4BE');
}
}
function mb_htmlentities($string, $hex = false, $encoding = 'UTF-8') {
return preg_replace_callback('/[\x{80}-\x{10FFFF}]/u', function ($match) use ($hex) {
return sprintf($hex ? '&#x%X;' : '&#%d;', mb_ord($match[0]));
}, $string);
}
echo mb_htmlentities(urldecode('%F0%9F%98%8E'));
这将 return 😎
(注意,此答案基于 a modified version of functions provided by this answer here。)
我有一个输入字符串(URL-编码):
%F0%9F%98%8E
解码的是表情符号“”。
如何将其转换为 HTML-Code😎
?
http://unicode.online-toolz.com/tools/unicode-html-entities-convertor.php
这个网站正是我需要的。
<?php
function mb_ord($char, $encoding = 'UTF-8') {
if ($encoding === 'UCS-4BE') {
list(, $ord) = (strlen($char) === 4) ? @unpack('N', $char) : @unpack('n', $char);
return $ord;
} else {
return mb_ord(mb_convert_encoding($char, 'UCS-4BE', $encoding), 'UCS-4BE');
}
}
function mb_htmlentities($string, $hex = false, $encoding = 'UTF-8') {
return preg_replace_callback('/[\x{80}-\x{10FFFF}]/u', function ($match) use ($hex) {
return sprintf($hex ? '&#x%X;' : '&#%d;', mb_ord($match[0]));
}, $string);
}
echo mb_htmlentities(urldecode('%F0%9F%98%8E'));
这将 return 😎
(注意,此答案基于 a modified version of functions provided by this answer here。)