将高代码点 (> U+FFFF) 编码为 HTML 个实体

Encode a high code point (> U+FFFF) to HTML entities

我有一个输入字符串(URL-编码):

%F0%9F%98%8E

解码的是表情符号“”。

如何将其转换为 HTML-Code😎

http://unicode.online-toolz.com/tools/unicode-html-entities-convertor.php

这个网站正是我需要的。

<?php

function mb_ord($char, $encoding = 'UTF-8') {
    if ($encoding === 'UCS-4BE') {
        list(, $ord) = (strlen($char) === 4) ? @unpack('N', $char) : @unpack('n', $char);
        return $ord;
    } else {
        return mb_ord(mb_convert_encoding($char, 'UCS-4BE', $encoding), 'UCS-4BE');
    }
}

function mb_htmlentities($string, $hex = false, $encoding = 'UTF-8') {
    return preg_replace_callback('/[\x{80}-\x{10FFFF}]/u', function ($match) use ($hex) {
        return sprintf($hex ? '&#x%X;' : '&#%d;', mb_ord($match[0]));
    }, $string);
}


echo mb_htmlentities(urldecode('%F0%9F%98%8E'));

这将 return &#128526;

(注意,此答案基于 a modified version of functions provided by this answer here。)