如何提取 Unicode 字符,如 &\#1071;来自羽毛笔编辑器的 INNERHTML 的“Я”?

How to extract Unicode characters like &\#1071; for "Я" from a quill editor's INNERHTML?

我正在从数据库中提取俄语文本以将其输入到 Quill 编辑器中,以将此文本呈现给用户文本进行编辑。文本的每个字母都经过编码(如 &\#1071; 表示“Я”)。我的 HTML header 定义了 CONTENT="text/html; charset=iso-8859-1,因此显示正确。

一旦我的用户完成编辑,我就会读取我的 quill 编辑器的 INNERHTML 以将其写回我的数据库:

<php
    echo "var tmpVar = document.getElementById(\"LD_LOC\").innerHTML;";
?>

然而,none 原始编码(如 &\#1071;)仍然存在,但所有字母都被一些不可读的特殊字符(甚至不是“Я”)替换。

是否(如何)可以从我的羽毛笔编辑器的 INNERHTML 中提取编码文本?感谢您的帮助,提前致谢。

当你为整个网站切换到 UTF-8 时,你会得到更好的结果,我自己使用 quill 和 UTF-8,它甚至可以使用 4 字节的表情符号。整个站点意味着页面编码、页眉和数据库访问(如果可用)。我写了一篇关于这个话题的small article,有更深入的解释。