如何提取 Unicode 字符，如 &\#1071;来自羽毛笔编辑器的 INNERHTML 的“Я”？

Question

我正在从数据库中提取俄语文本以将其输入到 Quill 编辑器中，以将此文本呈现给用户文本进行编辑。文本的每个字母都经过编码（如 &\#1071; 表示“Я”）。我的 HTML header 定义了 CONTENT="text/html; charset=iso-8859-1，因此显示正确。

一旦我的用户完成编辑，我就会读取我的 quill 编辑器的 INNERHTML 以将其写回我的数据库：

<php
    echo "var tmpVar = document.getElementById(\"LD_LOC\").innerHTML;";
?>

然而，none 原始编码（如 &\#1071;）仍然存在，但所有字母都被一些不可读的特殊字符（甚至不是“Я”）替换。

是否（如何）可以从我的羽毛笔编辑器的 INNERHTML 中提取编码文本？感谢您的帮助，提前致谢。

Answer 1

当你为整个网站切换到 UTF-8 时，你会得到更好的结果，我自己使用 quill 和 UTF-8，它甚至可以使用 4 字节的表情符号。整个站点意味着页面编码、页眉和数据库访问（如果可用）。我写了一篇关于这个话题的small article，有更深入的解释。

How to extract Unicode characters like &\#1071; for "Я" from a quill editor's INNERHTML?