如何使 .htm 页面接受非英语语言的字母?

How to make a .htm page accept letters of languages other than english?

目前我正在开发一个将 .msg 文件转换为 pdf 的应用程序。我正在使用将 html 转换为 pdf file.So 的 pdf 转换器,我将电子邮件转换为 html,然后使用该工具将其转换为 pdf。一切正常,直到我尝试将法语电子邮件转换为 pdf。当我用 notepad++ 打开法语电子邮件的 .htm 文件时,它显示法语重音字母(é、à、ù、ê、ë、....)很好,但是当我在浏览器中打开它时,法语重音字母更改为一些奇怪的 symbols.When,我将 "meta http-equiv="content-type" content="text/html;charset=utf-8" 标记添加到 html.It 开始正确显示法语字母。 那么,这个 "meta" 标签是否会使 html 只适用于所有可能的法语 letters.Or 选择性标签? 还有什么标签可以让 html 接受任何语言的字母吗? 提前致谢。

计算机处理二进制数据。在幕后,HTML(或其他类型的文本)文档中的所有字符(字母、数字、标点符号等)就计算机而言只是一组 1 和 0。

这些 1 和 0 组代表哪些字符取决于字符编码的选择

Unicode 编码(包括 UTF-8)几乎可以表示任何人类语言。

如果文档实际上是用 UTF-8 编码的,并且您告诉浏览器它是用 UTF-8 编码的,那么您不太可能 运行 变成您无法表示的字符。

如需进一步阅读,请从 Character encodings: Essential concepts

开始

UTF-8 (Unicode) 涵盖了世界上几乎所有的字符和符号。

要正确显示 HTML 页面,Web 浏览器必须知道页面中使用的字符集。

这是在 <meta> 标签中指定的:

对于 HTML4: <meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

对于 HTML5:<meta charset="UTF-8">

注意:如果浏览器在网页中检测到 ISO-8859-1,则默认为 ANSI,因为 ANSI 与 ISO-8859-1 相同,除了 ANSI 具有32 个额外字符。

您可以获得更多信息here