将印地文文本从 pdf 粘贴到 HTML/XML

Paste hindi text from pdf to HTML/XML

我有一篇 Bharat 的 PDF 印地文文本。

我正在创建一个网页,我需要在其中显示它在我的网页中的样子。当尝试复制内容并粘贴时,它会呈现为一些乱码文本。我已经安装了相应的字体,当在 ms-word 中看到它显示正确时,请问我如何才能 show/display 保持原样。

直接粘贴就得到下面的结果

fpfdRlh;

谢谢

确保将文件保存为使用 UTF-8 编码。也使用UTF-8作为头部的网页字符集。

<meta charset="utf-8" />

编辑:我刚试过这个,对我来说效果很好。会不会是浏览器的问题?

我尝试参考的代码:

<html>
<head>
    <meta charset="UTF-8">
</head>
<body>
    <h1>देवना</h1>
</body>
</html>

还有一个 JsFiddle 给你:http://jsfiddle.net/zuymyz00/