WkHTMLtoPDF Unicode 问题

Question

我已经阅读了几篇类似的 Whosebug 帖子，其中 none 能够解决我的问题。

问题

我有一个由 WkHTMLtoPDF 生成的 PDF，其中包含一个 unicode RIGHT SINGLE QUOTATION MARK（U+2019 或 ’）字符。在浏览器中呈现，输出如下所示：

当我通过 WkHTMLtoPDF 运行时，我得到以下信息：

代码

我正在为我的 CSS 使用以下内容：

@font-face {
    font-family: localGeorgia;
    src: url("file:///usr/share/fonts/truetype/georgia/GEORGIA.TTF");
}

body {
    overflow: visible !important;
    font-family: localGeorgia, Georgia, Times, "Times New Roman", serif;
    font-size: 12px;
}

我也从本地电脑复制了Georgia字体到服务器（/usr/share/fonts/truetype/georgia/目录下有好几个文件），还有运行fc-cache -fv清除字体缓存和运行 fc-list 以验证 Georgia 是否已正确安装。 localGeorgia 字体系列是作为一种形式添加的，因为我仍然无法正常显示。

我已经通过在线文档和操作系统的字符映射表验证了 Georgia 字体确实支持 RIGHT SINGLE QUOTATION MARK（见下文），尽管我不知道如何明确证明这个字形是在 TrueType 文件中（我不熟悉打开或解析 TrueType 文件）

在这一点上，我不清楚为什么 WkHTMLtoPDF 显示的是这些乱七八糟的字符，而不是正确的 unicode 字形

其他详细信息（环境等）

我运行宁 Ubuntu 16.04

Laravel 版本 5.3

我正在使用 Laravel-Snappy 版本 0.3.3（使用的是 KNP-Snappy 版本 0.4.3）

我对 Snappy 的配置非常简单：

<?php
return array(
    'pdf' => array(
        'enabled' => true,
        'binary'  => base_path('vendor/h4cc/wkhtmltopdf-amd64/bin/wkhtmltopdf-amd64'),
        'timeout' => false,
        'options' => array(),
        'env'     => array(),
    ),
    'image' => array(
        'enabled' => false,
        'binary'  => '/usr/local/bin/wkhtmltoimage',
        'timeout' => false,
        'options' => array(),
        'env'     => array(),
    ),
);

安装的wkhtmltopdf版本是0.12.3（打了补丁的qt）

为了生成 PDF，我在视图上调用 ->render()，将其传递给 PDF::loadHTML，然后在结果上调用 ->inline() 并返回响应。这是我如何生成 PDF 的最小示例：

$property = Property::find(1);
$view = View::make("pdf.flier")->with(["property" => $property]);
$pdf = PDF::loadHTML($view->render())->inline();
return response($pdf)->header("application/pdf")->header("Content-Disposition", "attachment; filename=flier.pdf");

HTML 非常简单：

<html>
<head>
    <base href="{{ url("/") }}" />
    <link rel="stylesheet" type="text/css" href="css/flier.css" />
</head>
<body>
    <img src="{{ $property->image }}" />
    <h1>{{ $property->title }}</h1>
</body>
</html>

CSS 为 h1 提供了图像上方的绝对位置

Answer 1

几天后，我终于弄明白了

问题 而不是 在于字体。如果是这样，我会看到一个字形无法加载（例如 - 一个框或一个问号会出现在 unicode 字符的位置）

相反，我看到的是几个不正确的字形出现在所需的 unicode 字符的位置。这表示 encoding 问题，而不是 font 问题。 WkHTMLtoPDF 将 3 字节 unicode 字符解释为 3 个单独的 1 字节 ASCII 字符

问题是我的浏览器默认编码为 UTF-8，但 WkHTMLtoPDF 没有（至少在 0.12.3 版本中没有）。修复很简单：更新我的配置文件

<?php
return array(
    'pdf' => array(
        'enabled' => true,
        'binary'  => base_path('vendor/h4cc/wkhtmltopdf-amd64/bin/wkhtmltopdf-amd64'),
        'timeout' => false,
        'options' => array(
            'encoding' => 'utf-8'
        ),
        'env'     => array(),
    ),
    'image' => array(
        'enabled' => false,
        'binary'  => '/usr/local/bin/wkhtmltoimage',
        'timeout' => false,
        'options' => array(
            'encoding' => 'utf-8'
        ),
        'env'     => array(),
    ),
);

注意： 在我的研究中，我发现了一些声称“--encoding”选项对他们不起作用的人的例子，但是在 HTML 做过：

<meta charset="utf-8">

WkHTMLtoPDF Unicode 问题

WkHTMLtoPDF Unicode Issue

unicode

wkhtmltopdf

laravel-snappy

knp-snappy

问题

代码

其他详细信息（环境等）