全文搜索各种外部格式 plone 4.2

full text searching for various external formats plone 4.2

我想在 plone 4.2(windows) 中启用全文搜索。我最终使用 buildout 安装了 Products.OpenXml 和 ftw.tika 插件,并正确地将它们的包添加到 eggs 以及zcml 类别,之后它们都显示在 portal_transforms 工具中。 即包含在 buildout.cfg 和 运行 中。

eggs = 
   Products.OpenXml
   ftw.tika
zcml = 
   Products.OpenXml
   ftw.tika

但是即使在使用清除和从 plone 目录工具重建之后,索引仍然不包括可搜索字段中除标题之外的任何内容。 请帮助我正确启用此功能,我是新手,所以请尽可能详细解释。

或者是否有另一种更好的方法(可能更快,对于多种格式或更好)在 4.2 版中启用对外部格式(doc、pdf、..)的全文搜索。

我从未在 Windows 上安装过 ftw.tika,但如果您设法设置了该服务并且它已启动并 运行ning 它应该可以工作。

要使用 ftw.tika,您需要按照 README 中的说明在您的 Plone 站点上安装 ftw.tika 软件包。这意味着您需要安装 egg 和必要的 zcml 配置以指向您本地的 tika 应用程序。

zcml =
    <configure xmlns:tika="http://namespaces.plone.org/tika">
        <tika:config path="${tika-app-download:destination}/${tika-app-download:filename}"
                     port="${tika:server-port}" />
    </configure>

还请确保您安装了 JAVA 的最新版本,因为它会尝试 运行 tika-app.jar

您可以通过查看 portal_transforms 工具来检查 ftw.tika 是否安装正确。应该有一个 tika_to_plain_text 转换 (http://plone/portal_transforms/tika_to_plain_text/manage_main),它应该如下所示:

如果没有,使用quickinstaller,或者portal_setup安装ftw.tika。

此外,服务器应该 运行 在 windows 上正常,它也是 Java。我想您不能使用包说明中的示例,因为它们是为 Unix 机器制作的。