Solr 不索引 blob 文件

Solr doesn't index blob files

我在我们的 Plone 4.2.6 系统上使用 Collective Solr 4.1.0 Search。

我现在的问题如下。在我们的 Plone 服务器上,我们使用 ZODB 来创建 blob 文件。当我现在尝试在 Solr 中构建索引时,出现错误 INFO UniCMSData MISSING BLOB FILE: /opt/plone/data/blobstorage/0x31/0x37/0x32/0x36/0x39/0xa2/0xce/0x3e/0x03b3d7af6465c4cc.blob.

路径对我来说很合适,而且我知道 opt/plone/data/blobstorage 下所有 blob 文件都已存储。这让我想知道:是 Solr 没有找到它还是我的 Solr 配置出现了严重错误?还是 Solr 不能正确处理 ZODB blob?

感谢每一个小小的帮助:)

又是我:-)

没有,您的 solr 配置没有任何问题。

Solr 默认带有 pache tika,几乎可以将所有内容转换为 text/plain。

但您至少需要 collective.solr 5.0.1,因为使用此版本可以使用 collective.solr BinaryIndexer 直接从 blob 中提取可搜索文本。

如果您无法升级 plone 站点/collective.solr,您可以安装 ftw.tika --> https://pypi.python.org/pypi/ftw.tika/2.7.0

ftw.tika 注册了一个plone portal_transforms,它使用tika 将许多类型转换为plain/text。您也可以 运行 tika 作为服务。

ftw.tika 与 Plone 4.2 兼容。