将 Sphinx 搜索与 Azure Table 存储结合使用

Using Sphinx Search With Azure Table Storage

我目前有 Sphinx SE 运行 针对 ms sql 服务器,它在过去几年中运行良好。使用的 table 狮身人面像最近扩展了很多,我们需要利用将 table 移动到天蓝色 table 存储所提供的速度。

我有什么选择可以让 sphinx 从 azure 索引这个 table?我知道它支持 ms sql,但 azure table 存储产品是另一回事。我还发现 Sphinx 支持 xml 输入,但很难将所有这些数据导出到每 5 分钟读取一次的文件中。有没有人使用 Azure Table 存储解决了这个问题?

谢谢

那么 XMLpipe(甚至 TSVpipe)将是连接到 table-store 的方式。缺少基于本机 SQL 的驱动程序。

...但是是的,一个简单的实现可能会加载所有数据。这实际上是你可能用 MS-SQL 做的事情。只是数据实际上足够小,它的合理实用性。

在 MS-SQL 上加载所有数据同样是 "expensive"

所以你的问题实际上更多的是如何索引 'large' 数据集。某种增量更新系统,因此您只需要加载“更改”。 (事实上​​,使用存储 Table,然后就变成了实现的一个微不足道的细节)

一个概念在 Sphinx 中可能会看到很多,叫做 'main'+'delta' http://www.sphinxconsultant.com/sphinx-search-delta-indexing/

这也适用于 XMLpipe。所以可以与 Asure 一起工作。你只需要想出几个脚本,一个用于下载大量数据(最初调试 'main',它不经常使用)

...然后第二个脚本只获取新记录。 运行 某种查询

你只需要某种脚本从 Azure 流式传输,并输出 itehr XML 或 TSV https://www.google.com/search?q=Azure+Table+Storage+stream