Sphinx 搜索:结果中缺少 accents/diacritics

Sphinx Search: Missing accents/diacritics in results

我使用 Sphinx 搜索版本 2.2.11。

Sphinx returns 数据没有 accents/diacritics,例如。 "cerny" 而不是“černý”。

它将 return 更正项目,即使查询本身有 accents/diacritics,也只有 结果编码错误。

我知道我以前遇到过这个问题,但我不记得我是怎么解决的,那是 3 年前的事了, 我认为它是在版本 2 上。1.something 然后。

也许它的索引不正确?

我配置的相关部分:

searchd {
        ...
        collation_server = utf8_general_ci
}

index xxx {
        source = xxxSrc
        path = /var/lib/sphinxsearch/xxx
        charset_table = 0..9, A..Z->a..z, _, a..z, U+0e1->a, U+0c1->a, U+10d->c, U+10c->c,
        U+10f->d, U+10e->d, U+0e9->e, U+0c9->e, U+11b->e, U+11a->e, U+0ed->i, U+0cd->i, U+148->n,
        U+147->n, U+0f3->o, U+0d3->o, U+159->r, U+158->r, U+161->s, U+160->s, U+165->t, U+164->t,
        U+0fa->u, U+0da->u, U+16f->u, U+16e->u, U+0fd->y, U+0dd->y, U+17e->z, U+17d->z,
        index_exact_words = 1
        docinfo = extern
        morphology = stem_cz
        min_stemming_len = 5
        min_infix_len = 3
}

感谢任何帮助。

好的,实际上不是狮身人面像问题,而是 ODBC/Oracle

这修复了它

export NLS_LANG="CZECH_CZECH REPUBLIC.AL32UTF8"