需要帮助设计一个在一堆文本文件中进行短语搜索的网站
Need help designing a website for phrase search in a bunch of text files
您输入要查找的一行,它会为您提供与某些上下文匹配的结果,即它上方和下方的几行。
我想知道最好的方法是什么。
每个文本文件可能不会超过 1 兆字节,它们的总数约为 200。
一种方法是将它们存储为文本文件,使用 Java 将它们读入内存,进行文本搜索并通过 JSP 提供结果。
我对JSP了解不多,总能学会,但我觉得可能太慢了。
有什么想法吗?
您正在寻找的是一个搜索引擎。有很多,但最受欢迎的是 ElasticSearch 和 Solr,它们都使用 Lucene Java 库。您对搜索系统的要求非常简单,两者都可以做得很好,但我自己会选择 ElasticSearch。也可以选择直接使用Lucene
return 结果 "with context" 的特征在 Eleasticsearch 中称为 highlighting。
您的数据似乎接近 200 兆字节,但如果它更小,您也可以使用 javascript 实现,例如 Lunr
您输入要查找的一行,它会为您提供与某些上下文匹配的结果,即它上方和下方的几行。
我想知道最好的方法是什么。
每个文本文件可能不会超过 1 兆字节,它们的总数约为 200。
一种方法是将它们存储为文本文件,使用 Java 将它们读入内存,进行文本搜索并通过 JSP 提供结果。
我对JSP了解不多,总能学会,但我觉得可能太慢了。
有什么想法吗?
您正在寻找的是一个搜索引擎。有很多,但最受欢迎的是 ElasticSearch 和 Solr,它们都使用 Lucene Java 库。您对搜索系统的要求非常简单,两者都可以做得很好,但我自己会选择 ElasticSearch。也可以选择直接使用Lucene
return 结果 "with context" 的特征在 Eleasticsearch 中称为 highlighting。
您的数据似乎接近 200 兆字节,但如果它更小,您也可以使用 javascript 实现,例如 Lunr