Google 之前的搜索引擎

Search engines in pre-Google age

众所周知,在世纪之交,Google凭借其革命性的 PageRank 算法从其他搜索引擎中脱颖而出(尽管从数学上讲,PageRank 只是一个非常简单的应用Perron-Frobenius 定理)。但是,关于 Google 之前的搜索引擎使用的那些搜索算法的信息在网上几乎找不到。

有人知道像 Lycos、Alta Vista、Excite、YahooAsk Jeeves 这样的大牌是如何执行网络搜索和网页排名的吗?是否有任何 material 更详细地记录了这些算法?

例如,我从这个 short history of early search engines 中了解到 Excite 做了 "use statistical analysis of word relationships to improve relevancy of searches on the Internet",而 Yahoo 维护 "a highly regarded directory of sites that were cataloged by human editors"。这是一个有价值的信息,但描述仍然太模糊。

有一部关于互联网历史(截至 2008 年)的纪录片,名为下载:互联网历史。我认为它提到雅虎手工策划和分类流行网站。

我认为它就像地址簿一样工作,网站需要选择加入并向雅虎提供其网址和类别。