google 的搜索结果是否受到我们数据的影响?

Are google's search results influenced by our data?

我一直想知道。

例如,如果我搜索术语“作曲家”或“什么是作曲家”,它会显示 php 包管理器。为什么显示程序员相关的结果?显然,这样做是有道理的,因为 I 得到的结果 much 更相关我.

如果有抱负的作曲家 google 会怎样?他们会得到什么结果?

另一个例子是,如果我在搜索引擎中输入单词“spring”,它会显示 spring 框架,而不是季节。

所以,我的问题:

  1. google 是否真的使用它收集的数据来显示相关的搜索结果? (我说的不是广告,而是搜索结果)
  2. 如果是,为什么隐身模式不起作用?
  3. 如何避免 google 使用除了我输入的字词之外的其他参数来影响搜索结果?
  1. 是的。这是Google商业模式的核心。影响搜索结果的相同数据也适用于广告展示位置(请参阅他们的 real-time 出价系统);当您进行搜索时,很可能很快就会看到关于相同主题的广告。

  2. 隐身模式是一种非常有限的匿名形式;它真的不是很匿名。如果您在浏览器中访问包含某些 google-controlled 元素(例如 Google Analytics、CDN JS 库或字体)的页面,然后不久之后执行 google 搜索,将会有很多共同点,允许 google 将您匹配为很可能是同一个人(例如,您的 IP、一天中的时间、最近的类似请求、用户代理字符串、window 大小、可用字体)甚至如果它阻止可以明确识别您的 cookie。这种形式的指纹很难避免,尽管 Safari 比 Chrome 好很多。 Tor 通过规范化许多可识别指纹的元素以及隐藏您的 IP 来提供更强大的匿名化。

  3. 这很困难,因为利用所有这些信息确实会导致总体上更相关的搜索结果,因此 Google 尽其所能使用它符合 Google 的利益(在技术和主要范围内法律限制)。 Tor 将断开与 you 的搜索结果,但它可能会为您提供与最近可能与您使用相同 Tor 出口节点的其他人相关联的结果,这可能并不令人愉快!这同样适用于使用 VPN 服务。