了解 Google Analytics 第一方 cookie

Understanding Google Analytics first-party cookies

我不太了解 Google Analytics 使用的 cookie。我了解网站中包含的跟踪代码会收集有关页面点击率、访问持续时间、第一方域 cookie 等的某些信息。然后将所有这些信息附加到 gif 的查询字符串参数中像素请求,并将其发送到 Google Analytics 服务器。但是,我不明白的是,Google Analytics 如何理解这些第一方 cookie,因为像素是对第三方服务器 www.google-analytics.com 的请求。

因此,即使跟踪代码本身可以在发布商的代码中,并作为第一方执行,因此允许 Google Analytics 访问第一方 cookie,但是当这些 cookie 最终到达 GA 服务器,这些服务器不能真正读取 cookie,是吗?对此的一种解释可能是,一旦第一方 cookie 与 GA 共享,那么无论这些 cookie 发送到哪里(也不管该特定像素在浏览器,因为它是对 www.google-analytics.com 的请求),GA 服务器能够拥有与该用户相对应的唯一 ID(基于第一方 cookie ID),从而维护记录该用户的后续请求。这个理解对吗?

谁能帮忙澄清一下。谢谢你。

当前版本的 Google Analytics 使用单个 cookie 进行跟踪(并可能使用其他 cookie 进行节流或实验)。

这些是通过注入脚本的第一方 cookie,因为第三方 cookie 被拒绝的可能性更高。然而,作为您自己域上的第一方 cookie,它们根本不会到达 Google 分析服务器(至少不会作为 http headers 的一部分)。

该 cookie 在客户端仅用于维护允许将页面浏览量拼接到会话和用户中的客户端 ID。然后通过 JavaScript 读取来自 cookie 的信息,并将其附加到对跟踪服务器的请求中。

历史上虽然 cookie 信息确实是为了发送到服务器:Urchin,后来被 Google 收购并变成 Google Analytics 的产品,最初是一个日志文件分析器,增强 server logfiles with a cookie:

The UTM, or Urchin Traffic Monitor, was an early method for augmenting Apache (or IIS, etc.) log files with cookies, such that unique visitors could be established. This method entailed a line of javascript in the of each page on the site, and a small modification to the webserver’s logging behavior. Most of our competitors at the time used either logs only (old school) or javascript/cookies only (WebSideStory, etc.), and both necessarily missed out on a lot of available information. Urchin was the first to use both data sources in one unified collection method, neatly contained in augmented access-log files. Nowadays pretty much everything you’d want can be had via the cookie method (á la GA), but analyzing logs still has its advantages.

所以当时的 cookie 实际上是用于服务器端分析的。今天服务器端方面只是一个副作用,实际使用在客户端代码中。