为 Google Analytics 创建过滤器以删除垃圾邮件

Creating filters for Google Analytics to remove spam

我已成功地从 Google Analytics 中过滤掉来自某些垃圾网站的点击。这是一场持续的战斗,因为新网站不断涌现并污染了我的 acquisition/referral 结果。

目前,GA 过滤器使用以下匹配来阻止以下所有网站显示在数据中:

.*(best\-seo\-solution|semalt|buttons\-for\-website|social\-buttons|best\-seo\-offer|Get\-Free\-Traffic\-Now|buttons\-for\-your\-website|free\-share\-buttons)\.com.*

我自己添加了其中的大部分并且它有效,但是我现在需要创建一个模式,允许我输入不是标准 something.com 模式的 URL。例如:

site4.free-share-buttons.com
site5.free-share-buttons.com

所以在这些情况下,结束总是相同的,但开始可以是可变的。

buy-cheap-online.info

在这种情况下,它以 .info

结尾
www.event-tracking.com

这个使用 www. 而其他的不使用

http://webmaster-traffic.com

这个也有 http://

最重要的是,过滤模式最多只能有 255 个字符(但我可以有多个过滤模式)所以我需要将它分段。

我如何创建一个可以定位到上述所有 URL 的正则表达式过滤器模式?

Google Analytics 允许在表达式很简单时创建正则表达式而不必转义所有特殊字符。因此,您可以编写不带反斜杠的表达式 \.* 您甚至可以删除 .com 和括号,因为这些名称已经非常具体

best-seo-solution|semalt|buttons-for-website|social-buttons|best-seo-offer|Get-Free-Traffic-Now|buttons-for-your-website|free-share-buttons|event-tracking|buy-cheap.info

如果您碰巧收到了具有通用名称的垃圾邮件,只需为这种特定情况添加全名 |commonname.net

您可以继续操作直到达到 255 个字符,之后只需添加第二个过滤器即可。这会起作用,但是 它有 3 个缺点

  • 首先每周有 1 或 2 个新的垃圾邮件发送者

  • 第二个你添加它的时候你已经有一些点击

  • 第三,这是一种新行为,一些 垃圾邮件现在通过直接访问 与推荐一起命中,并且此过滤器不会阻止.

为防止这种情况发生,我建议您使用有效的主机名过滤器,此过滤器将只允许命中您的主机名之一,并且所有鬼垃圾邮件将被排除,因为它们使用假主机名或未设置。

在这里您可以找到更多关于引荐垃圾邮件和有效主机名过滤器的信息

http://www.ohow.co/things-you-must-know-about-spam-in-google-analytics/