Google Analytics / Data Studio - 在处理数据之前从 URL 中间删除字符串

Google Analytics / Data Studio - Remove string from the middle of a URL before processing data

我有一个包含数千个目录的网站,我试图通过使用以下字段找出哪些目录最受欢迎

REGEXP_EXTRACT(Page,'(/[^/]+)')

根据我之前的问题 ,这非常有效,但是 URL 中有一个随机的额外字符串影响了数字。

例如

这意味着当我 运行 我的字段时,一些应该归因于 /directoryA/ 的视图被归因于 /randomstring 并且我的 table 报告如下:

  1. /randomstring = 1,000 次浏览
  2. 目录 A = 800 次浏览
  3. 目录 B = 850 次浏览
  4. ...

有谁知道如何清理 Google Data studio 中的数据,以便在 运行 我的 REGEXP_EXTRACT 代码之前从 URL 中删除 /randomstring?

根据原始发帖者 (Benjamin Heap) 在 中提供的额外详细信息:

The string isn't random, is the same every time

一种方法是使用 REGEXP_REPLACE function before the REGEXP_EXTRACT,因此,下面的方法可以解决问题(将 /randomstring 替换为实际字符串):

REGEXP_EXTRACT(REGEXP_REPLACE(Page, "(/randomstring)", ""), "(/[^/]+)")

Editable Google Data Studio Report 和一张 GIF 来详细说明: