Google Analytics / Data Studio - 在处理数据之前从 URL 中间删除字符串
Google Analytics / Data Studio - Remove string from the middle of a URL before processing data
我有一个包含数千个目录的网站,我试图通过使用以下字段找出哪些目录最受欢迎
REGEXP_EXTRACT(Page,'(/[^/]+)')
根据我之前的问题 ,这非常有效,但是 URL 中有一个随机的额外字符串影响了数字。
例如
- sitename.com/directoryA returns 与
相同的页面
- 站点名称。com/randomstring/directoryA
这意味着当我 运行 我的字段时,一些应该归因于 /directoryA/ 的视图被归因于 /randomstring 并且我的 table 报告如下:
- /randomstring = 1,000 次浏览
- 目录 A = 800 次浏览
- 目录 B = 850 次浏览
- ...
有谁知道如何清理 Google Data studio 中的数据,以便在 运行 我的 REGEXP_EXTRACT 代码之前从 URL 中删除 /randomstring?
根据原始发帖者 (Benjamin Heap) 在 中提供的额外详细信息:
The string isn't random, is the same every time
一种方法是使用 REGEXP_REPLACE
function before the REGEXP_EXTRACT
,因此,下面的方法可以解决问题(将 /randomstring
替换为实际字符串):
REGEXP_EXTRACT(REGEXP_REPLACE(Page, "(/randomstring)", ""), "(/[^/]+)")
Editable Google Data Studio Report 和一张 GIF 来详细说明:
我有一个包含数千个目录的网站,我试图通过使用以下字段找出哪些目录最受欢迎
REGEXP_EXTRACT(Page,'(/[^/]+)')
根据我之前的问题
例如
- sitename.com/directoryA returns 与 相同的页面
- 站点名称。com/randomstring/directoryA
这意味着当我 运行 我的字段时,一些应该归因于 /directoryA/ 的视图被归因于 /randomstring 并且我的 table 报告如下:
- /randomstring = 1,000 次浏览
- 目录 A = 800 次浏览
- 目录 B = 850 次浏览
- ...
有谁知道如何清理 Google Data studio 中的数据,以便在 运行 我的 REGEXP_EXTRACT 代码之前从 URL 中删除 /randomstring?
根据原始发帖者 (Benjamin Heap) 在
The string isn't random, is the same every time
一种方法是使用 REGEXP_REPLACE
function before the REGEXP_EXTRACT
,因此,下面的方法可以解决问题(将 /randomstring
替换为实际字符串):
REGEXP_EXTRACT(REGEXP_REPLACE(Page, "(/randomstring)", ""), "(/[^/]+)")
Editable Google Data Studio Report 和一张 GIF 来详细说明: