来自 firebase 和 BigQuery 的保留结果不匹配

Mismatch of retention results from firebase and BigQuery

我用下面的代码计算了 BigQuery 的留存率。代码取自 here。但是这段代码给我的留存率与已经在 firebase 中计算的留存率不同。 BigQuery 中计算的用户数总是较小。

这两种方法有什么区别?有没有办法在 BigQuery 中获得与在 Firebase 中相同的结果?

#standardSQL
####################################################################
# PART 1: Cohort of New Users starting on SEPT 1
####################################################################
WITH 
new_user_cohort AS (  
  SELECT DISTINCT user_pseudo_id as new_user_id
  FROM 
    `projectId.analytics_YOUR_TABLE.events_*`
  WHERE
   event_name = 'first_open' AND
   #geo.country = 'France' AND
   FORMAT_TIMESTAMP("%Y%m%d", TIMESTAMP_TRUNC(TIMESTAMP_MICROS(event_timestamp), DAY, "Etc/GMT+8")) = '20180901' AND
  _TABLE_SUFFIX BETWEEN '20180830' AND '20180902'),
num_new_users AS (
  SELECT count(*) as num_users_in_cohort  FROM new_user_cohort
),

####################################################################
# PART 2: Engaged users from Sept 1 cohort
####################################################################
engaged_user_by_day AS (  
  SELECT 
    FORMAT_TIMESTAMP('%Y%m%d', TIMESTAMP_TRUNC(TIMESTAMP_MICROS(event_timestamp), DAY, "Etc/GMT+8")) as event_day, COUNT (DISTINCT user_pseudo_id) as num_engaged_users
  FROM 
    `projectId.analytics_YOUR_TABLE.events_*` INNER JOIN new_user_cohort on new_user_id = user_pseudo_id 
  WHERE
    event_name = 'user_engagement' AND
    _TABLE_SUFFIX BETWEEN '20180830' AND '20180907'
  GROUP BY (event_day)
)

####################################################################
# PART 3: Daily Retention = [Engaged Users / Total Users]
####################################################################
SELECT event_day, num_engaged_users, num_users_in_cohort, ROUND((num_engaged_users / num_users_in_cohort), 3) as retention_rate
  FROM engaged_user_by_day CROSS JOIN num_new_users
ORDER BY (event_day)

我发现分析正在使用 sampling 并且在我的内部分析报告中它只使用了 0.2% 的数据。

在 firebase 中,我注意到他们删除了保留选项卡(至少在我的情况下)。但我认为也使用了采样。