更新误报查询
Updating a query for false positives
我在一家非常小的初创公司担任合规职务,每天查看大量信息,例如银行 transfers/direct deposits/ACHs。从 BigQuery 中提取了一份报告,该报告被导出到 Google 个表格。
我的问题是有很多误报(基本上是经常重复的“发布数据”)。我正在努力消除它。
一个想法,就是更新关键字查询:
WHERE postingdata LIKE 'PersonName%'
但是又累又费时。而且我觉得有更好的方法,也许 'filtering' 结果然后将其反馈给查询。任何想法或提示或只是一般的想法?
在 GS 中,您可以尝试 UNIQUE
或 QUERY
group by
聚合或 SORTN
模式 2
作为第三个参数
在这种情况下,您可以在查询中使用 group by。这就是您可以使用此子句的方式。
你可以看到这段代码。
SELECT account,TypeTransaction,amount,currency
FROM `tblBankTransaction`
代码returns这条数据,有些行是重复的;例如,第 1 行和第 7 行的帐户 894526972455
,这是一笔存款。
在这种情况下,我将使用 group by 子句。
SELECT account,TypeTransaction,amount,currency
FROM `tblBankTransaction`
group by account,TypeTransaction,amount,currency
它returns这个数据:
您可以在这个例子中看到存款的账户894526972455
只有returns 1行。同一个账号returns第二排,不过是转账;这是一种不同类型的交易。这取决于您拥有的信息以及您要分组的列。
我在一家非常小的初创公司担任合规职务,每天查看大量信息,例如银行 transfers/direct deposits/ACHs。从 BigQuery 中提取了一份报告,该报告被导出到 Google 个表格。
我的问题是有很多误报(基本上是经常重复的“发布数据”)。我正在努力消除它。
一个想法,就是更新关键字查询:
WHERE postingdata LIKE 'PersonName%'
但是又累又费时。而且我觉得有更好的方法,也许 'filtering' 结果然后将其反馈给查询。任何想法或提示或只是一般的想法?
在 GS 中,您可以尝试 UNIQUE
或 QUERY
group by
聚合或 SORTN
模式 2
作为第三个参数
在这种情况下,您可以在查询中使用 group by。这就是您可以使用此子句的方式。 你可以看到这段代码。
SELECT account,TypeTransaction,amount,currency
FROM `tblBankTransaction`
代码returns这条数据,有些行是重复的;例如,第 1 行和第 7 行的帐户 894526972455
,这是一笔存款。
在这种情况下,我将使用 group by 子句。
SELECT account,TypeTransaction,amount,currency
FROM `tblBankTransaction`
group by account,TypeTransaction,amount,currency
它returns这个数据:
您可以在这个例子中看到存款的账户894526972455
只有returns 1行。同一个账号returns第二排,不过是转账;这是一种不同类型的交易。这取决于您拥有的信息以及您要分组的列。