更新误报查询

Question

我在一家非常小的初创公司担任合规职务，每天查看大量信息，例如银行 transfers/direct deposits/ACHs。从 BigQuery 中提取了一份报告，该报告被导出到 Google 个表格。

我的问题是有很多误报（基本上是经常重复的“发布数据”）。我正在努力消除它。

一个想法，就是更新关键字查询：

WHERE postingdata LIKE 'PersonName%'

但是又累又费时。而且我觉得有更好的方法，也许 'filtering' 结果然后将其反馈给查询。任何想法或提示或只是一般的想法？

Answer 1

在 GS 中，您可以尝试 UNIQUE 或 QUERY group by 聚合或 SORTN 模式 2 作为第三个参数

Answer 2

在这种情况下，您可以在查询中使用 group by。这就是您可以使用此子句的方式。你可以看到这段代码。

SELECT account,TypeTransaction,amount,currency
FROM `tblBankTransaction`

代码returns这条数据，有些行是重复的；例如，第 1 行和第 7 行的帐户 894526972455，这是一笔存款。

在这种情况下，我将使用 group by 子句。

SELECT account,TypeTransaction,amount,currency
FROM `tblBankTransaction`
group by account,TypeTransaction,amount,currency

它returns这个数据：

您可以在这个例子中看到存款的账户894526972455只有returns 1行。同一个账号returns第二排，不过是转账；这是一种不同类型的交易。这取决于您拥有的信息以及您要分组的列。

Updating a query for false positives