当被问及您处理的数据的粒度是多少时,您如何回答?

How do you answer a question when asked what is the granularity of the data you worked on?

有人问我上面的问题,但我只知道它的意思是它是最好的数据级别。例如,如果您实际上有姓名 table,那么可以在维度 table 中找到其详细信息,例如电子邮件、phone 号码等。我有样本数据集及其区域级别分析,请根据此数据解释数据的粒度。

数据集:

itemid 项目 删除 R名称 面积 Time_Availability>70%
6222589 花生香蕉 1000 阿达咖啡馆 gachibowli 正确
6355784 巧克力软糖 2000 桑托什酒店 阿塔普尔 错误

平台入驻餐厅区域层级分析

面积 摄入的餐厅总数 可用 items_Available >=5
Gachibowli 5 4 2
阿塔普尔 5 4 2

谢谢

事实的粒度 table 是唯一标识度量的最小属性集。

例如(我并不是说这是一个真实世界的例子),如果你有一个销售事实 table 并且每个客户每天只能进行一次销售,那么“每个客户每天" 将是该事实的粒度 table。您可能有其他维度,例如发生销售的商店或交易发生的国家/地区 - 但如果您每天仍然只能为每个客户进行一次销售,则这些不会影响粒度,而不管发生在哪个商店或国家/地区交易发生在