当被问及您处理的数据的粒度是多少时,您如何回答?
How do you answer a question when asked what is the granularity of the data you worked on?
有人问我上面的问题,但我只知道它的意思是它是最好的数据级别。例如,如果您实际上有姓名 table,那么可以在维度 table 中找到其详细信息,例如电子邮件、phone 号码等。我有样本数据集及其区域级别分析,请根据此数据解释数据的粒度。
数据集:
itemid
项目
删除
R名称
面积
Time_Availability>70%
6222589
花生香蕉
1000
阿达咖啡馆
gachibowli
正确
6355784
巧克力软糖
2000
桑托什酒店
阿塔普尔
错误
平台入驻餐厅区域层级分析
面积
摄入的餐厅总数
可用
items_Available >=5
Gachibowli
5
4
2
阿塔普尔
5
4
2
谢谢
事实的粒度 table 是唯一标识度量的最小属性集。
例如(我并不是说这是一个真实世界的例子),如果你有一个销售事实 table 并且每个客户每天只能进行一次销售,那么“每个客户每天" 将是该事实的粒度 table。您可能有其他维度,例如发生销售的商店或交易发生的国家/地区 - 但如果您每天仍然只能为每个客户进行一次销售,则这些不会影响粒度,而不管发生在哪个商店或国家/地区交易发生在
有人问我上面的问题,但我只知道它的意思是它是最好的数据级别。例如,如果您实际上有姓名 table,那么可以在维度 table 中找到其详细信息,例如电子邮件、phone 号码等。我有样本数据集及其区域级别分析,请根据此数据解释数据的粒度。
数据集:
itemid | 项目 | 删除 | R名称 | 面积 | Time_Availability>70% |
---|---|---|---|---|---|
6222589 | 花生香蕉 | 1000 | 阿达咖啡馆 | gachibowli | 正确 |
6355784 | 巧克力软糖 | 2000 | 桑托什酒店 | 阿塔普尔 | 错误 |
平台入驻餐厅区域层级分析
面积 | 摄入的餐厅总数 | 可用 | items_Available >=5 |
---|---|---|---|
Gachibowli | 5 | 4 | 2 |
阿塔普尔 | 5 | 4 | 2 |
谢谢
事实的粒度 table 是唯一标识度量的最小属性集。
例如(我并不是说这是一个真实世界的例子),如果你有一个销售事实 table 并且每个客户每天只能进行一次销售,那么“每个客户每天" 将是该事实的粒度 table。您可能有其他维度,例如发生销售的商店或交易发生的国家/地区 - 但如果您每天仍然只能为每个客户进行一次销售,则这些不会影响粒度,而不管发生在哪个商店或国家/地区交易发生在