Excel consolidate 产生不正确的唯一值列表
Excel consolidate yields incorrect list of unique values
我有两列如下所示:
Make/Model Parc
Abarth*500 15
Abarth*500 19
Abarth*500 2
Abarth*500 14
Abarth*500 15
Abarth*500 25
Abarth*500 20
Abarth*500 17
Abarth*500C 12
Abarth*500C 16
Abarth*500C 23
Abarth*500C 18
Abarth*500C 1
Alfa Romeo*145 405
Alfa Romeo*145 431
Alfa Romeo*146 36
Alfa Romeo*146 80
Alfa Romeo*146 121
Alfa Romeo*146 72
Alfa Romeo*146 39
等...
"Parc" 列中的值总和为 10,475,387。
我对此 table 执行合并以删除 "Make/Model" 中的重复项,并对每个 "Make/Model."
的 "Parc" 列中的值求和
执行合并后,一切看起来都如预期:
Make/Model Parc
Abarth*500 127
Abarth*500C 70
Alfa Romeo*145 836
Alfa Romeo*146 348
Alfa Romeo*147 3848
Alfa Romeo*155 29
Alfa Romeo*156 3148
Alfa Romeo*159 573
Alfa Romeo*164 111
等...
所以问题是什么? "Parc" 列的新总和为 10,554,076!针对替代方法的验证表明唯一标签列在看似随机的地方不正确。我也不明白总金额是怎么增加的。我在这个数据集中有超过 18,000 行,因此单独检查所有数据将非常耗时。
您可以在此处找到完整的数据集:
Excel File
我尝试了什么?
我试过删除所有格式。此外,这些数字都是整数,并且未选中 "Automatically insert a decimal point" 选项。我还尝试创建一个新的 =INT() 值列以确保它们都是整数。我的结果在所有情况下都完全相同。
我昨天发布了这个问题,但由于没有完整数据集无法重现而被搁置:
编辑:
如 Mauricio Noris Freire 所示,您可以使用高级过滤器创建一个唯一的项目列,然后使用 SUMIF 正确解决此问题。我仍然想知道为什么 Excel 数据工具整合没有按预期工作。
我不认为这个值是错误的。查看我使用 sumif 公式重写 parc 列的文件
https://drive.google.com/open?id=0B4_RkQvn7-_TeG9kSE5NV0Z6Umc
您的观察是正确的。 Consolidate
和 SUMIFS
都受到数据中星号的影响。如果您删除星号,或者像我一样,将它们替换为竖线 |
字符,您的总数将匹配。
您也可以使用数据透视表获得正确的报告Table
例如检查 Mercedes*190 的输出
在原始数据中,如果我们过滤该值,我们会显示这些行:
在合并报告中,我们看到 Mercedes*190 的总数将包括该车以及 Mercedes*A190。换句话说,由于通配符问题,A190 被计算了两次。
我怀疑这是某种设计缺陷。
我有两列如下所示:
Make/Model Parc
Abarth*500 15
Abarth*500 19
Abarth*500 2
Abarth*500 14
Abarth*500 15
Abarth*500 25
Abarth*500 20
Abarth*500 17
Abarth*500C 12
Abarth*500C 16
Abarth*500C 23
Abarth*500C 18
Abarth*500C 1
Alfa Romeo*145 405
Alfa Romeo*145 431
Alfa Romeo*146 36
Alfa Romeo*146 80
Alfa Romeo*146 121
Alfa Romeo*146 72
Alfa Romeo*146 39
等...
"Parc" 列中的值总和为 10,475,387。
我对此 table 执行合并以删除 "Make/Model" 中的重复项,并对每个 "Make/Model."
的 "Parc" 列中的值求和执行合并后,一切看起来都如预期:
Make/Model Parc
Abarth*500 127
Abarth*500C 70
Alfa Romeo*145 836
Alfa Romeo*146 348
Alfa Romeo*147 3848
Alfa Romeo*155 29
Alfa Romeo*156 3148
Alfa Romeo*159 573
Alfa Romeo*164 111
等...
所以问题是什么? "Parc" 列的新总和为 10,554,076!针对替代方法的验证表明唯一标签列在看似随机的地方不正确。我也不明白总金额是怎么增加的。我在这个数据集中有超过 18,000 行,因此单独检查所有数据将非常耗时。
您可以在此处找到完整的数据集: Excel File
我尝试了什么?
我试过删除所有格式。此外,这些数字都是整数,并且未选中 "Automatically insert a decimal point" 选项。我还尝试创建一个新的 =INT() 值列以确保它们都是整数。我的结果在所有情况下都完全相同。
我昨天发布了这个问题,但由于没有完整数据集无法重现而被搁置:
编辑: 如 Mauricio Noris Freire 所示,您可以使用高级过滤器创建一个唯一的项目列,然后使用 SUMIF 正确解决此问题。我仍然想知道为什么 Excel 数据工具整合没有按预期工作。
我不认为这个值是错误的。查看我使用 sumif 公式重写 parc 列的文件 https://drive.google.com/open?id=0B4_RkQvn7-_TeG9kSE5NV0Z6Umc
您的观察是正确的。 Consolidate
和 SUMIFS
都受到数据中星号的影响。如果您删除星号,或者像我一样,将它们替换为竖线 |
字符,您的总数将匹配。
您也可以使用数据透视表获得正确的报告Table
例如检查 Mercedes*190 的输出
在原始数据中,如果我们过滤该值,我们会显示这些行:
在合并报告中,我们看到 Mercedes*190 的总数将包括该车以及 Mercedes*A190。换句话说,由于通配符问题,A190 被计算了两次。
我怀疑这是某种设计缺陷。