属于多个类别的记录

records that belong to multiple categories

我有一份人员名单和他们说的语言:

name; language
John; english,italian
Jane; french, spanish, english
...

我想列出它们 (table) 并有一个语言条形图...但我被卡住了

为了能够绘制语言,我会预处理数据以将格式更改为

name; language
John; english
John; italian
Jane; french
Jane; spanish
Jane; english

并使用该语言作为条形图的维度...但是,我在 table 中有重复项,我应该只让 John 和 Janes 出现一次。

我该如何处理?

这是一个相当简短的答案,但使用 1.4 版中新的数组维度功能:https://github.com/crossfilter/crossfilter/wiki/API-Reference#dimension_with_arrays 这使您可以对多个组中的每条记录进行计数,而无需重新处理数据并执行任何奇怪的操作聚合以处理重复项。

(这是在 https://github.com/crossfilter/crossfilter/ 的社区分支中)