如何在事先不知道列数的情况下加载 csv 文件

How to load a csv file without knowing the number of columns beforehand

这是我尝试做的事情: 我想用条形图可视化患有某些疾病的人的所有排列。 例如。我有一个频率计数的人患有某些疾病的所有组合。比方说,如果有 3 种疾病,我有 7 组人的数量。对于4种疾病,有15种可能的人群,对于n种疾病,有2^n-1种组合。

适合此数据的 csv 文件结构是:

frequency,disease1,disease2,disease3,disease4
40,1,0,0,0
36,1,0,1,0
25,0,1,0,0
37,0,0,0,1
20,0,0,1,1
5,1,1,1,1

第 2 行表示 40 人只患有疾病 1 而没有其他疾病。第 3 行表示 36 人患有疾病 1 和疾病 3。

好吧,在查看了如何从 csv 文件读取的示例之后,我没有找到此文件结构的答案(我事先不知道其中包含多少列)。

我的这个例子的初始条形图应该显示 4 个条形图,每个条形图代表一种疾病 - 高度是发生这种疾病的所有计数(值为 1)。 然后在选择一个柱后,我计划更新这个子集的剩余柱(尚未实现 - 但数据结构应该有效地支持它)。

有人可以提示我如何加载初始数据结构(从未知数量的属性)吗?

我在第 89 行发现的地方添加了我当前的版本

.attr("x", function(d) { return x("disease1"); })

我无法动态访问列名。我目前的想法是最好为值创建一个数组数组,为属性名称创建一个单独的数组。但我还没有弄清楚,因为从属性填充数组与 'for ...in' 循环迭代的任意顺序发生冲突。 每个值由

表示的替代方案
{key: 'column name 1'; value: value}

由于冗余的数量,似乎令人望而却步。

我当前的版本:

<!DOCTYPE html>
<meta charset="utf-8">
<style>

.bar {
  fill: steelblue;
}

.bar:hover {
  fill: brown;
}

.axis {
  font: 10px sans-serif;
}

.axis path,
.axis line {
  fill: none;
  stroke: #000;
  shape-rendering: crispEdges;
}

.x.axis path {
  display: none;
}

</style>
<body>
<script src="http://d3js.org/d3.v3.min.js"></script>
<script>

var margin = {top: 20, right: 20, bottom: 30, left: 40},
    width = 960 - margin.left - margin.right,
    height = 500 - margin.top - margin.bottom;

var permutations;

var x = d3.scale.ordinal()
    .rangeRoundBands([0, width], .1);

var y = d3.scale.linear()
    .range([height, 0]);

var xAxis = d3.svg.axis()
    .scale(x)
    .orient("bottom");

var yAxis = d3.svg.axis()
    .scale(y)
    .orient("left")
    // .ticks(10, "%");

var svg = d3.select("body").append("svg")
    .attr("width", width + margin.left + margin.right)
    .attr("height", height + margin.top + margin.bottom)
  .append("g")
    .attr("transform", "translate(" + margin.left + "," + margin.top + ")");

d3.csv("diseases.csv", type, function(error, data) {
      permutations = data;
      var products = d3.keys(permutations[0]).filter(function(key) {
        return key != "frequency";});

  // debugger;
  x.domain(products);
  y.domain([0, d3.max(data, function(d) { return d.frequency; })]);


  svg.append("g")
      .attr("class", "x axis")
      .attr("transform", "translate(0," + height + ")")
      .call(xAxis);

  svg.append("g")
      .attr("class", "y axis")
      .call(yAxis)
    .append("text")
      .attr("transform", "rotate(-90)")
      .attr("y", 6)
      .attr("dy", ".71em")
      .style("text-anchor", "end")
      .text("Frequency");

  svg.selectAll(".bar")
      .data(data)
    .enter().append("rect")
      .attr("class", "bar")
      .attr("x", function(d) { return x("disease1"); })
      .attr("width", x.rangeBand())
      .attr("y", function(d) { return y(d.frequency); })
      .attr("height", function(d) { return height - y(d.frequency); });

});

function type(d) {
    for (var perm in d) {
        if (Object.prototype.hasOwnProperty.call(d, perm)) {
            console.log("before: " + d[perm]);
            d[perm] = +d[perm];
            console.log("after: "+ d[perm]);
        }
    }    
    // d.frequency = +d.frequency;
  return d;
}

</script>

我的理解是,您想对每种疾病的频率(第一列)求和,并使用这些频率创建条形图。您可以更改处理从 CSV 文件加载的数据的方式:

d3.csv("diseases.csv", type, function(error, permutations) {
    var diseases = d3.keys(permutations[0]).filter(function(key) { return key != "frequency";}),
        data = diseases.map(function(d){ return {disease: d, frequency: 0}});
    permutations.forEach(function(row){
        diseases.forEach(function(d, i){
            if (row[d] === 1){
                data[i].frequency += row["frequency"];
            }
        })
    })

将您的 data 存储在如下所示的数组中:

[{"disease":"disease1","frequency":81},{"disease":"disease2","frequency":30},
 {"disease":"disease3","frequency":61},{"disease":"disease4","frequency":62}]

然后只需修改 x 域:

x.domain(diseases);

x 属性,当你绘制你的 <rect>s 以使用特定疾病时:

    .attr("x", function(d) { return x(d.disease); })

进行这些更改后得到以下条形图: