如何在事先不知道列数的情况下加载 csv 文件
How to load a csv file without knowing the number of columns beforehand
这是我尝试做的事情:
我想用条形图可视化患有某些疾病的人的所有排列。
例如。我有一个频率计数的人患有某些疾病的所有组合。比方说,如果有 3 种疾病,我有 7 组人的数量。对于4种疾病,有15种可能的人群,对于n种疾病,有2^n-1种组合。
适合此数据的 csv 文件结构是:
frequency,disease1,disease2,disease3,disease4
40,1,0,0,0
36,1,0,1,0
25,0,1,0,0
37,0,0,0,1
20,0,0,1,1
5,1,1,1,1
第 2 行表示 40 人只患有疾病 1 而没有其他疾病。第 3 行表示 36 人患有疾病 1 和疾病 3。
好吧,在查看了如何从 csv 文件读取的示例之后,我没有找到此文件结构的答案(我事先不知道其中包含多少列)。
我的这个例子的初始条形图应该显示 4 个条形图,每个条形图代表一种疾病 - 高度是发生这种疾病的所有计数(值为 1)。
然后在选择一个柱后,我计划更新这个子集的剩余柱(尚未实现 - 但数据结构应该有效地支持它)。
有人可以提示我如何加载初始数据结构(从未知数量的属性)吗?
我在第 89 行发现的地方添加了我当前的版本
.attr("x", function(d) { return x("disease1"); })
我无法动态访问列名。我目前的想法是最好为值创建一个数组数组,为属性名称创建一个单独的数组。但我还没有弄清楚,因为从属性填充数组与 'for ...in' 循环迭代的任意顺序发生冲突。
每个值由
表示的替代方案
{key: 'column name 1'; value: value}
由于冗余的数量,似乎令人望而却步。
我当前的版本:
<!DOCTYPE html>
<meta charset="utf-8">
<style>
.bar {
fill: steelblue;
}
.bar:hover {
fill: brown;
}
.axis {
font: 10px sans-serif;
}
.axis path,
.axis line {
fill: none;
stroke: #000;
shape-rendering: crispEdges;
}
.x.axis path {
display: none;
}
</style>
<body>
<script src="http://d3js.org/d3.v3.min.js"></script>
<script>
var margin = {top: 20, right: 20, bottom: 30, left: 40},
width = 960 - margin.left - margin.right,
height = 500 - margin.top - margin.bottom;
var permutations;
var x = d3.scale.ordinal()
.rangeRoundBands([0, width], .1);
var y = d3.scale.linear()
.range([height, 0]);
var xAxis = d3.svg.axis()
.scale(x)
.orient("bottom");
var yAxis = d3.svg.axis()
.scale(y)
.orient("left")
// .ticks(10, "%");
var svg = d3.select("body").append("svg")
.attr("width", width + margin.left + margin.right)
.attr("height", height + margin.top + margin.bottom)
.append("g")
.attr("transform", "translate(" + margin.left + "," + margin.top + ")");
d3.csv("diseases.csv", type, function(error, data) {
permutations = data;
var products = d3.keys(permutations[0]).filter(function(key) {
return key != "frequency";});
// debugger;
x.domain(products);
y.domain([0, d3.max(data, function(d) { return d.frequency; })]);
svg.append("g")
.attr("class", "x axis")
.attr("transform", "translate(0," + height + ")")
.call(xAxis);
svg.append("g")
.attr("class", "y axis")
.call(yAxis)
.append("text")
.attr("transform", "rotate(-90)")
.attr("y", 6)
.attr("dy", ".71em")
.style("text-anchor", "end")
.text("Frequency");
svg.selectAll(".bar")
.data(data)
.enter().append("rect")
.attr("class", "bar")
.attr("x", function(d) { return x("disease1"); })
.attr("width", x.rangeBand())
.attr("y", function(d) { return y(d.frequency); })
.attr("height", function(d) { return height - y(d.frequency); });
});
function type(d) {
for (var perm in d) {
if (Object.prototype.hasOwnProperty.call(d, perm)) {
console.log("before: " + d[perm]);
d[perm] = +d[perm];
console.log("after: "+ d[perm]);
}
}
// d.frequency = +d.frequency;
return d;
}
</script>
我的理解是,您想对每种疾病的频率(第一列)求和,并使用这些频率创建条形图。您可以更改处理从 CSV 文件加载的数据的方式:
d3.csv("diseases.csv", type, function(error, permutations) {
var diseases = d3.keys(permutations[0]).filter(function(key) { return key != "frequency";}),
data = diseases.map(function(d){ return {disease: d, frequency: 0}});
permutations.forEach(function(row){
diseases.forEach(function(d, i){
if (row[d] === 1){
data[i].frequency += row["frequency"];
}
})
})
将您的 data
存储在如下所示的数组中:
[{"disease":"disease1","frequency":81},{"disease":"disease2","frequency":30},
{"disease":"disease3","frequency":61},{"disease":"disease4","frequency":62}]
然后只需修改 x
域:
x.domain(diseases);
和 x
属性,当你绘制你的 <rect>
s 以使用特定疾病时:
.attr("x", function(d) { return x(d.disease); })
进行这些更改后得到以下条形图:
这是我尝试做的事情: 我想用条形图可视化患有某些疾病的人的所有排列。 例如。我有一个频率计数的人患有某些疾病的所有组合。比方说,如果有 3 种疾病,我有 7 组人的数量。对于4种疾病,有15种可能的人群,对于n种疾病,有2^n-1种组合。
适合此数据的 csv 文件结构是:
frequency,disease1,disease2,disease3,disease4
40,1,0,0,0
36,1,0,1,0
25,0,1,0,0
37,0,0,0,1
20,0,0,1,1
5,1,1,1,1
第 2 行表示 40 人只患有疾病 1 而没有其他疾病。第 3 行表示 36 人患有疾病 1 和疾病 3。
好吧,在查看了如何从 csv 文件读取的示例之后,我没有找到此文件结构的答案(我事先不知道其中包含多少列)。
我的这个例子的初始条形图应该显示 4 个条形图,每个条形图代表一种疾病 - 高度是发生这种疾病的所有计数(值为 1)。 然后在选择一个柱后,我计划更新这个子集的剩余柱(尚未实现 - 但数据结构应该有效地支持它)。
有人可以提示我如何加载初始数据结构(从未知数量的属性)吗?
我在第 89 行发现的地方添加了我当前的版本
.attr("x", function(d) { return x("disease1"); })
我无法动态访问列名。我目前的想法是最好为值创建一个数组数组,为属性名称创建一个单独的数组。但我还没有弄清楚,因为从属性填充数组与 'for ...in' 循环迭代的任意顺序发生冲突。 每个值由
表示的替代方案{key: 'column name 1'; value: value}
由于冗余的数量,似乎令人望而却步。
我当前的版本:
<!DOCTYPE html>
<meta charset="utf-8">
<style>
.bar {
fill: steelblue;
}
.bar:hover {
fill: brown;
}
.axis {
font: 10px sans-serif;
}
.axis path,
.axis line {
fill: none;
stroke: #000;
shape-rendering: crispEdges;
}
.x.axis path {
display: none;
}
</style>
<body>
<script src="http://d3js.org/d3.v3.min.js"></script>
<script>
var margin = {top: 20, right: 20, bottom: 30, left: 40},
width = 960 - margin.left - margin.right,
height = 500 - margin.top - margin.bottom;
var permutations;
var x = d3.scale.ordinal()
.rangeRoundBands([0, width], .1);
var y = d3.scale.linear()
.range([height, 0]);
var xAxis = d3.svg.axis()
.scale(x)
.orient("bottom");
var yAxis = d3.svg.axis()
.scale(y)
.orient("left")
// .ticks(10, "%");
var svg = d3.select("body").append("svg")
.attr("width", width + margin.left + margin.right)
.attr("height", height + margin.top + margin.bottom)
.append("g")
.attr("transform", "translate(" + margin.left + "," + margin.top + ")");
d3.csv("diseases.csv", type, function(error, data) {
permutations = data;
var products = d3.keys(permutations[0]).filter(function(key) {
return key != "frequency";});
// debugger;
x.domain(products);
y.domain([0, d3.max(data, function(d) { return d.frequency; })]);
svg.append("g")
.attr("class", "x axis")
.attr("transform", "translate(0," + height + ")")
.call(xAxis);
svg.append("g")
.attr("class", "y axis")
.call(yAxis)
.append("text")
.attr("transform", "rotate(-90)")
.attr("y", 6)
.attr("dy", ".71em")
.style("text-anchor", "end")
.text("Frequency");
svg.selectAll(".bar")
.data(data)
.enter().append("rect")
.attr("class", "bar")
.attr("x", function(d) { return x("disease1"); })
.attr("width", x.rangeBand())
.attr("y", function(d) { return y(d.frequency); })
.attr("height", function(d) { return height - y(d.frequency); });
});
function type(d) {
for (var perm in d) {
if (Object.prototype.hasOwnProperty.call(d, perm)) {
console.log("before: " + d[perm]);
d[perm] = +d[perm];
console.log("after: "+ d[perm]);
}
}
// d.frequency = +d.frequency;
return d;
}
</script>
我的理解是,您想对每种疾病的频率(第一列)求和,并使用这些频率创建条形图。您可以更改处理从 CSV 文件加载的数据的方式:
d3.csv("diseases.csv", type, function(error, permutations) {
var diseases = d3.keys(permutations[0]).filter(function(key) { return key != "frequency";}),
data = diseases.map(function(d){ return {disease: d, frequency: 0}});
permutations.forEach(function(row){
diseases.forEach(function(d, i){
if (row[d] === 1){
data[i].frequency += row["frequency"];
}
})
})
将您的 data
存储在如下所示的数组中:
[{"disease":"disease1","frequency":81},{"disease":"disease2","frequency":30},
{"disease":"disease3","frequency":61},{"disease":"disease4","frequency":62}]
然后只需修改 x
域:
x.domain(diseases);
和 x
属性,当你绘制你的 <rect>
s 以使用特定疾病时:
.attr("x", function(d) { return x(d.disease); })
进行这些更改后得到以下条形图: