如何计算和创建索引来表示其他列的值?
How to calculate and create an index to represent the values of other columns?
拜托,谁能帮我实现下面概述的计算。
我在 RStudio 中使用 R。
df <- data.frame(x = c(1,2,3,4,5,6,7,8,9,0,11,12,13,14,15,16,17,18,19,20),
total_fatal_injuries = c(1,0,5,4,0,27,10,15,6,2,10,4,0,0,1,0,3,0,1,0),
total_serious_injuries = c(10,0,9,3,2,4,9,9,0,8,3,1,0,8,2,7,5,4,0,2),
total_minor_injuries = c(10,0,9,3,2,4,9,9,0,8,3,1,0,8,2,7,5,4,0,3),
total_uninjuried = c(1,0,1,0,0,10,2,5,0,4,0,0,31,0,2,3,0,1,0,0),
injured_index = c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0))
在上面的数据集中,每条线代表对车辆事故发生的观察。
第 'x' 列只是一个 ID。
同一事件可能会有不同程度的伤害:致命伤、重伤、轻伤和未受伤。每列值的总和等于事件中涉及的个体数量。
目标是根据其他列中记录的值,用表示事件严重性的值填充 'injured_index' 列。
表示事件严重程度的数字索引,可以根据该索引对数据集进行排序。
计算 'injured_index' 列的最佳公式是什么?
我希望有人能就如何计算代表事件严重程度的指标值提出建议。基于每次发生的每个级别的受害者总数。
重要性简单易懂
1) 致命的不好
2) 严肃一点不那么糟糕
3)未成年人不好
4) 未受伤是最理想的。
如何以数学方式将所有内容放在一起并获得一个指数来表示哪个事件比另一个更严重或更不严重?
我知道如何创建列并赋值。
我只是想知道如何计算将要存储的值。
我知道这和数学有更多关系,但是Mathematics Stack Exchange里的数学家拒绝回答,因为他们认为这不是数学而是编程。 :/
感谢大家的努力!
这是一个方法。
# This counts how many people in each row, for columns 2 through 5
df$count <- rowSums(df[,2:5])
# This assigns a weighting to each severity of injury and divides by how
# many people in that row. Adjust the weights based on your judgment.
df$injured_index = (1000 * df$total_fatal_injuries + 200 *
df$total_serious_injuries + 20 * df$total_minor_injuries) / df$count
拜托,谁能帮我实现下面概述的计算。
我在 RStudio 中使用 R。
df <- data.frame(x = c(1,2,3,4,5,6,7,8,9,0,11,12,13,14,15,16,17,18,19,20),
total_fatal_injuries = c(1,0,5,4,0,27,10,15,6,2,10,4,0,0,1,0,3,0,1,0),
total_serious_injuries = c(10,0,9,3,2,4,9,9,0,8,3,1,0,8,2,7,5,4,0,2),
total_minor_injuries = c(10,0,9,3,2,4,9,9,0,8,3,1,0,8,2,7,5,4,0,3),
total_uninjuried = c(1,0,1,0,0,10,2,5,0,4,0,0,31,0,2,3,0,1,0,0),
injured_index = c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0))
在上面的数据集中,每条线代表对车辆事故发生的观察。
第 'x' 列只是一个 ID。
同一事件可能会有不同程度的伤害:致命伤、重伤、轻伤和未受伤。每列值的总和等于事件中涉及的个体数量。
目标是根据其他列中记录的值,用表示事件严重性的值填充 'injured_index' 列。
表示事件严重程度的数字索引,可以根据该索引对数据集进行排序。
计算 'injured_index' 列的最佳公式是什么?
我希望有人能就如何计算代表事件严重程度的指标值提出建议。基于每次发生的每个级别的受害者总数。
重要性简单易懂
1) 致命的不好
2) 严肃一点不那么糟糕
3)未成年人不好
4) 未受伤是最理想的。
如何以数学方式将所有内容放在一起并获得一个指数来表示哪个事件比另一个更严重或更不严重?
我知道如何创建列并赋值。 我只是想知道如何计算将要存储的值。
我知道这和数学有更多关系,但是Mathematics Stack Exchange里的数学家拒绝回答,因为他们认为这不是数学而是编程。 :/
感谢大家的努力!
这是一个方法。
# This counts how many people in each row, for columns 2 through 5
df$count <- rowSums(df[,2:5])
# This assigns a weighting to each severity of injury and divides by how
# many people in that row. Adjust the weights based on your judgment.
df$injured_index = (1000 * df$total_fatal_injuries + 200 *
df$total_serious_injuries + 20 * df$total_minor_injuries) / df$count