一个txt的统计(出现频率%ecc..)分析
Statistic (frequency of occurrence % ecc..) analysis of a txt
我不知道我应该用什么方法来找出答案:
- 出现频率
- 文件中出现的值
例如我的文件是:
xxxxx, yyyy , 79
xxxxx, yyyy , 80
xxxxx, yyyy , 79
xxxxx, yyyy , 81
xxxxx, yyyy , 80
我想知道 79 有 40% 的出现率,而 80 和 81 有 20%。
我怎样才能做到这一点? (如果可能,没有 R...)
我需要这些,因为我想使用 gnuplot 绘制直方图。你能告诉我如何使用刚刚计算的值来绘制一个直方图吗?
sort 和 uniq 的某种组合可能会起作用。你可以从
开始
cat file | cut -d ',' -f 3 | sort | uniq --count > file.1
要在 gnuplot 中绘图,请执行
gnuplot
plot [78:82][0:3] "file.1" using 2:1 with boxes
左大括号[78:82]
设置xrange,另一个设置yrange。这可以自动确定,但在此演示案例中,简短查看文件以确定 min/max 值效果很好。
根据您的 OS 和配置,这可能就足够了。您可能还需要使用 set terminal
和 set output
。 (启动gnuplot并说帮助,程序内有帮助)
我不知道我应该用什么方法来找出答案:
- 出现频率
- 文件中出现的值
例如我的文件是:
xxxxx, yyyy , 79
xxxxx, yyyy , 80
xxxxx, yyyy , 79
xxxxx, yyyy , 81
xxxxx, yyyy , 80
我想知道 79 有 40% 的出现率,而 80 和 81 有 20%。 我怎样才能做到这一点? (如果可能,没有 R...)
我需要这些,因为我想使用 gnuplot 绘制直方图。你能告诉我如何使用刚刚计算的值来绘制一个直方图吗?
sort 和 uniq 的某种组合可能会起作用。你可以从
开始cat file | cut -d ',' -f 3 | sort | uniq --count > file.1
要在 gnuplot 中绘图,请执行
gnuplot
plot [78:82][0:3] "file.1" using 2:1 with boxes
左大括号[78:82]
设置xrange,另一个设置yrange。这可以自动确定,但在此演示案例中,简短查看文件以确定 min/max 值效果很好。
根据您的 OS 和配置,这可能就足够了。您可能还需要使用 set terminal
和 set output
。 (启动gnuplot并说帮助,程序内有帮助)