一个txt的统计（出现频率%ecc..）分析

Question

我不知道我应该用什么方法来找出答案：

例如我的文件是：

  xxxxx, yyyy , 79
  xxxxx, yyyy , 80
  xxxxx, yyyy , 79
  xxxxx, yyyy , 81
  xxxxx, yyyy , 80

我想知道 79 有 40% 的出现率，而 80 和 81 有 20%。我怎样才能做到这一点？（如果可能，没有 R...）

我需要这些，因为我想使用 gnuplot 绘制直方图。你能告诉我如何使用刚刚计算的值来绘制一个直方图吗？

Answer 1

sort 和 uniq 的某种组合可能会起作用。你可以从

开始

cat file  | cut -d ',' -f 3 | sort | uniq --count > file.1

要在 gnuplot 中绘图，请执行

gnuplot
plot [78:82][0:3] "file.1" using 2:1 with boxes

左大括号[78:82]设置xrange，另一个设置yrange。这可以自动确定，但在此演示案例中，简短查看文件以确定 min/max 值效果很好。

根据您的 OS 和配置，这可能就足够了。您可能还需要使用 set terminal 和 set output。（启动gnuplot并说帮助，程序内有帮助）

Statistic (frequency of occurrence % ecc..) analysis of a txt