uniq 不会清除重复条目

uniq does not clean out duplicate entries

我有一个文件,每行都有一个数字。我试图找出一组不同的数字。以下是摘录:

 550
 400
 4000
 400
 1900
 550
 5000
 400
 1500
 1900
 5000
 4000
 5000
 1900
 5000

但是,通过 uniq 传递它并不会清除所有重复项。行数由699减少为256,但仍有多行400550

我用 python 脚本生成了这个文件,所以我知道每一行都有一个空格,后面跟着一个数字,然后是 \n。至少那是我在代码中打印的内容。

我不明白文件有什么问题。为什么 uniq 没有像我想的那样工作?

(OS X Yosemite, python 2.7)

您需要在调用 uniq 之前 sort 您的内容,或者您​​可以只使用 sort -u.

来自 uniq 手册页:

uniq - report or omit repeated lines

注意它是怎么说的 repeated 而不是 duplicate.