uniq 不会清除重复条目
uniq does not clean out duplicate entries
我有一个文件,每行都有一个数字。我试图找出一组不同的数字。以下是摘录:
550
400
4000
400
1900
550
5000
400
1500
1900
5000
4000
5000
1900
5000
但是,通过 uniq
传递它并不会清除所有重复项。行数由699
减少为256
,但仍有多行400
或550
等
我用 python 脚本生成了这个文件,所以我知道每一行都有一个空格,后面跟着一个数字,然后是 \n
。至少那是我在代码中打印的内容。
我不明白文件有什么问题。为什么 uniq
没有像我想的那样工作?
(OS X Yosemite, python 2.7
)
您需要在调用 uniq
之前 sort
您的内容,或者您可以只使用 sort -u
.
来自 uniq
手册页:
uniq - report or omit repeated lines
注意它是怎么说的 repeated 而不是 duplicate.
我有一个文件,每行都有一个数字。我试图找出一组不同的数字。以下是摘录:
550
400
4000
400
1900
550
5000
400
1500
1900
5000
4000
5000
1900
5000
但是,通过 uniq
传递它并不会清除所有重复项。行数由699
减少为256
,但仍有多行400
或550
等
我用 python 脚本生成了这个文件,所以我知道每一行都有一个空格,后面跟着一个数字,然后是 \n
。至少那是我在代码中打印的内容。
我不明白文件有什么问题。为什么 uniq
没有像我想的那样工作?
(OS X Yosemite, python 2.7
)
您需要在调用 uniq
之前 sort
您的内容,或者您可以只使用 sort -u
.
来自 uniq
手册页:
uniq - report or omit repeated lines
注意它是怎么说的 repeated 而不是 duplicate.